• 제목/요약/키워드: Real-time image classification

검색결과 170건 처리시간 0.03초

공간 적응적 영상복원을 이용한 블록화 현상 제거 기법 (The Technique of Blocking Artifacts Reduction Method Based on Spatially Adaptive Image Restoration)

  • 김태근;우헌배;백준기
    • 전자공학회논문지S
    • /
    • 제35S권12호
    • /
    • pp.46-54
    • /
    • 1998
  • 본 논문에서는 고속 적응적 영상 복원 필터를 소개한다. 이 필터는 압축된 영상의 복원 과정에서 발생하는 블록화 현상을 효율적으로 제거하기 위해 블록 분류라는 방법을 사용한다. 각 블록의 에지 방향은 이산 코사인 변환(DCT) 계수를 사용하여 분류되고 각 방향에 대응하는 제한적 최소 제곱(Constrained Least Square:CLS) 필터는 블록의 본원에 사용된다. 이 복원 필터는, 일련의 코딩 과정에서 양자화 연산이 비선형이고 다대일 매핑 연산자라는 관찰에 근거한다. 다음으로, 비선형과 공간 가변적 열화 연산자를 제거하기 위해 제한적 최적화 기법을 소개한다. 그리고 본 논문에서 제안된 복원 필터는 실시간 처리를 위하여 생략형 FIR 필터의 형태로 구현된다. 이것은 HDTV, DVD 그리고 화상회의 시스템에서 복구 영상의 후처리 과정에 적합하다.

  • PDF

위치 분포 및 그래프 절단에 의한 모발 분류와 영역 분할 (Hair Classification and Region Segmentation by Location Distribution and Graph Cutting)

  • 김용길;문경일
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 2022
  • 최근 소개된 구글 MediaPipe의 모발 분할 방식은 실시간 모바일 애플리케이션을 위해 특별히 설계된 단일 카메라 입력에서 신경망 기반 모발 분할을 위한 새로운 접근 방식을 제시한다. 상대적으로 작은 신경망으로 가상 머리카락 다시 칠하기와 같은 증강 현실 효과에 매우 적합한 고품질 머리카락 분할 마스크를 생성한다. 그렇지만, 모발 스타일 또는 모발 영역에 잡음이 있는 경우에 모발 분할 정확도가 떨어지는 문제점들이 있다. 이에 본 연구에서는 지정된 라벨에서 모발 위치와 모발 색상 가능성의 추정된 사전 분포에 따라 이미지의 에너지 함수를 구성하고, 이것을 그래프 절단 알고리즘에 따라 최적화시키는 방식으로 초기 모발 영역을 얻는 방식을 도입한다. 그런 다음에, 초기 모발 영역에 클러스터링 알고리즘과 사후 처리 기법을 적용하여 최종 모발 영역을 정밀하게 분할 할 수 있도록 한다. 제안된 방식은 MediaPipe의 모발 분할 파이프라인에 적용된다.

빅데이터 기반 미세먼지 이상 탐지 머신러닝 시스템 설계 및 구현 (Design and Implementation of Machine Learning System for Fine Dust Anomaly Detection based on Big Data)

  • 이재원;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.55-58
    • /
    • 2024
  • 본 논문은 빅데이터 기반 미세먼지 이상 탐지 머신러닝 시스템 설계 및 구현을 제안한다. 제안하는 시스템은 빅데이터로 구성된 미세먼지 및 기상 정보를 통해 미세먼지 대기환경지수를 분류하는 시스템이다. 이 시스템은 머신러닝 기반의 대기환경지수 분류 카테고리별 이상치에 따른 이상치 탐지 알고리즘 설계를 통해 미세먼지를 분류한다. 카메라에서 수집된 영상의 심도 데이터는 미세먼지 농도에 따른 영상을 수집한 후 미세먼지 가시마스크를 생성합니다. 그리고 모노 심도 추정 알고리즘을 통한 학습 기반 핑거프린팅 기법으로 모노스코프 카메라에서 수집된 미세먼지의 가시거리를 추론하여 미세먼지 농도를 도출합니다. 본 방법의 실험 및 분석을 위해 미세먼지 농도 데이터와 지역별, 시간별 CCTV 영상 데이터를 매칭하여 학습 데이터를 생성한 후 모델을 생성하여 실제 환경에서 테스트한다.

분할 영역 정보를 이용한 국부 영역에서 차량 검지 및 추적 (Detecting and Tracking Vehicles at Local Region by using Segmented Regions Information)

  • 이대호;박영태
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.929-936
    • /
    • 2007
  • 본 논문에서는 교통 모니터링 시스템에 사용할 수 있는 국부 영역에서 차량 검지와 추적을 수행하는 새로운 기법을 제안하다. 차량 검지와 추적은 각 차선에 미리 설정된 영역에서만 이루어진다. 각 차선에 설정된 국부 영역을 에지 특성과 프레임 차이를 이용하여 여러 개의 분할 영역으로 나누고 분할영역의 통계적 특성과 기하학적 특성에 의해 차량, 도로, 그림자와 전조등 영역으로 분류하여 차량을 검출한다. 검출된 차량은 에지 영상의 정합에 의해 국부 영역내에서 추적하여 차량 속도, 길이, 차간 거리와 도로 점유율과 같은 교통 정보를 산출할 수 있다. 배경 영상을 사용하지 않으므로 다양한 조건에서 사용이 가능하고 다양한 기상, 시간대와 장소에서 90.16%의 높은 차량 검출의 정확도를 나타냈다. 동작 환경에서 카메라의 각도, 방향과 조리개 설정이 조정되면 아주 높은 정확도의 교통 모니터링 시스템의 핵심기술로 사용될 수 있을 것으로 기대된다.

행렬기반의 정합 알고리듬에 의한 음악 기호의 인식 (A Matrix-Based Graph Matching Algorithm with Application to a Musical Symbol Recognition)

  • 허경용;장경식;장문익;김재희
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.2061-2074
    • /
    • 1998
  • 패턴 인식의 분야에서 그래프는 복잡한 대상체의 표현 및 인식의 도구로서 많이 사용되지만, 그래프간의 유사성 비교에는 많은 시간이 소요될 뿐아니라 실제 입력되는 영상은 왜곡으로 인해 저장되어 있는 이상적인 영상과 동일함을 기대할 수 없으므로 유사한 정도를 판별하는 기준이 마련되어야만 한다. 이 논문에서는 행렬을 그래프의 표현 수단으로 사용하였다. 행렬은 표현이 간단하며, 정의되어 있는 연산을 통해 순서 배열 및 매칭 과정을 간단히 수행하루 수 있다. 이 때 그래프를 구성하는 노드(node)들을 기하학적 위치에 따라 순서 배열함으로써 그래프를 구성하는 노드들 사이의 대응 관계를 효율적으로 찾을 수 있도록 하였으며, 또한 왜곡으로 인하여 기호를 표현하는 그래프의 노드가 제대로 추출되지 못한 경우는 기호의 구조를 고려하여 보정해 줄 수 있는 분할 과정을 도입하여 해결하였다. 제안한 방법은 악보의 비음표 기호 인식을 통해 실험하였으며, 실험 결과 95% 정도의 인식률을 얻을 수 있었다.

  • PDF

Hybrid CNN-LSTM 알고리즘을 활용한 도시철도 내 피플 카운팅 연구 (A Study on People Counting in Public Metro Service using Hybrid CNN-LSTM Algorithm)

  • 최지혜;김민승;이찬호;최정환;이정희;성태응
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.131-145
    • /
    • 2020
  • 산업혁신의 흐름에 발맞추어 다양한 분야에서 활용되고 있는 IoT 기술은 빅데이터의 접목을 통한 새로운 비즈니스 모델의 창출 및 사용자 친화적 서비스 제공의 핵심적인 요소로 부각되고 있다. 사물인터넷이 적용된 디바이스에서 누적된 데이터는 사용자 환경 및 패턴 분석을 통해 맞춤형 지능 시스템을 제공해줄 수 있어 편의 기반 스마트 시스템 구축에 다방면으로 활용되고 있다. 최근에는 이를 공공영역 혁신에 확대 적용하여 CCTV를 활용한 교통 범죄 문제 해결 등 스마트시티, 스마트 교통 등에 활용하고 있다. 그러나 이미지 데이터를 활용하는 기존 연구에서는 개인에 대한 사생활 침해 문제 및 비(非)일반적 상황에서 객체 감지 성능이 저하되는 한계가 있다. 본 연구에 활용된 IoT 디바이스 기반의 센서 데이터는 개인에 대한 식별이 불필요해 사생활 이슈로부터 자유로운 데이터로, 불특정 다수를 위한 지능형 공공서비스 구축에 효과적으로 활용될 수 있다. 대다수의 국민들이 일상적으로 활용하는 도시철도에서의 지능형 보행자 트래킹 시스템에 IoT 기반의 적외선 센서 디바이스를 활용하고자 하였으며 센서로부터 측정된 온도 데이터를 실시간 송출하고, CNN-LSTM(Convolutional Neural Network-Long Short Term Memory) 알고리즘을 활용하여 구간 내 보행 인원의 수를 예측하고자 하였다. 실험 결과 MLP(Multi-Layer Perceptron) 및 LSTM(Long Short-Term Memory), RNN-LSTM(Recurrent Neural Network-Long Short Term Memory)에 비해 제안한 CNN-LSTM 하이브리드 모형이 가장 우수한 예측성능을 보임을 확인하였다. 본 논문에서 제안한 디바이스 및 모델을 활용하여 그간 개인정보와 관련된 법적 문제로 인해 서비스 제공이 미흡했던 대중교통 내 실시간 모니터링 및 혼잡도 기반의 위기상황 대응 서비스 등 종합적 메트로 서비스를 제공할 수 있을 것으로 기대된다.

현실세계의 증언, 다큐멘터리-애니메이션 분석 (Testimony of the Real World, Documentary-Animation)

  • 오진희
    • 만화애니메이션 연구
    • /
    • 통권45호
    • /
    • pp.27-50
    • /
    • 2016
  • 이 연구는 재현의 층위인 실제 인간의 육성(肉聲)을 기반으로 하는 다큐멘터리-애니메이션이 현실세계의 증언으로 작용하는 애니메이션 매체의 새로운 확장임을 논의하였다. 애니메이션은 매우 다양한 기법으로 제작되어 정의하기 힘들 정도로 복잡한 양상을 띠며, 다큐멘터리는 객관적 재현을 기반으로 하지만 연출과 디지털 영상처리 등 여러 유형의 인위적 개입이 존재한다는 점에서 복잡성이 증폭된다. 두 매체의 혼성 장르로 등장한 다큐멘터리-애니메이션은 실제의 사건과 요소를 작품 안으로 끌어들여 현실 기반의 서사를 개념적으로 공유하며, 애니메이션의 외형을 시각적 특징으로 한다. 일반적으로 '애니메이티드 다큐멘터리'로 분류되어 온 이 장르는 <바시르와 왈츠를> 발표 이후 논의가 촉발되었는데, 이 작품의 기법은 실사를 변환한 로토스코핑 기법을 사용한 것으로 오인되곤 한다. 그렇지만 세밀히 분석해보면 전형적인 애니메이션 기법, 3D프로그램의 사용, 그리고 실사영상의 혼용으로 실체 없는 가상의 시뮬라크르인 애니메이션과 지시대상의 객관적 지표성을 기반으로 하는 다큐멘터리의 특성이 공존하는 모호한 매체로 제시되어 있다. 본고에서 논의하고 있는 <무장>(Going Equipped)과 <스낵 앤 드링크>(Snack and Drink), 그리고 <라이언>(Lyan)은 실제인물의 증언으로 서사가 진행된다는 점에서 다큐멘터리 매체의 특성을 공유하지만 동시에 제작기법과 연출특성으로 인해 애니메이션으로 연결된다. 따라서 기존의 분류체계에 이 매체를 포함하기보다 새로운 확장으로써 논의되어야 하며, 이는 작품의 실체를 직시하고 논의를 발전시키기 위해 반드시 필요한 전제라 하겠다. 이 연구에서는 인터뷰이(Interviewee)의 목소리를 직접 사용하면서도 애니메이션의 특성을 벗어나지 않는 작품들을 통해 다큐멘터리-애니메이션을 정의하고 현실세계의 증언으로 확장되고 있는 매체의 가능성에 대하여 논의하고자 하였다.

UHD 영상의 실시간 처리를 위한 고성능 HEVC In-loop Filter 부호화기 하드웨어 설계 (Hardware Design of High Performance In-loop Filter in HEVC Encoder for Ultra HD Video Processing in Real Time)

  • 임준성;;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.401-404
    • /
    • 2015
  • 본 논문에서는 UHD급 영상의 실시간 처리를 위한 고성능 HEVC(High Efficiency Video Coding) In-loop Filter 부호화기의 효율적인 하드웨어 구조를 제안한다. HEVC는 양자화 에러로 발생하는 화질 열화 문제를 해결하기 위해 Deblocking Filter와 SAO(Sample Adaptive Offset)로 구성된 In-loop Filter를 사용한다. 본 논문에서 제안하는 In-loop Filter 부호화기 하드웨어 구조에서 Deblocking Filter와 SAO는 수행시간 단축을 위해 $32{\times}32CTU$를 기준으로 2단 하이브리드 파이브라인 구조를 갖는다. Deblocking Filter는 10단계 파이프라인 구조로 수행되며, 메모리 접근 최소화 및 참조 메모리 구조의 단순화를 위해 효율적인 필터링 순서를 제안한다. 또한 SAO는 화소들의 분류와 SAO 파라미터 적용을 2단계 파이프라인 구조로 구현하고, 화소들의 처리를 간소화 및 수행 사이클 감소를 위해 두 개의 병렬 Three-layered Buffer를 사용한다. 본 논문에서 제안하는 In-loop Filter 부호화기 하드웨어 구조는 Verilog HDL로 설계하였으며, TSMC 0.13um CMOS 표준 셀 라이브러리를 사용하여 합성한 결과 약 205K개의 게이트로 구현되었다. 또한 110MHz의 동작주파수에서 4K UHD급 해상도인 $3840{\times}2160@30fps$의 실시간 처리가 가능하다.

  • PDF

원근투영법과 신경망을 이용한 도로노면 방향지시기호 검출 연구 (Detection of Direction Indicators on Road Surfaces Using Inverse Perspective Mapping and NN)

  • 김종배
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권4호
    • /
    • pp.201-208
    • /
    • 2015
  • 본 논문은 차량에 설치된 블랙박스 영상으로부터 도로노면에 표시된 방향지시기호를 효율적으로 검출하는 방안을 제안한다. 제안한 연구에서는 원근 효과를 가진 입력영상에서 역원근변환 방법을 통해 원근 효과를 제거한 실세계 좌표로 매핑 한 평면 영상에서 BOF 특징정보 기반의 신경망 인식기를 통해 검출한다. 입력영상에서 역원근변환과 특징정보의 검출 및 인식은 높은 계산량 때문에 실시간 처리가 어려운 점이 있다. 이를 보완하기 위해 제안한 방안에서는 입력영역의 도로노면 방향지시기호 영역의 특징을 분석하여 도로노면 기호가 포함된 후보 ROI영역을 정의하고 후보 ROI영역의 Gray 색상에서 역원근변환을 수행한다. 그리고 각 도로기호 영역들을 실시간 검출 및 인식하기 위해 인식코자 하는 영역 극소 특징벡터를 추출하고 이를 근소화시킨 클래스로 군집화하여 BOF를 생성한 후 이를 활용한 신경망을 통해 검출한다. 제안한 방안을 도로노면 방향지시기호 검출 연구에 적용한 결과, 약 89% 이상 비교적 정확한 검출률을 제시하였으며, 다양한 도로 환경에서도 높은 검출률을 제시하였다. 따라서 제안한 방안을 안전운전지원시스템을 위한 보다 정확한 도로정보 제공시스템에 적용 가능함을 보인다.

웃음 치료 훈련을 위한 웃음 표정 인식 시스템 개발 (Development of a Recognition System of Smile Facial Expression for Smile Treatment Training)

  • 이옥걸;강선경;김영운;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.47-55
    • /
    • 2010
  • 본 논문은 실시간 카메라 영상으로부터 얼굴을 검출하고 얼굴 표정을 인식하여 웃음 치료훈련을 할 수 있는 시스템을 제안한다. 제안된 시스템은 카메라 영상으로부터 Haar-like 특징을 이용하여 얼굴 후보 영역을 검출한 다음, SVM분류기를 이용하여 얼굴 후보 영역이 얼굴 영상인지 아닌지를 검증한다. 그 다음에는 검출된 얼굴 영상에 대해, 조명의 영향을 최소화하기 위한 방법으로 히스토그램 매칭을 이용한 조명 정규화를 수행한다. 표정 인식 단계에서는 PCA를 사용하여 얼굴 특징 벡터를 획득한 후 다층퍼셉트론 인공신경망을 이용해 실시간으로 웃음표정을 인식하였다. 본 논문에서 개발된 시스템은 실시간으로 사용자의 웃음 표정을 인식하여 웃음 양을 화면에 표시해 줌으로써 사용자 스스로 웃음 훈련을 할 수 있게 해 준다. 실험 결과에 따르면, 본 논문에서 제안한 방법은 SVM 분류기를 통한 얼굴 후보 영역 검증과 히스토그램 매칭을 이용한 조명정규화를 이용하여 웃음 표정 인식률을 향상시켰다.