• 제목/요약/키워드: 단일카메라

검색결과 343건 처리시간 0.026초

제스처 기반 사용자 인터페이스를 위한 색상 마커 인식 알고리즘 (A Color Marker Detection Algorithm for Gesture-based User Interfaces)

  • 이두희;김윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.401-404
    • /
    • 2010
  • 고성능 단말기와 다양한 컨텐츠가 제공되면서 제스처 기반 사용자 인터페이스에 대한 관심이 높아지고 있다. 하지만 기존의 알고리즘을 사용하기 위해서는 센서 장치를 사용하거나 사용자가 부자연스러운 장비를 착용해야 하는 경우가 많다. 본 논문에서는 카메라를 통해 입력된 영상 정보만으로 사용자가 착용한 색상 마커를 실시간으로 검출하는 알고리즘을 제안한다. 본 논문이 제안하는 마커 인식 알고리즘은 색상 감지와 움직임 감지로 나뉜다. 단일 프레임에서 영상 성분 평균을 이용한 조건검사를 통하여 색상 영역을 검출한다. 다음으로, 인접한 프레임간의 평균 영상과 현재 영상과의 차를 가중치로 이용하여 배경 범위를 설정하고 이 범위를 벗어난 영역을 움직임 영역으로 검출한다. 마지막으로 색상 검출 영역과 움직임 검출 영역을 동시에 만족하고 이웃한 픽셀들도 위 조건을 동시에 만족하면 최종적으로 사용자의 마커로 인식한다. 본 논문이 제안하는 알고리즘은 영상 정보만 사용하기 때문에 사용자는 센서나 부자연스러운 장비를 착용할 필요가 없고 일조량에 따른 조도의 변화에 강건하기 때문에 효과적인 사용자 움직임 검출이 가능하다.

감시 시스템에서의 비정상 소리 탐지 및 식별 (Abnormal Sound Detection and Identification in Surveillance System)

  • 주영민;이의종;김정식;오승근;박대희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.592-595
    • /
    • 2010
  • 본 논문에서는 감시카메라 환경에서 취득한 오디오 데이터를 입력으로 하여, 비정상 상황을 인식하는 시스템을 제안한다. 제안된 시스템은 단일클래스 SVM의 대표적인 모델인 SVDD와 최근 얼굴 인식 분야에서 성공적인 업적을 보여주고 있는 신호 처리 분야의 SRC를 계층적으로 결합한 구조로써, 첫 번째 계층에서는 SVDD로 비정상 소리를 신속하게 탐지하여 관리자에게 알람 경고하고, 두 번째 계층의 SRC는 탐지된 비정상 소리를 유형별로 세분화 식별하여 관리자에게 비상 상황을 보고함으로써 관리자의 위기 상황 대처를 돕는다. 제안된 시스템은 실시간 처리가 가능하며, 점증적 갱신의 학습 능력으로 인하여 비정상 오디오 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 실험을 통하여 제안된 시스템의 성능을 검증한다.

가상 환경의 배경 정보를 위한 2D 영상 기반의 3D 데이터 생성 방법 (2D Image based 3D Data Generation Method for Background Information of Virtual Reality)

  • 이성배;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.331-334
    • /
    • 2021
  • 가상 현실(VR: Virtual Reality) 기술은 대표적인 몰입형 미디어 기술로써, 컴퓨터 등을 통해 인공적으로 만들어낸 실제와 유사한 특정 환경, 상황 혹은 그 기술 자체를 의미한다. VR 기술은 비교적 간단한 장비를 착용한 것만으로 가상 세계에 구현된 모든 공간을 체험할 수 있기 때문에 사용자가 신체적 불편하더라도 손쉽게 유명 관광 명소를 여행할 수 있다. 또한, 실제 작전지역을 가상 세계에 반영함으로써, 가상 세계에서 안전한 군사 훈련이 가능하다. 이와 같은 활용을 가능하게 하기 위해서는 가상 세계의 배경 정보가 실제 세계의 모습과 흡사한 실사 그래픽으로 구성되어야 한다. 그러나 실사 그래픽을 제작하는 것은 제작 난이도가 높고 제작비용이 비싸다는 제한 사항으로 인하여 실사 그래픽을 바탕으로 한 VR 콘텐츠의 수는 부족하다. 이에 본 논문에서는 일반 카메라를 통해서 촬영한 단일 영상 또는 다시점 영상을 통해서 Point Cloud 데이터를 생성하고, 이를 가상 세계의 배경 정보로 활용하기 위한 방법을 제안하고자 한다.

  • PDF

신뢰할 수 있는 딥러닝 기반 단일 캠 좌석현황 실시간 탐지 솔루션 (Reliable Deep Learning Based Single-Cam Seat Status Real-Time Detection Solution.)

  • 고성지;나영훈;최명근;허종욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.718-720
    • /
    • 2022
  • 신뢰할 수 있는 딥러닝 기반 영상처리 기술을 적용하여 도서관 등 공공장소에서 별도의 센서 없이 하나의 카메라로만 좌석의 점유 사항을 자동으로 검출하여 사용자에게 앱으로 제공하는 솔루션을 제안한다. 라즈베리파이를 이용하며 촬영과 동시에 내부적으로 분석 및 좌석탐지가 진행되며, 촬영된 데이터는 모두 탐지 즉시 휘발된다. 이로 인해 우리의 솔루션은 구조적으로 개인정보 유출 등의 민감한 데이터는 유출될 우려가 없다. 또한 탐지가 완료된 후 결과를 서버로 전송하기 때문에 서버의 처리량이 크게 감소된다. 우리는 이와 같이 신뢰할 수 있고 효율적으로 좌석을 탐지하고 정보를 제공하는 솔루션을 제안한다.

다변량 신호 데이터 분류를 위한 확장 셰이플릿 변환 기법 (A Study on Random Dilated Shapelet Transform for classifying multivariate signal data)

  • 정종민;손재성;박재성;이상민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.709-711
    • /
    • 2023
  • 안전관리를 위한 인공지능 기술은 꾸준히 연구되고 있는 분야다. 특히, 컴퓨터 비전 기술을 활용한 CCTV 영상 분석은 군중의 동선과 밀도를 파악하는데 유용하며, 대규모 실내 공간에서 체계적인 안전관리를 가능하게 한다. 그러나 기존의 CCTV 카메라를 사용한 군중 수 추정은 가려짐(occlusion)과 같은 한계가 있다. 본 논문은 무선 랜 신호 데이터 분석 기법을 활용하여 수집한 데이터를 활용하여 실내 환경에서 군중 수를 추정하고자 한다. 본 논문에서는 인원 수 분류 예측을 위해 셰이플릿 확장 변환(Random Dilated Shapelet Transform) 기법을 제안한다. 단일 데이터 세트 내 분류 결과와, TX, RX 배치 방식에 따른 분류 성능의 차이는 모델의 성능 부족보다 데이터의 특성을 고려한 새로운 접근 방법의 필요성을 알려준다.

단일 Bayer 영상으로 부터 다양한 노출을 가지는 Low Dynamic Range 영상들의 추정 (Estimation of Differently Exposed Low Dynamic Range Images from a Single Bayer Image)

  • 이태형;하호건;하영호
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.74-79
    • /
    • 2011
  • HDR(high dynamic range) 영상 기법은 일반 카메라에서 획득되는 영상의 LDR(low dynamic range)의 한계를 극복하는 방법을 일컫는다. 일반적으로 이 기법은 카메라의 노출에 따른 단계별 LDR 영상들을 획득하고 통합함으로써 획득된다. 그러나 기존의 연구에서는 여러 번에 걸친 영상획득 과정이 필요하고 그에 따른 고스트(ghost) 현상을 야기한다. 이러한 한계를 극복하기 위하여, 본 연구에서는 센서에서 획득되는 단일 Bayer 영상으로부터 사용자가 요구하는 노출의 LDR 영상을 채널상관성을 고려하여 추정할 수 있는 방법을 제안하였다. 제안된 방법은 먼저 입 출력 간의 상관관계를 나타내는 노출(exposure) look-up table(LUT)를 각 채널별로 생성을 한다. 그리고 입력 영상의 평균휘도와 노출을 LUT에 적용하여, 최종 LDR 영상을 위한 새로운 노출을 추정한다. 다음으로 입력 영상의 각 픽셀 값과 추정된 노출을 LUT에 적용함으로써 목적하는 밝기를 가지는 LDR 영상을 추정 할 수 있다. 이 때, 포화된 영역의 경우는 채널의 상관성을 고려하여 추정함으로써 실제 노출로 획득한 영상과의 차이를 줄이는 방법을 제안하였다. 결과영상은 PSNR을 비교하여 정확성을 증명하였으며, 또한 디스플레이를 위하여 톤맵핑(tone mapping)을 적용한 영상을 사용한 비교에서 실제 획득된 영상과 추정한 영상의 차이가 비슷함을 확인하였다.

에지 지시자를 이용한 향상된 방향 가중치 디모자이킹 알고리듬 (Enhanced Weighted Directional Demosaicking using Edge Indicator)

  • 류지만;양시영;임태환;정제창
    • 방송공학회논문지
    • /
    • 제15권2호
    • /
    • pp.265-279
    • /
    • 2010
  • 디지털 영상에서 색을 표현하기 위해서는 최소 세 개 이상의 색 채널이 필요하다. 하지만 디지털 카메라에서 영상을 얻기 위해 사용되는 영상 센서는 빛의 밝기 정보만을 받아들일 뿐 색 정보를 분리해낼 수 없으므로 각 화소당 세 개의 영상 센서를 배치 한 뒤 색필터를 사용하여 색 영상을 얻어내게 된다. 대다수의 디지털 카메라는 제품의 크기를 최소화 하고 제조 단가를 절감하기 위하여 단일 영상 센서 배열을 사용한다. 이런 단일 영상 센서를 통해 얻어진 영상들은 각 화소당 하나의 색 정보만을 포함하고 있기 때문에, 사람이 본래의 색으로 영상을 보기 위해서는 각 화소당 나머지 두 개의 손실된 색 정보를 복원해야 하며 이 과정을 색 필터 보간(color filter array interpolation) 혹은 디모자이킹(demosaicking) 과정이라 부른다. 본 논문에서는 두 차례에 걸친 디모자이킹 단계를 통해 여러 가지 기법을 복합적으로 사용함으로써 더 정확한 색을 복원하는 기법을 제안하고 있으며, 에지 기반 보간법, 2차 미분값을 보정값으로 사용하는 기법, 색차를 이용하는 기법, 가중치 합을 이용한 기법 등이 사용되어서 화질을 개선하고 있다. 기존의 기법들과 객관적, 주관적 비교를 수행하여 제안하는 기법이 다른 기법들에 비해 더 좋은 성능을 보여주는 것을 확인하였다.

등거리 스테레오 전방위 렌즈 영상에 대한 위치 측정 알고리즘 (Range finding algorithm of equidistance stereo catadioptric mirror)

  • 최영호
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.149-161
    • /
    • 2005
  • 전방위 렌즈의 단점은 균일하지 않은 해상도에 있다. 등거리 전방위 렌즈는 이러한 단점을 해결하기 위한 새로운 대안으로 볼 수 있으며, 등거리 스테레오 전방위 렌즈는 한 개의 카메라를 통해 스테레오 영상을 획득할 수 있다는 점에서 매우 효율적인 시스템이라 말할 수 있다. 그러나 등거리 스테레오 전방위 렌즈는 단일 등거리 전방위 렌즈에 비해 획득 영상의 크기가 상대적으로 작게 되어 해상도가 낮아진다는 단점이 있다. 정확한 거울의 위치, 카메라 축과 거울 중심과의 정확한 정렬등의 문제는 정밀도를 높여 해결할 수 있지만, 영상 획득 시 필수적으로 필요한 렌즈의 초점 거리 변화는 피할 수 없게 된다. 본 논문에서는 먼저 초점 거리 변화가 물체의 거리 측정에 미치는 영향을 고찰한 후 스테레오 영상에서 보이는 물체의 시야 각은 두 영상에서 거의 일정하다는 가정하에 실제 초점 거리를 계산하는 방법을 제시한다.

  • PDF

내장형 JPEG 압축을 위한 단일 메모리 기반의 스캔 순서 변환기 (Single memory based scan converter for embedded JPEG encoder)

  • 박현상
    • 방송공학회논문지
    • /
    • 제11권3호
    • /
    • pp.320-325
    • /
    • 2006
  • JPEG 표준에 의거한 정지 영상 압축을 위하여, 영상은 겹치지 $8{\times}8$ 블록 단위로 분할된다. 카메라 모듈로부터는 라스터 스캔 순서로 화소 데이터를 입력되기 때문에 JPEG 인코더와의 사이에 화소 순서 정렬을 위한 스캔 순서 변환기가 위치한다. 일반적으로 카메라와 인코더 동작을 병렬로 수행하기 위하여 8 라인에 해당하는 화소 데이터를 저장하기 위한 로컬 메모리를 2개 필요하다. 그러나 이와 같이 2개의 메모리를 사용하는 구조는 영상의 수평 해상도에 정비례하여 메모리 용량이 증가하는 문제 때문에 고해상도 영상 압축에는 적합하지 않게 된다. 본 논문에서는 하나의 메모리를 사용하여 스캔 순서 변환을 수행할 수 있는 록 메모리 주소 생성 알고리즘을 제안한다. 이 알고리즘은 가산기와 감산기와 같은 기본 연산 소자로 구현되기 때문에, JPEG 인코더를 내장한 시스템을 효과적으로 구성할 수 있게 한다.

영상 접합을 이용한 산불 감시 시스템 (Wild Fire Monitoring System using the Image Matching)

  • 이승희;신범주;송복득;안선정;김진동;이학준
    • 한국콘텐츠학회논문지
    • /
    • 제13권6호
    • /
    • pp.40-47
    • /
    • 2013
  • 산불 발생 시, 조기 발견 여부는 피해 규모의 정도를 좌우하는 중요한 요소이다. 본 논문은 산불 초기 발견과 위치 및 규모를 효과적으로 파악하기 위하여 PAN/TILT 동작이 가능한 단일 카메라로부터 파노라믹 영상을 구성하여 효율적으로 산불을 모니터링 할 수 있는 시스템을 제안한다. 입력된 RGB 이미지를 YCrCb 이미지로 색상 변환한 후, 차영상을 추출하여 연기의 움직임 변화를 감지함으로써 산불 후보 영역을 추출한다. 산불 후보 영역은 히스토그램 분석을 통한 불꽃 검출로 화재 여부를 판단하도록 한다. 또한 SURF와 영상 접합을 이용한 파노라믹 이미지를 지원한다. 이는 다음과 같은 장점들을 가진다. 첫째, 한대의 카메라와 한 대의 모니터를 사용하므로 경제적인 시스템 구성이 가능하다. 둘째, 파노라믹 영상을 통해 넓은 뷰를 한 번에 확인함으로써 실재감 있는 규모 확인 및 조기발견이 가능하다. 셋째, 구축된 파노라믹 영상을 저장함으로써 데이터의 양을 줄일 수 있다.