• 제목/요약/키워드: 비전 기반 추적

검색결과 135건 처리시간 0.024초

윤곽선 이미지 피라미드와 관심영역 검출을 이용한 SIFT 기반 이미지 유사성 검색 (SIFT based Image Similarity Search using an Edge Image Pyramid and an Interesting Region Detection)

  • 유승훈;김덕환;이석룡;정진완;김상희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.345-355
    • /
    • 2008
  • 다양한 형태 특징 추출 방법 중의 하나인 SIFT는 물체 인식, 모션 추적, 3차원 이미지 재구성과 같은 컴퓨터 비전 응용 분야에서 많이 사용된다. 하지만 SIFT 방법은 많은 특징점들과 고차원의 특징 벡터를 사용하기 때문에 이미지 유사성 검색에 그대로 적용하기에는 많은 어려움이 있다. 본 논문에서는 윤곽선 이미지 피라미드와 관심영역 검출을 이용한 SIFT 기반 이미지 유사성 검색 기법을 제안한다. 제안한 방법은 윤곽선 이미지 피라미드를 이용하여 이미지의 밝기 변화, 크기, 회전등에 불변한 특징을 추출하고, 타원 형태의 허프변환을 이용한 관심영역 검출을 통해 불필요한 많은 특징점들을 제거하여 검색성능을 높인다. 실험 결과에서 제안한 방법의 이미지 검색 성능이 기존의 SIFT의 방법에 비해 평균 재현율이 약 20%정도 좋은 성능을 보이고 있다.

객체 감지 데이터 셋 기반 인체 자세 인식시스템 연구 (Research on Human Posture Recognition System Based on The Object Detection Dataset)

  • 유암;리라이춘;루징쉬엔;쉬멍;정양권
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.111-118
    • /
    • 2022
  • 컴퓨터 비전 연구에서 2차원 인체 자세는 매우 광범위한 연구 방향으로 특히 자세 추적과 행동 인식에서 유의미한 분야다. 인체 자세 표적 획득은 이미지에서 인체 목표를 정확히 찾는 방법을 연구하는 것이 핵심이며 인체 자세 인식은 인공지능(AI)에 적용하는 한편 일상생활에 활용되고 있어서 매우 중요한 연구의의가 있다. 인체 자세 인식 효과의 우수성의 기준은 인식 과정의 성공률과 정확도에 의해 결정된다. 본 연구의 인체 자세 인식에서는 딥러닝 전용 데이터셋인 MS COCO를 기반하여 인체를 17개의 키 포인트로 구분하였다. 다음으로 주요 특징에 대한 세분화 마스크(segmentation mask) 방법을 사용하여 인식률을 개선하였다. 최종적으로 신경망 모델을 설계하고 간단한 단계별 학습부터 효율적인 학습에 이르기까지 많은 수의 표본을 학습시키는 알고리즘을 제안하여 정확도를 향상할 수 있었다.

스테레오 비전을 기반으로 한 3차원 입력 장치 (Stereo Vision Based 3D Input Device)

  • 윤상민;김익재;안상철;고한석;김형곤
    • 대한전자공학회논문지SP
    • /
    • 제39권4호
    • /
    • pp.429-441
    • /
    • 2002
  • 본 논문은 실시간으로 3차원 공간상에서의 움직임 정보를 추출할 수 있는 입력 장치를 제안한다. 제안하는 3차원 입력 장치는 스테레오 카메라의 기하학적 구조와 색상, 움직임, 형태상의 특성을 이용하여 복잡한 환경에서 사전 카메라 캘리브레이션 없이 3차원 움직임 정보를 추출할 수 있다. 움직임 추출을 위해서 perspepctive projection 행렬과 perspective distortion 행렬을 이용한 스테레오 카메라의 기하학적 특성을 이용하며, 효과적인 좌우 영상의 특징점 추적 및 추출을 위해 색상 변환(Color transform)과 UPC(Unmatched Pixel Count) 및 이산 칼만 필터(Discrete Kalman Filter)의 효과적인 결합으로 이루어진 MAWUPC(Motion Adaptive Weighted Pixel Count)과 PCA(Principal Component Analysis)로 구성된 알고리즘을 제안한다. 추출된 3차원 공간상에서의 움직임은 가상환경에서의 가상 물체를 제어하거나 사용자 시점의 이동을 나타내는 인터페이스로 사용한다. 스테레오 비전을 이용한 입력 장치는 선으로 연결되지 않기 때문에 사용자가 가상환경에서 작업하기가 편리하며 몰입감을 높일 수 있는 등 보다 효율적인 상호작용을 가능하게 해준다.

그림모델과 파티클필터를 이용한 인간 정면 상반신 포즈 인식 (Pictorial Model of Upper Body based Pose Recognition and Particle Filter Tracking)

  • 오치민;;김민욱;이칠우
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.186-192
    • /
    • 2009
  • 본 논문은 비전을 이용한 인간 정면 상반신 포즈를 인식 방법에 대해서 기술한다. 일반적으로 HCI(Human Computer Interaction)와 HRI(Human Robot Interaction)에서는 인간이 정면을 바라볼 때 얼굴, 손짓으로 의사소통 하는 경우가 많기 때문에 본 논문에서는 인식의 범위를 인간의 정면 그리고 상반신에 대해서만 한정한다. 인간 포즈인식의 주요 두 가지 어려움은 첫째 인간은 다양한 관절로 이루어진 객체이기 때문에 포즈의 자유도가 높은 문제점 때문에 모델링이 어렵다는 것이다. 둘째는 모델링된 정보와 영상과의 매칭이 어려운 것이다. 이를 해결하기 위해 본 논문에서는 모델링이 쉬운 그림모델(Pictorial Model)을 이용해 인체를 다수 사각형 파트로 모델링 하였고 이를 이용해 주요한 상반신 포즈를 DB화 해 인식한다. DB 포즈로 표현되지 못하는 세부포즈는 인식된 주요 포즈 파라미터로 부터 파티클필터를 이용해 예측한 다수 파티클로부터 가장 높은 사후분포를 갖는 파티클을 찾아 주요 포즈를 업데이트하여 결정한다. 따라서 주요한 포즈 인식과 이를 기반으로 한 세부 포즈를 추적하는 두 단계를 통해 인체 정면 상반신 포즈를 정확하게 인식 할 수 있다.

  • PDF

휴먼 컴퓨터 인터페이스를 위한 실시간 시선 식별 (Real Time Gaze Discrimination for Human Computer Interaction)

  • 박호식;배철수
    • 한국통신학회논문지
    • /
    • 제30권3C호
    • /
    • pp.125-132
    • /
    • 2005
  • 본 논문에서는 실시간 시선 식별을 위한 능동적 적외선 조명을 기반으로 한 컴퓨터 비전 시스템을 제안하고자 한다. 현존하는 대다수의 시선 식별 방법은 고정된 얼굴에서만 원활하게 동작하고 개개인에 대한 교정 절차를 필요로 한다. 그러므로 본 논문에서는 교정 작업 없이 얼굴 움직임이 있는 경우에도 견실하고 정확하게 동작하는 시선 식별 시스템을 제안하고 있다. 제안된 시스템은 추출된 변수로부터 시선을 스크린 좌표로 매핑하기 위해 GRNN을 이용하였다. 동공을 추적하여 GRNN을 사용함으로서, 시선 매핑에 분석적 기능이나 얼굴 움직임에 대한 계산이 필요 없을 뿐 아니라 다른 개개인에 대하여 학습과정에서 매핑 기능을 일반화 할 수 있었다. 시선 예측 정확도를 개선하고자 계층적 식별을 제안함으로써 오분류를 줄일 수 있었고, 공간 시선 해상도는 스크린에서 1m 정도 떨어진 거리에서 수평으로 10cm, 수직으로 약 13cm, 즉 수평으로 8도 수직으로 5도 이었다. 실험 결과, 재식별 하였을 경우 1차 시선 식별시 84%보다 약 9% 정도 정확성이 향상되어 93%를 나타냄으로써 제안된 시스템의 유효성을 증명하였다.

컴퓨터 인터페이스를 위한 실시간 시선 식별 (Real Time Gaze Discrimination for Computer Interface)

  • 황선기;김문환
    • 한국정보전자통신기술학회논문지
    • /
    • 제3권1호
    • /
    • pp.38-46
    • /
    • 2010
  • 본 논문에서는 실시간 시선 식별을 위한 능동적 적외선 조명을 기반으로 한 컴퓨터 비전 시스템을 제안 하고자 한다. 현존하는 대다수의 시선 식별 방법은 고정된 얼굴에서만 원활하게 동작하고 개개인에 대한 교정 절차를 필요로 한다. 그러므로 본 논문에서는 교정 작업 없이 얼굴 움직임이 있는 경우에도 견실하고 정확하게 동작하는 시선 식별 시스템을 제안하고 있다. 제안된 시스템은 추출된 변수로부터 시선을 스크린 좌표로 매핑하기 위해 GRNN을 이용하였다. 동공을 추적하여 GRNN을 사용함으로서, 시선 매핑에 분석적 기능이나 얼굴 움직임에 대한 계산이 필요 없을 뿐 아니라 다른 개개인에 대하여 학습과정에서 매핑 기능을 일반화 할 수 있었다. 시선 예측 정확도를 개선하고자 계층적 식별을 제안함으로써 오분류를 줄일 수 있었고, 공간 시선 해상도는 스크린에서 1m 정도 떨어진 거리에서 수평으로 10cm, 수직으로 약 13cm, 즉 수평으로 8도 수직으로 5도 이었다. 실험 결과, 재식별 하였을 경우 1차 시선 식별시 84%보다 약 9% 정도 정확성이 향상되어 93%를 나타냄으로써 제안된 시스템의 유효성을 증명하였다.

  • PDF

다중의 특징 분석을 통한 비 유사 영역의 자동적인 검출 (Automatic Detection of Dissimilar Regions through Multiple Feature Analysis)

  • 장석우;정명희
    • 한국산학기술학회논문지
    • /
    • 제21권2호
    • /
    • pp.160-166
    • /
    • 2020
  • 모바일 기반의 하드웨어 기술이 발전함에 따라 많은 종류의 응용 프로그램들이 개발되고 있다. 그리고 이런 응용프로그램들의 인터페이스가 올바르게 동작하는지를 자동으로 검사하려는 수요가 증가하고 있다. 본 논문에서는 입력되는 여러 가지 유형의 영상으로부터 주요한 특징의 비교 분석을 통해서 응용 프로그램의 실행 오류 화면을 강인하게 검출하는 접근 방법을 제시한다. 본 논문에서 제시된 방법에서는 먼저 입력되는 영상으로부터 영상을 대표하는 주요한 다중의 특징을 추출한다. 그런 다음, 추출된 다중의 특징의 차이를 비교함으로써 입력된 영상이 목표 영상과 동일한 정상적인 영상인지, 아니면 목표 영상과 유사하지만 서로 다른 오류 영상인지를 효과적으로 판단한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 종류의 영상으로부터 주요한 다중의 특징 비교를 통해서 정상적인 영상과 오류가 발생한 영상을 정확하게 검출한다는 것을 보여준다. 본 논문에서 제안된 접근 방법은 비디오 색인, 객체 검출 및 추적, 영상 감시 등과 같은 컴퓨터 비전과 관련된 많은 실제 응용 분야에서 유용하게 사용될 것으로 기대된다.

개인 정보가 노출된 목표 객체의 블로킹 알고리즘 (A Blocking Algorithm of a Target Object with Exposed Privacy Information)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제20권4호
    • /
    • pp.43-49
    • /
    • 2019
  • 초고속의 유무선 인터넷은 다양한 형태의 미디어 데이터를 손쉽게 획득할 수 있는 유용한 창구이다. 이에 반해, 일반인들이 개인 정보가 노출된 대상 객체를 포함하고 있는 미디어 데이터까지도 인터넷을 통해 용이하게 획득할 수 있으므로 사회적으로 문제가 되고 있다. 본 논문에서는 입력되는 여러 가지 종류의 영상으로부터 개인 정보가 노출된 대상 객체를 학습 알고리즘을 이용해 강인하게 검출하고, 검출된 대상 객체 영역을 효과적으로 블로킹하는 방법을 제안한다. 본 논문에서 제안된 방법에서는 먼저 뉴럴 네크워크 기반의 학습 알고리즘을 사용해 영상으로부터 개인 정보를 포함하고 있는 대상 객체만을 검출한다. 그런 다음, 격자형 모자이크를 생성해 이전 단계에서 검출된 대상 객체 영역 위에 오버랩함으로써 개인 정보를 포함하고 있는 객체 영역을 효과적으로 블로킹한다. 실험 결과에서는 제안된 알고리즘이 입력되는 다양한 영상으로부터 개인 정보가 노출된 대상 영역을 강인하게 검출하고, 검출된 영역을 모자이크 처리를 통해 효과적으로 블로킹한다는 것을 보여준다. 본 논문에서 제시된 객체 블로킹 방법은 객체 보안, 물체 추적, 영상 블로킹 등과 같은 컴퓨터 비전과 관련된 여러 응용 분야에서 유용하게 활용될 것으로 예상된다.

깊이 영상 카메라로부터 획득된 3D 영상의 품질 향상 방법 (A method of improving the quality of 3D images acquired from RGB-depth camera)

  • 박병서;김동욱;서영호
    • 한국정보통신학회논문지
    • /
    • 제25권5호
    • /
    • pp.637-644
    • /
    • 2021
  • 일반적으로, 컴퓨터 비전, 로보틱스, 증강현실 분야에서 3차원 공간 및 3차원 객체 검출 및 인식기술의 중요성이 대두되고 있다. 특히, 마이크로소프트사의 키넥트(Microsoft Kinect) 방식을 사용하는 영상 센서를 통하여 RGB 영상과 깊이 영상을 실시간 획득하는 것이 가능해짐으로 인하여 객체 검출, 추적 및 인식 연구에 많은 변화를 가져오고 있다. 본 논문에서는 다시점 카메라 시스템 상에서의 깊이 기반(RGB-Depth) 카메라를 통해 획득된 영상을 처리하여 3D 복원 영상의 품질을 향상하는 방법을 제안한다. 본 논문에서는 컬러 영상으로부터 획득한 마스크 적용을 통해 객체 바깥쪽 잡음을 제거하는 방법과 객체 안쪽의 픽셀 간 깊이 정보 차이를 구하는 필터링 연산을 결합하여 적용하는 방법을 제시하였다. 각 실험 결과를 통해 제시한 방법이 효과적으로 잡음을 제거하여 3D 복원 영상의 품질을 향상할 수 있음을 확인하였다.

필터링 기반의 잡음 제거를 통한 피부 영역의 추출 (Extraction of Skin Regions through Filtering-based Noise Removal)

  • 장석우
    • 한국산학기술학회논문지
    • /
    • 제21권12호
    • /
    • pp.672-678
    • /
    • 2020
  • 최근 들어 초고속의 영상 촬영이 가능한 저가이며 성능이 우수한 카메라가 등장함에 따라서 물체의 미세한 움직임까지 정확하게 묘사한 초고속의 영상들이 보편화되고 있는 실정이다. 본 논문에서는 빠른 속도로 입력되는 초고속의 영상으로부터 예기치 않게 포함된 잡음을 제거한 다음, 잡음이 제거된 영상으로부터 피부 영역과 같이 개인 정보를 대표할 수 있는 관심 영역을 추출하는 방법을 제안한다. 본 논문에서는 먼저 입력받은 초고속의 영상으로부터 비정상적인 전기 신호로 인해 발생한 잡음을 양방향의 필터를 적용하여 제거한다. 그런 다음, 사전 학습을 통해 생성한 색상 분포 모델을 사용하여 영상 내에 포함된 개인 정보를 대표하는 관심 영역인 피부 영역을 정확하게 추출한다. 실험 결과에서는 본 연구에서 소개된 알고리즘이 여러 가지의 초고속 영상으로부터 잡음을 제거한 다음 관심 영역을 강인하게 추출한다는 것을 보여준다. 본 논문에서 제시된 접근 방법은 영상 전처리, 잡음 제거, 목표 영역의 추적 및 감시 등과 같은 컴퓨터 비전 및 패턴인식과 관련된 여러 가지의 응용 분야에서 유용하게 사용될 것으로 예상된다.