• 제목/요약/키워드: Motion Template

검색결과 60건 처리시간 0.032초

시점에 독립적인 제스처 인식을 위한 볼륨 모션 템플릿 (Volume Motion Template For View Independent Gesture Recognition)

  • 신호근;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.844-846
    • /
    • 2005
  • 본 논문은 시점에 독립적인 제스처 인식을 위하여 볼륨 모션 템플릿을 제안한다. 기존 제스처 연구에서 시점 문제와 행동 속도의 편차는 중요하면서도 어려운 문제이다. 첫째, 시점 문제는 하나의 단안 카메라나 스테레오 카메라를 이용하는 단방향 카메라 환경에서 발생하며 해결하기 어려운 문제이다. 모든 시점에서 학습시켜야 하는 기존 연구의 단점을 해결하기 위해, 다양한 시점입력에 독립적으로 인식을 할 수 있는 볼륨 모션 템플릿을 제안한다. 볼륨 모션 템플릿은 깊이 정보와 모션의 방향성 통해 최적의 가상 시점을 제공한다. 또한 볼륨 모션 템플릿을 이용하여 시스템의 신뢰성과 확장성 또한 개선하였다. 두 번째, 제스처가 발생 시마다 생기는 속도의 편차 문제이다. 입력 제스처의 시간-정규화를 통해 해결할 수 있는데, 시간 정보 대신 모션 량을 사용하여 이를 해결하였다. 볼륨 모션 템플릿을 이용하여 다양한 시점 입력에 대해 실험하였고, 기존 모션 히스토리 이미지와 비교하여 시점에 독립적인 결과를 얻었다.

  • PDF

다시점 영상 시스템을 위한 얼굴 추적 (Face Tracking for Multi-view Display System)

  • 한충신;장세훈;배진우;유지상
    • 한국통신학회논문지
    • /
    • 제30권2C호
    • /
    • pp.16-24
    • /
    • 2005
  • 본 논문에서는 관찰자의 시점에 적응적인 다시점 영상 합성 시스템을 위한 얼굴 추적 기법을 제안한다. depth 카메라를 이용하여 텍스쳐 영상과 깊이 정보를 획득한 후, 회전(rotation)과 이동(translation) 등 기하학적인 변환을 이용하여 관찰자의 위치를 고려한 다시점 영상을 생성할 수 있다. 관찰 시점의 위치와 각도에 의한 입체감(motion parallex cue)을 제공하기 위하여 주 관찰자의 얼굴을 추적하는 기법을 제안한다. 제안된 기법에서는 모니터에 설치된 얼굴 획득용 카메라로부터 얻은 영상에서 얼굴 색상의 통계학적 특성과 변형적 형판(template)을 이용하여, 실시간으로 초기에 설정된 주요 관찰자(dominant face)의 얼굴영역을 추적하게 된다. 실험 결과 복잡한 배경 하에서도 얼굴 영역의 위치를 성공적으로 검출 및 추적하여 관찰자 시점에 해당하는 3차원 입체 영상을 디스플레이 할 수 있었다.

가려짐에 강인한 축구공 추적 (Soccer Ball Tracking Robust Against Occlusion)

  • 이권;이철희
    • 방송공학회논문지
    • /
    • 제17권6호
    • /
    • pp.1040-1047
    • /
    • 2012
  • 본 논문에서는 축구 방송 영상에서 가려짐에 강인한 축구공 추적 알고리즘을 제안한다. 축구공은 가려짐, 축구공의 빠른 움직임 그리고 빠른 방향 전환 등으로 인해 추적이 어렵다. 기존의 방법들은 대부분 각각의 영상에서 축구공 후보들을 찾고 가능한 모든 경로를 예측하여 최적의 축구공 경로를 찾는 방식으로 축구공을 추적하였으나 이러한 방식은 연산량이 많아 실시간 축구공 추적에 적합하지 않다. 본 논문에서는 Circular Hough Transform을 이용하여 초기 축구공의 위치를 찾아내고, 이전 프레임의 축구공 템플릿을 이용하여 축구공을 추적하고 가려짐 상황에서는 가려짐 처리 알고리즘을 적용한다. 축구공 추적을 위하여, 매칭 스코어를 이용하여 축구공의 가려짐 상황을 판단한다. 가려짐 상태에서 축구공 후보들을 찾고 이전 프레임과의 매칭을 통해 이전 프레임에 존재하는 축구공 후보들은 축구공이 아니며, 새롭게 나타나는 축구공 후보가 축구공일 것이라는 가정을 적용하여 축구공 가려짐 처리 알고리즘을 제안한다. 실제 방송용 축구 경기 영상에 적용하여 제안된 알고리즘이 가려짐 상황을 효과적으로 처리함을 보여준다.

군사용 적외선 영상의 안정화 성능 개선 및 Zynq SoC 구현 (Improve Stability of Military Infrared Image and Implement Zynq SoC)

  • 최현;김영민;강석훈;조중휘
    • 대한임베디드공학회논문지
    • /
    • 제13권1호
    • /
    • pp.17-24
    • /
    • 2018
  • Military camera equipment has a problem that observability is inferior due to various shaking factors. In this paper, we propose an image stabilization algorithm considering performance and execution time to solve this problem and implemented it in Zynq SoC. We stabilized both the simple shaking in the fixed observation position and the sudden shaking in the moving observation position. The feature of the input image is extracted by the Sobel edge algorithm, the subblock with the large edge data is selected, and the motion vector, which is the compensation reference, is calculated through template matching using the 3-step search algorithm of the region of interest. In addition, the proposed algorithm can distinguish the shaking caused by the simple shaking and the movement by using the Kalman filter, and the stabilized image can be obtained by minimizing the loss of image information. To demonstrate the effectiveness of the proposed algorithm, experiments on various images were performed. In comparison, PSNR is improved in the range of 2.6725~3.1629 (dB) and image loss is reduced from 41% to 15%. On the other hand, we implemented the hardware-software integrated design using HLS of Xilinx SDSoC tool and confirmed that it operates at 32 fps on the Zynq board, and realized SoC that operates with real-time processing.

적외선영상에서 배경모델링 기반의 실시간 객체 탐지 시스템 (Real-Time Object Detection System Based on Background Modeling in Infrared Images)

  • 박장한;이재익
    • 전자공학회논문지CI
    • /
    • 제46권4호
    • /
    • pp.102-110
    • /
    • 2009
  • 본 논문은 적외선영상(infrared image)에서 배경모델링 기반의 실시간 객체 탐지 기법과 고속 PPC(PowerPC) & FPGA(Field Programmable Gate Array) 기반 개방형 구조의 하드웨어 설계 방법을 제안한다. 개방형 구조는 하드웨어 및 소프트웨어의 이식이 용이하고, 확장, 호환성, 관리 및 유지보수 등이 편리한 장점이 있다. 제안된 배경모델링 방법을 개방형 구조에 탑재하기 위하여 입력영상에서 검색영역 템플릿을 성긴 블록으로 구성하여 탐색영역의 크기를 줄인다. 또한, 이전 프레임과 현재 프레임에서 영상의 흔들림이 발생했을 때 보정하기 위해 전역움직임 보상방법을 적용한다. 배경과 객체를 분리는 픽셀 밝기의 시간 분석을 통해 적응적 값을 적용한다. 분리된 객체주변에 발생하는 클러터 제거 방법은 중앙값 필터를 적용한다. 설계된 임베디드 시스템에서 배경모델링, 객체탐지, 중앙값 필터, 라벨링, 합병 등의 방법은 PPC에서 구현하였다. 실험결과 제안된 임베디드 시스템에서 전역 움직임 보정과 배경예측을 통해 실시간으로 객체가 탐지될 수 있음을 보였다.

광류와 표정 HMM에 의한 동영상으로부터의 실시간 얼굴표정 인식 (Realtime Facial Expression Recognition from Video Sequences Using Optical Flow and Expression HMM)

  • 전준철;신기한
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.55-70
    • /
    • 2009
  • 비전기반 인간컴퓨터 상호작용은 컴퓨터와 인간의 상호소통을 자연스럽게 제공하는 측면에서 과학과 산업분야에서 주목받는 연구 분야이다. 그러한 측면에서 얼굴표정인식에 의한 인간의 심리적 상태를 추론하는 기술은 중요한 이슈이다. 본 연구에서는 감성인식 HMM 모델과 광류에 기반한 얼굴 움직임 추적 방법을 이용하여 동영상으로부터 얼굴표정을 인식하는 새로운 방법을 제시하였다. 특히, 기존의 감성상태 변환을 설명하는 HMM 모델은 특정 표정상태 간의 전환 시 항상 중립 상태를 거치도록 설계되어 있다. 그러나 본 연구에서는 기존의 표정상태 전환 모델에 중간상태를 거치는 과정 없이 특정 표정 상태간의 변환이 가능한 확장된 HMM 모델을 제시한다. 동영상으로부터 얼굴의 특성정보를 추출하기 위하여 탬플릿 매칭과 광류방법을 적용하였다. 광류에 의해 추적된 얼굴의 표정특성 정보는 얼굴표정인식을 위한 HMM의 매개변수 정보로 사용된다. 실험을 통하여 제안된 얼굴표정인식 방법이 실시간 얼굴 표정인식에 효과적임을 입증하였다.

  • PDF

Head Pose Estimation by using Morphological Property of Disparity Map

  • Jun, Se-Woong;Park, Sung-Kee;Lee, Moon-Key
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.735-739
    • /
    • 2005
  • This paper presents a new system to estimate the head pose of human in interactive indoor environment that has dynamic illumination change and large working space. The main idea of this system is to suggest a new morphological feature for estimating head angle from stereo disparity map. When a disparity map is obtained from stereo camera, the matching confidence value can be derived by measurements of correlation of the stereo images. Applying a threshold to the confidence value, we also obtain the specific morphology of the disparity map. Therefore, we can obtain the morphological shape of disparity map. Through the analysis of this morphological property, the head pose can be estimated. It is simple and fast algorithm in comparison with other algorithm which apply facial template, 2D, 3D models and optical flow method. Our system can automatically segment and estimate head pose in a wide range of head motion without manual initialization like other optical flow system. As the result of experiments, we obtained the reliable head orientation data under the real-time performance.

  • PDF

정렬오차 추정 필터에 기반한 비전 정렬 시스템의 고속 정밀제어 (Fast and Fine Control of a Visual Alignment Systems Based on the Misalignment Estimation Filter)

  • 정해민;황재웅;권상주
    • 제어로봇시스템학회논문지
    • /
    • 제16권12호
    • /
    • pp.1233-1240
    • /
    • 2010
  • In the flat panel display and semiconductor industries, the visual alignment system is considered as a core technology which determines the productivity of a manufacturing line. It consists of the vision system to extract the centroids of alignment marks and the stage control system to compensate the alignment error. In this paper, we develop a Kalman filter algorithm to estimate the alignment mark postures and propose a coarse-fine alignment control method which utilizes both original fine images and reduced coarse ones in the visual feedback. The error compensation trajectory for the distributed joint servos of the alignment stage is generated in terms of the inverse kinematic solution for the misalignment in task space. In constructing the estimation algorithm, the equation of motion for the alignment marks is given by using the forward kinematics of alignment stage. Secondly, the measurements for the alignment mark centroids are obtained from the reduced images by applying the geometric template matching. As a result, the proposed Kalman filter based coarse-fine alignment control method enables a considerable reduction of alignment time.

Spatial-temporal texture features for 3D human activity recognition using laser-based RGB-D videos

  • Ming, Yue;Wang, Guangchao;Hong, Xiaopeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1595-1613
    • /
    • 2017
  • The IR camera and laser-based IR projector provide an effective solution for real-time collection of moving targets in RGB-D videos. Different from the traditional RGB videos, the captured depth videos are not affected by the illumination variation. In this paper, we propose a novel feature extraction framework to describe human activities based on the above optical video capturing method, namely spatial-temporal texture features for 3D human activity recognition. Spatial-temporal texture feature with depth information is insensitive to illumination and occlusions, and efficient for fine-motion description. The framework of our proposed algorithm begins with video acquisition based on laser projection, video preprocessing with visual background extraction and obtains spatial-temporal key images. Then, the texture features encoded from key images are used to generate discriminative features for human activity information. The experimental results based on the different databases and practical scenarios demonstrate the effectiveness of our proposed algorithm for the large-scale data sets.

Post-earthquake building safety evaluation using consumer-grade surveillance cameras

  • Hsu, Ting Y.;Pham, Quang V.;Chao, Wei C.;Yang, Yuan S.
    • Smart Structures and Systems
    • /
    • 제25권5호
    • /
    • pp.531-541
    • /
    • 2020
  • This paper demonstrates the possibility of evaluating the safety of a building right after an earthquake using consumer-grade surveillance cameras installed in the building. Two cameras are used in each story to extract the time history of interstory drift during the earthquake based on camera calibration, stereo triangulation, and image template matching techniques. The interstory drift of several markers on the rigid floor are used to estimate the motion of the geometric center using the least square approach, then the horizontal interstory drift of any location on the floor can be estimated. A shaking table collapse test of a steel building was conducted to verify the proposed approach. The results indicate that the accuracy of the interstory drift measured by the cameras is high enough to estimate the damage state of the building based on the fragility curve of the interstory drift ratio. On the other hand, the interstory drift measured by an accelerometer tends to underestimate the damage state when residual interstory drift occurs because the low frequency content of the displacement signal is eliminated when high-pass filtering is employed for baseline correction.