• 제목/요약/키워드: keypoint detection

검색결과 36건 처리시간 0.024초

Depth-hybrid speeded-up robust features (DH-SURF) for real-time RGB-D SLAM

  • Lee, Donghwa;Kim, Hyungjin;Jung, Sungwook;Myung, Hyun
    • Advances in robotics research
    • /
    • 제2권1호
    • /
    • pp.33-44
    • /
    • 2018
  • This paper presents a novel feature detection algorithm called depth-hybrid speeded-up robust features (DH-SURF) augmented by depth information in the speeded-up robust features (SURF) algorithm. In the keypoint detection part of classical SURF, the standard deviation of the Gaussian kernel is varied for its scale-invariance property, resulting in increased computational complexity. We propose a keypoint detection method with less variation of the standard deviation by using depth data from a red-green-blue depth (RGB-D) sensor. Our approach maintains a scale-invariance property while reducing computation time. An RGB-D simultaneous localization and mapping (SLAM) system uses a feature extraction method and depth data concurrently; thus, the system is well-suited for showing the performance of the DH-SURF method. DH-SURF was implemented on a central processing unit (CPU) and a graphics processing unit (GPU), respectively, and was validated through the real-time RGB-D SLAM.

능동 스테레오 비젼을 이용한 실내환경의 3차원 형상 재구성 알고리즘 (A Study on the 3D Shape Reconstruction Algorithm of an Indoor Environment Using Active Stereo Vision)

  • 변기원;주재흠;남기곤
    • 융합신호처리학회논문지
    • /
    • 제10권1호
    • /
    • pp.13-22
    • /
    • 2009
  • 본 연구에서는 레이저 슬릿 빔을 이용한 능동 스테레오 정합 기법과 모자이크 기법을 결합한 3차원 형상 복원 기법을 제안한다. 능동 스테레오 정합 기법은 레이저 슬릿 빔이 조사된 좌, 우 영상에서 색상과 밝기 변화를 분석하여 레이저 라인의 위치정보를 검출하고, 등극선(epipolar line)에서 이를 비교하여 깊이 정보를 획득하는 방법이다. 모자이크 기법은 해리스 코너 검출 방법(harris corner detection)을 이용하여 영상의 특징점을 검출하고, 특징점 기술자(keypoint descriptor) 색인 분류 방법으로 연속 영상 간 특징점의 대응쌍을 찾고 상호 변환 관계를 추정하는 방법이다. 능동 스테레오 정합기법과 모자이크 기법을 이용하여 전체 연속 영상의 깊이 정보를 계산하였다. 이와 같은 방법으로 획득한 연속 영상의 깊이 정보를 영상의 색상, 질감 정보와 융합(blending)과정을 거쳐 최종 3차원 형상 정보로 복원하였다. 제안한 복원기법은 레이저 슬릿 빔과 스테레오 카메라를 사용함으로써 장소와 거리 제약 조건을 극복하여 용이하면서도 강인한 3차원 거리 정보를 획득할 수 있었다.

  • PDF

BRISK 기반의 눈 영상을 이용한 사람 인식 (Person Recognition using Ocular Image based on BRISK)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제19권5호
    • /
    • pp.881-889
    • /
    • 2016
  • Ocular region recently emerged as a new biometric trait for overcoming the limitations of iris recognition performance at the situation that cannot expect high user cooperation, because the acquisition of an ocular image does not require high user cooperation and close capture unlike an iris image. This study proposes a new method for ocular image recognition based on BRISK (binary robust invariant scalable keypoints). It uses the distance ratio of the two nearest neighbors to improve the accuracy of the detection of corresponding keypoint pairs, and it also uses geometric constraint for eliminating incorrect keypoint pairs. Experiments for evaluating the validity the proposed method were performed on MMU public database. The person recognition rate on left and right ocular image datasets showed 91.1% and 90.6% respectively. The performance represents about 5% higher accuracy than the SIFT-based method which has been widely used in a biometric field.

드론과 지상로봇 간의 협업을 위한 광학흐름 기반 마커 추적방법 (Optical Flow-Based Marker Tracking Algorithm for Collaboration Between Drone and Ground Vehicle)

  • 백종환;김상훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권3호
    • /
    • pp.107-112
    • /
    • 2018
  • 본 논문에서는 드론과 지상 로봇 간 효과적인 협업을 위하여 광학 흐름 기술 기반의 특징점 추적 알고리즘을 제안하였다. 드론의 비행 중 빠른 움직임에 의하여 많은 문제점이 발생하여 지상물체를 성공적으로 인식하기 위해 직관적이면서도 식별자를 가지고 있는 마커를 사용했다. 특징점 추출이 우수한 FAST알고리즘과 움직임 감지가 우수한 루카스-카나데 광학흐름 알고리즘의 장점들을 혼합하여 기존 특징점-특징량 기반 객체 추적 방법보다 개선된 속도의 실험결과를 보여준다. 또한 제안한 마커의 검출방법에 적절한 이진화 방법을 제안하여 주어진 마커에서의 검출 정확도를 개선하였으며, 추적속도는 유사한 환경의 기존연구보다 40% 이상 개선됨을 확인하였다. 또한 비행드론의 경량화와 속도개선에 문제가 없도록 최소형 고성능의 임베디드 환경을 선택하였으며, 제한된 개발환경에서도 물체검출과 추적 등 복잡한 연산이 가능하도록 동작환경에 대하여 연구하였다. 향후에는 다른 환경에서 빠르게 움직이는 두 로봇 간의 협업의 정확도를 향상시키기 위해 지능적 비전기능에 대해 추가할 예정이다.

HEVC 인트라 부호화를 위한 특징점 기반의 고속 CU Depth 결정 (Keypoint-based Fast CU Depth Decision for HEVC Intra Coding)

  • 김남욱;임성창;고현석;전병우
    • 전자공학회논문지
    • /
    • 제53권2호
    • /
    • pp.89-96
    • /
    • 2016
  • MPEG-H HEVC/ITU-T H.265는 quadtree 구조의 CU (Coding Unit)를 갖는 최신의 비디오 부호화 표준 기술이다. HEVC 부호화기는 모든 가능한 CU 구조에 대해서 Rate-distortion 최적화 과정을 통하여 최적 부호화 성능의 CU depth를 구할 수 있지만, 그 과정에 매우 많은 계산량을 필요로 한다. 본 연구에서는 컴퓨터 비젼 분야에서 잘 알려진 blob detection을 통하여 특징점을 찾는 과정이 저역 필터를 거치는 것과 같은 효과를 가진다는 것과 CU depth의 결정에는 영상의 고주파수 에너지 분포를 고려하는 것이 중요하다는 사실에 착안하여, blob detection 방법을 사용하여 추출된 특징점을 사용하여 HEVC 부호화기의 인트라 예측의 계산 복잡도를 낮추고자 한다. 실험을 통하여 all intra의 경우 0.45%의 BDBR 저하만으로 20% 정도의 부호화 시간을 절감할 수 있음을 보인다.

RGB-D 정보를 이용한 2차원 키포인트 탐지 기반 3차원 인간 자세 추정 방법 (A Method for 3D Human Pose Estimation based on 2D Keypoint Detection using RGB-D information)

  • 박서희;지명근;전준철
    • 인터넷정보학회논문지
    • /
    • 제19권6호
    • /
    • pp.41-51
    • /
    • 2018
  • 최근 영상 감시 분야에서는 지능형 영상 감시 시스템에 딥 러닝 기반 학습 방법이 적용되어 범죄, 화재, 이상 현상과 같은 다양한 이벤트들을 강건하게 탐지 할 수 있게 되었다. 그러나 3차원 실세계를 2차원 영상으로 투영시키면서 발생하는 3차원 정보의 손실로 인하여 폐색 문제가 발생하기 때문에 올바르게 객체를 탐지하고, 자세를 추정하기 위해서는 폐색 문제를 고려하는 것이 필요하다. 따라서 본 연구에서는 기존 RGB 정보에 깊이 정보를 추가하여 객체 탐지 과정에서 나타나는 폐색 문제를 해결하여 움직이는 객체를 탐지하고, 탐지된 영역에서 컨볼루션 신경망을 이용하여 인간의 관절 부위인 14개의 키포인트의 위치를 예측한다. 그 다음 자세 추정 과정에서 발생하는 자가 폐색 문제를 해결하기 위하여 2차원 키포인트 예측 결과와 심층 신경망을 이용하여 자세 추정의 범위를 3차원 공간상으로 확장함으로써 3차원 인간 자세 추정 방법을 설명한다. 향후, 본 연구의 2차원 및 3차원 자세 추정 결과는 인간 행위 인식을 위한 용이한 데이터로 사용되어 산업 기술 발달에 기여 할 수 있다.

2D Human Pose Estimation based on Object Detection using RGB-D information

  • Park, Seohee;Ji, Myunggeun;Chun, Junchul
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권2호
    • /
    • pp.800-816
    • /
    • 2018
  • In recent years, video surveillance research has been able to recognize various behaviors of pedestrians and analyze the overall situation of objects by combining image analysis technology and deep learning method. Human Activity Recognition (HAR), which is important issue in video surveillance research, is a field to detect abnormal behavior of pedestrians in CCTV environment. In order to recognize human behavior, it is necessary to detect the human in the image and to estimate the pose from the detected human. In this paper, we propose a novel approach for 2D Human Pose Estimation based on object detection using RGB-D information. By adding depth information to the RGB information that has some limitation in detecting object due to lack of topological information, we can improve the detecting accuracy. Subsequently, the rescaled region of the detected object is applied to ConVol.utional Pose Machines (CPM) which is a sequential prediction structure based on ConVol.utional Neural Network. We utilize CPM to generate belief maps to predict the positions of keypoint representing human body parts and to estimate human pose by detecting 14 key body points. From the experimental results, we can prove that the proposed method detects target objects robustly in occlusion. It is also possible to perform 2D human pose estimation by providing an accurately detected region as an input of the CPM. As for the future work, we will estimate the 3D human pose by mapping the 2D coordinate information on the body part onto the 3D space. Consequently, we can provide useful human behavior information in the research of HAR.

RGBD 카메라 기반의 Human-Skeleton Keypoints와 2-Stacked Bi-LSTM 모델을 이용한 낙상 탐지 (Fall Detection Based on 2-Stacked Bi-LSTM and Human-Skeleton Keypoints of RGBD Camera)

  • 신병근;김응호;이상우;양재영;김원겸
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.491-500
    • /
    • 2021
  • 본 연구에서는 MS Kinect v2 RGBD 카메라 기반의 Human-Skeleton Keypoints와 2-Stacked Bi-LSTM 모델을 이용하여 낙상 행위를 탐지하는 방법을 제안한다. 기존의 연구는 RGB 영상에서 OpenPose 등의 딥러닝 모델을 이용하여 골격 정보를 추출한 후 LSTM, GRU 등의 순환신경망 모델을 이용해 인식을 수행하였다. 제안한 방법은 카메라로부터 골격정보를 바로 전달 받아 가속도 및 거리의 2개의 시계열 특징을 추출한 후 2-Stacked Bi-LSTM 모델을 이용하여 낙상 행위를 인식하였다. 어깨, 척추, 골반 등 주요 골격을 대상으로 중심관절을 구하고 이 중심관절의 움직임 가속도와 바닥과의 거리를 특징으로 제안하였다. 추출된 특징은 Stacked LSTM, Bi-LSTM 등의 모델과 성능비교를 수행하였고 GRU, LSTM 등의 기존연구에 비해 향상된 검출 성능을 실험을 통해 증명하였다.

Distance Measurement Using the Kinect Sensor with Neuro-image Processing

  • Sharma, Kajal
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제4권6호
    • /
    • pp.379-383
    • /
    • 2015
  • This paper presents an approach to detect object distance with the use of the recently developed low-cost Kinect sensor. The technique is based on Kinect color depth-image processing and can be used to design various computer-vision applications, such as object recognition, video surveillance, and autonomous path finding. The proposed technique uses keypoint feature detection in the Kinect depth image and advantages of depth pixels to directly obtain the feature distance in the depth images. This highly reduces the computational overhead and obtains the pixel distance in the Kinect captured images.

SIFT와 다중측면히스토그램을 이용한 다중물체추적 (Multiple Object Tracking Using SIFT and Multi-Lateral Histogram)

  • 전정수;문용호;하석운
    • 대한임베디드공학회논문지
    • /
    • 제9권1호
    • /
    • pp.53-59
    • /
    • 2014
  • In multiple object tracking, accurate detection for each of objects that appear sequentially and effective tracking in complicated cases that they are overlapped with each other are very important. In this paper, we propose a multiple object tracking system that has a concrete detection and tracking characteristics by using multi-lateral histogram and SIFT feature extraction algorithm. Especially, by limiting the matching area to object's inside and by utilizing the location informations in the keypoint matching process of SIFT algorithm, we advanced the tracking performance for multiple objects. Based on the experimental results, we found that the proposed tracking system has a robust tracking operation in the complicated environments that multiple objects are frequently overlapped in various of directions.