• Title/Summary/Keyword: Shape Descriptor

검색결과 103건 처리시간 0.027초

능동 스테레오 비젼을 이용한 실내환경의 3차원 형상 재구성 알고리즘 (A Study on the 3D Shape Reconstruction Algorithm of an Indoor Environment Using Active Stereo Vision)

  • 변기원;주재흠;남기곤
    • 융합신호처리학회논문지
    • /
    • 제10권1호
    • /
    • pp.13-22
    • /
    • 2009
  • 본 연구에서는 레이저 슬릿 빔을 이용한 능동 스테레오 정합 기법과 모자이크 기법을 결합한 3차원 형상 복원 기법을 제안한다. 능동 스테레오 정합 기법은 레이저 슬릿 빔이 조사된 좌, 우 영상에서 색상과 밝기 변화를 분석하여 레이저 라인의 위치정보를 검출하고, 등극선(epipolar line)에서 이를 비교하여 깊이 정보를 획득하는 방법이다. 모자이크 기법은 해리스 코너 검출 방법(harris corner detection)을 이용하여 영상의 특징점을 검출하고, 특징점 기술자(keypoint descriptor) 색인 분류 방법으로 연속 영상 간 특징점의 대응쌍을 찾고 상호 변환 관계를 추정하는 방법이다. 능동 스테레오 정합기법과 모자이크 기법을 이용하여 전체 연속 영상의 깊이 정보를 계산하였다. 이와 같은 방법으로 획득한 연속 영상의 깊이 정보를 영상의 색상, 질감 정보와 융합(blending)과정을 거쳐 최종 3차원 형상 정보로 복원하였다. 제안한 복원기법은 레이저 슬릿 빔과 스테레오 카메라를 사용함으로써 장소와 거리 제약 조건을 극복하여 용이하면서도 강인한 3차원 거리 정보를 획득할 수 있었다.

  • PDF

형태와 텍스쳐 특징을 조합한 나뭇잎 분류 시스템의 성능 평가 (Performance Evaluations for Leaf Classification Using Combined Features of Shape and Texture)

  • 김선종;김동필
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.1-12
    • /
    • 2012
  • 길 옆이나 공원 또는 조경시설에는 많은 나무들을 포함하고 있다. 비록 많은 나무들이 쉽게 우리 주변에서 보이지만, 일반인들이 그 나무의 이름, 종류 및 정보들을 얻기가 힘든 경우도 있다. 나무의 이름이나 정보를 얻기 위하여 인터넷이나 서적을 이용하여 찾아 분류하여야 한다. 나무의 구성 요소는 잎, 꽃, 수피 등이 있는데, 일반적으로 나무의 잎을 이용하여 분류할 수 있다. 이는 잎이 형태, 잎맥 등의 정보를 포함하고 있기 때문이다. 잎의 형태는 나무의 종류를 결정하는데 중요한 역할을 하며, 또한 잎맥을 포함한 텍스쳐도 나무의 종류를 분류하는데 유용하게 사용된다. 본 논문에서는 형태와 텍스쳐를 조합한 특징들을 이용한 잎 분류 시스템에 대한 성능을 평가하였다. 형태 특징으로는 푸리에 기술자를 이용하였고, 텍스쳐 특징으로는 GLCM 또는 웨이브릿 기술자, 그리고 그들의 조합을 사용하였다. 그리고 사용된 데이터는 인터넷에서 용이하게 구할 수 있고, 분류 성능평가에 사용되는 Flavia 잎 데이터 셋을 사용하였다. 형태와 텍스쳐를 기반으로 하는 다양한 조합을 가진 분류 시스템의 성능을 인식률과 PR(precision-recall) 지수로 평가하고, 성능을 비교하였다. 성능평가 결과, 형태와 텍스쳐를 조합한 특징들을 갖는 시스템의 성능이 조합하지 않은 시스템의 성능보다 나아짐을 알 수 있었다.

누적 히스토그램을 이용한 3차원 물체의 부재 검색 (3D partial object retrieval using cumulative histogram)

  • 은성종;현대환;이기정;황보택근
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.669-672
    • /
    • 2009
  • 제안된 방법은 3차원 모델로부터 형상 기술자를 추출하고, 형상의 유사성을 비교하기 위해 특징 기술자를 이용한다. 대부분의 검색 방법들은 데이터베이스에서 개별적인 3차원 모델의 비교와 검색에 중점이 되어있지만, 본 유사성 검색 방법은 형상 유사성을 이용하여 3차원 물체의 부재 비교와 검색에 초점이 맞추었다. 물체의 부재 유사성 검색 방법은 3차원 모델들의 유사한 부분을 찾는 것과 유사한 부분을 포함하는 3차원 모델을 찾는 것으로 확장된다. 성능 평가를 위한 실험에서 유사한 3차원 석탑 모델의 부재를 효과적으로 검색하였다.

  • PDF

2차원 모양 정보를 이용한 3차원 물체 검색 시스템 (3D Object Retrieval System Using 2D Shape Information)

  • 임삼;추현곤;최민석;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.57-60
    • /
    • 2001
  • In this paper, we propose a new 3D object retrieval system using the shape information of 2D silhouette images. 2D images at different view points are derived from a 3D model and linked to the model. Shape feature of 2D image is extracted by a region-based descriptor. In the experiment, we compare the results of the proposed system with those of the system using curvature scale space(CSS) to show the efficiency of our system.

  • PDF

영역분할에 의한 Zernike Moments 모양정보 기술자 (Zernike Moments Shape Descriptor with Region Partitioning)

  • 김종득;김해광
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 학술대회
    • /
    • pp.53-57
    • /
    • 1999
  • 모양정보는 사람이 물체를 구분하는 특징 중 하나이며 Zernike moments등의 방법으로 그 특징을 표현한다. 본 논문에서는 기존의 Zernike moment 방법을 수정하여 입력 모양정보를 내부 모양정보와 외부 모양정보로 분리하여 각각의 영역에 대해서 특징을 추출한다. 그리고 두 모양정보의 유사도를 계산하는 과정에서 내부 모양정보와 외부 모양정보의 특징에 각각 다른 가중치를 적용함으로써 사용자의 의도에 가장 적합한 질의 결과를 얻을 수 있는 새로운 기능성을 부여하여 검색의 효율성을 높였다. 실험 결과 기존의 Zernike moments 방법에 비해서 최대 12 %의 성능 향상이 있음을 보였다.

  • PDF

칼라영상의 감성평가와 이를 이용한 내용기반 영상검색 (Emotion from Color images and Its Application to Content-based Image Retrievals)

  • 박중수;엄경배;신경해;이준환;박동선
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.179-188
    • /
    • 2003
  • 내용기반 영상검색에서 질의는 영상 그 자체이며 질의와 유사한 영상을 찾는 방식으로 검색이 진행된다. 즉 사용자가 검색을 원하는 영상의 색, 형태, 질감 또는 이들의 공간적인 배치 등의 내용을 염두에 두고 있어야 검색이 가능하다. 이러한 검색방법은 사용자가 검색대상의 내용을 상당 부분 파악하고 있어야 검색이 가능하다는 제약을 수반한다. 본 논문에서는 사용자가 영상이 제공하는 감성을 이용하여 칼라영상을 검색하는 방법을 제안한다. 제안된 방법은 검색과 감성평가가 relevance feedback을 통하여 동시에 진행됨으로 기존의 내용기반 영상검색과 통합이 용이하며, 사용자의 주관적인 평가가 이루어질 수 있다는 점에서 과거의 감성기반 칼라영상 검색과 차이가 있다. 본 논문에서 제안한 검색기의 평가를 위해 영상속성으로 MPEG-7의 칼라 기술자(descriptor)를 사용하였으며 "깨끗한" "밝은" "재미있는", "포근한" 등의 감성형용사를 적용한 결과 1500개의 벽지영상을 대상으로 만족할 만한 결과를 얻을 수 있었다.과 1500개의 벽지영상을 대상으로 만족할 만한 결과를 얻을 수 있었다.

Infrared Target Recognition using Heterogeneous Features with Multi-kernel Transfer Learning

  • Wang, Xin;Zhang, Xin;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3762-3781
    • /
    • 2020
  • Infrared pedestrian target recognition is a vital problem of significant interest in computer vision. In this work, a novel infrared pedestrian target recognition method that uses heterogeneous features with multi-kernel transfer learning is proposed. Firstly, to exploit the characteristics of infrared pedestrian targets fully, a novel multi-scale monogenic filtering-based completed local binary pattern descriptor, referred to as MSMF-CLBP, is designed to extract the texture information, and then an improved histogram of oriented gradient-fisher vector descriptor, referred to as HOG-FV, is proposed to extract the shape information. Second, to enrich the semantic content of feature expression, these two heterogeneous features are integrated to get more complete representation for infrared pedestrian targets. Third, to overcome the defects, such as poor generalization, scarcity of tagged infrared samples, distributional and semantic deviations between the training and testing samples, of the state-of-the-art classifiers, an effective multi-kernel transfer learning classifier called MK-TrAdaBoost is designed. Experimental results show that the proposed method outperforms many state-of-the-art recognition approaches for infrared pedestrian targets.

Convolutional Neural Network Based Multi-feature Fusion for Non-rigid 3D Model Retrieval

  • Zeng, Hui;Liu, Yanrong;Li, Siqi;Che, JianYong;Wang, Xiuqing
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.176-190
    • /
    • 2018
  • This paper presents a novel convolutional neural network based multi-feature fusion learning method for non-rigid 3D model retrieval, which can investigate the useful discriminative information of the heat kernel signature (HKS) descriptor and the wave kernel signature (WKS) descriptor. At first, we compute the 2D shape distributions of the two kinds of descriptors to represent the 3D model and use them as the input to the networks. Then we construct two convolutional neural networks for the HKS distribution and the WKS distribution separately, and use the multi-feature fusion layer to connect them. The fusion layer not only can exploit more discriminative characteristics of the two descriptors, but also can complement the correlated information between the two kinds of descriptors. Furthermore, to further improve the performance of the description ability, the cross-connected layer is built to combine the low-level features with high-level features. Extensive experiments have validated the effectiveness of the designed multi-feature fusion learning method.

Video Representation via Fusion of Static and Motion Features Applied to Human Activity Recognition

  • Arif, Sheeraz;Wang, Jing;Fei, Zesong;Hussain, Fida
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권7호
    • /
    • pp.3599-3619
    • /
    • 2019
  • In human activity recognition system both static and motion information play crucial role for efficient and competitive results. Most of the existing methods are insufficient to extract video features and unable to investigate the level of contribution of both (Static and Motion) components. Our work highlights this problem and proposes Static-Motion fused features descriptor (SMFD), which intelligently leverages both static and motion features in the form of descriptor. First, static features are learned by two-stream 3D convolutional neural network. Second, trajectories are extracted by tracking key points and only those trajectories have been selected which are located in central region of the original video frame in order to to reduce irrelevant background trajectories as well computational complexity. Then, shape and motion descriptors are obtained along with key points by using SIFT flow. Next, cholesky transformation is introduced to fuse static and motion feature vectors to guarantee the equal contribution of all descriptors. Finally, Long Short-Term Memory (LSTM) network is utilized to discover long-term temporal dependencies and final prediction. To confirm the effectiveness of the proposed approach, extensive experiments have been conducted on three well-known datasets i.e. UCF101, HMDB51 and YouTube. Findings shows that the resulting recognition system is on par with state-of-the-art methods.

내용기반 이미지 검색을 위한 색상, 텍스쳐, 에지 기능의 통합 (Integrating Color, Texture and Edge Features for Content-Based Image Retrieval)

  • 마명;박동원
    • 감성과학
    • /
    • 제7권4호
    • /
    • pp.57-65
    • /
    • 2004
  • 본 논문에서는 color, texture, shape의 정보를 통합 이용하여 내용기반 영상검색 시스템의 성능을 향상시키는 기법을 고찰하였다. 먼저 영상에 내재되어 있는 color를 분석 추출하여 몇 개의 대표색으로 요약 표현한 다음, 이를 활용한 근사치 측정도를 고안하였다. Texture정보 분석에 있어서는 영상의 주축 행렬 데이터를 통계적 접근 방법으로 추출하였다. Edge분석의 방법으로는 Edge 막대그래프에서 색상변환, 양자화, 필터링에 관련된 정보를 선행처리 후 Edge 정보를 추출하였다. 마지막으로, 본 연구의 결과인 내용기반 영상검색 시스템의 효율성을 precision-recall 분석과 실험적 결과를 통하여 입증하였다.

  • PDF