• 제목/요약/키워드: Local Descriptors

검색결과 63건 처리시간 0.027초

방향 회전에 불변한 얼굴 영역 분할과 LBP를 이용한 얼굴 검출 (Face Detection using Orientation(In-Plane Rotation) Invariant Facial Region Segmentation and Local Binary Patterns(LBP))

  • 이희재;김하영;이다빛;이상국
    • 정보과학회 논문지
    • /
    • 제44권7호
    • /
    • pp.692-702
    • /
    • 2017
  • LBP기반 특징점 기술자를 이용한 얼굴검출은 얼굴의 형태정보 및 눈, 코, 입과 같은 얼굴 요소들 간 공간정보를 표현할 수 없는 문제가 있다. 이러한 문제를 해결하기 위해 선행 연구들은 얼굴 영상을 다수개의 사각형 부분영역들로 분할하였다. 하지만, 연구마다 서로 다른 개수와 크기로 부분 영역을 분할하였기 때문에 실험에 사용하는 데이터베이스에 적합한 부분 영역의 분할 기준이 모호하며, 부분 영역의 수에 비례하여 LBP 히스토그램 차원이 증가되고, 부분 영역의 개수가 증가함에 따라 얼굴의 방향 회전에 대한 민감도가 크게 증가한다. 본 논문은 LBP기반 특징점 기술자의 방향 회전 문제와 특징점 차원의 수 문제를 해결할 수 있는 새로운 부분 영역 분할 방법을 제안한다. 실험 결과, 제안하는 방법은 방향 회전된 단일 얼굴 영상에서 99.0278%의 검출 정확도를 보였다.

얼굴인식을 위한 어파인 불변 지역 서술자 (Affine Invariant Local Descriptors for Face Recognition)

  • 고용빈;이효종
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권9호
    • /
    • pp.375-380
    • /
    • 2014
  • 오늘날 촬영 상황을 조절할 수 있는 환경, 즉 고정된 촬영각이나 일관된 조도 조건에서는 얼굴인식 기술 수준은 신뢰할 수 있을 정도로 높다. 그러나 복잡한 현실에서의 얼굴 인식은 여전히 어려운 과제이다. SIFT 알고리즘은 촬영각의 변화가 미미할 때에 한하여, 크기와 회전 변화에 무관하게 우수한 성능을 보여주고 있다. 본 논문에서는 다양하게 촬영각이 변하는 환경에서도 얼굴 인식을 할 수 있는 어파인 불변 지역 서술자를 탐지하는 ASIFT(Affine SIFT)라는 알고리즘을 적용하였다. SIFT 알고리즘을 확장하여 만든 ASIFT 알고리즘은 촬영각 변화에 취약한 단점을 극복하였다. 제안하는 방법에서 ASIFT 알고리즘은 표본 이미지에, SIFT 알고리즘은 검증 이미지에 적용하였다. ASIFT 방법은 어파인 변환을 사용하여 다양한 시각에 따른 영상을 생성할 수 있기 때문에 ASIFT 알고리즘은 저장 영상과 실험 영상의 시각 차이에 따른 문제를 해결할 수 있었다. 실험결과 FERET 데이터를 사용했을 때 제안한 방법은 촬영각의 변화가 큰 경우에 기존의 시프트 알고리즘보다도 높은 인식률을 보여주었다.

Action Recognition with deep network features and dimension reduction

  • Li, Lijun;Dai, Shuling
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권2호
    • /
    • pp.832-854
    • /
    • 2019
  • Action recognition has been studied in computer vision field for years. We present an effective approach to recognize actions using a dimension reduction method, which is applied as a crucial step to reduce the dimensionality of feature descriptors after extracting features. We propose to use sparse matrix and randomized kd-tree to modify it and then propose modified Local Fisher Discriminant Analysis (mLFDA) method which greatly reduces the required memory and accelerate the standard Local Fisher Discriminant Analysis. For feature encoding, we propose a useful encoding method called mix encoding which combines Fisher vector encoding and locality-constrained linear coding to get the final video representations. In order to add more meaningful features to the process of action recognition, the convolutional neural network is utilized and combined with mix encoding to produce the deep network feature. Experimental results show that our algorithm is a competitive method on KTH dataset, HMDB51 dataset and UCF101 dataset when combining all these methods.

Elimination of Grapevine leafroll associated virus-3, Grapevine rupestris stem pitting associated virus and Grapevine virus A from a Tunisian Cultivar by Somatic Embryogenesis and Characterization of the Somaclones Using Ampelographic Descriptors

  • Bouamama-Gzara, Badra;Selmi, Ilhem;Chebil, Samir;Melki, Imene;Mliki, Ahmed;Ghorbel, Abdelwahed;Carra, Angela;Carimi, Francesco;Mahfoudhi, Naima
    • The Plant Pathology Journal
    • /
    • 제33권6호
    • /
    • pp.561-571
    • /
    • 2017
  • Prospecting of local grapevine (Vitis vinifera L.) germplasm revealed that Tunisia possesses a rich patrimony which presents diversified organoleptic characteristics. However, viral diseases seriously affect all local grapevine cultivars which risk a complete extinction. Sanitation programs need to be established to preserve and exploit, as a gene pool, the Tunisian vineyards areas. The presence of the Grapevine leafroll associated virus-3 (GLRaV-3), Grapevine stem pitting associated virus (GRSPaV) and Grapevine virus A (GVA), were confirmed in a Tunisian grapevine cultivar using serological and molecular analyses. The association between GRSPaV and GVA viruses induces more rugose wood symptoms and damages. For this reason the cleansing of the infected cultivar is highly advisable. Direct and recurrent somatic embryos of cv. 'Hencha' were successfully induced from filament, when cultured on $Ch{\acute{e}}e$and Pool (1987). based-medium, enriched with $2mg1^{-1}$ of 2,4-dichlorophenoxyacetic acid and $2.5mg1^{-1}$ of Thidiazuron, after 36 weeks of culture. After six months of acclimatization, RT-PCR carried on 50 somaplants confirmed the absence of GVA, GRSPaV as well as GLRaV-3 viruses in all somaplants. Ampelographic analysis, based on eight OIV descriptors, was carried out on two years acclimated somaplants, compared to the mother plant. Results demonstrated that the shape and contours of 46 somaclones leaves are identical to mother plant leaves and four phenotypically off-type plants were observed. The healthy state of 100% 'Hencha' somaclones and the high percentage of phenotypically true-to-type plants demonstrate that somatic embryogenesis is a promising technique to adopt for grapevine viruses elimination.

지역 특징 히스토그램 기반 영상식별자와 GPU 가속화 (Image Identifier based on Local Feature's Histogram and Acceleration Technique using GPU)

  • 전혁준;서용석;황치정
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권9호
    • /
    • pp.889-897
    • /
    • 2010
  • 현대의 대량화된 영상 관리 시스템은 영상의 특징을 표현하는 영상식별자에 대해 왜곡에 강인하며 빠른 검색 속도, 정확성 및 효율적인 저장 등의 기본 성능을 요구한다. 영상식별자 설계 방법은 기하학적 왜곡에 강인한 지역 방식과 빠른 검색 및 적은 저장 용량의 속성을 지닌 전역방식으로 구분 할 수 있다. 본 논문에서는 왜곡에 강하고 지역적 공간적 제약으로 인한 서로간의 차별성이 강화된 지역 기술자들로부터 각각 개개 차원의 특징 분포도를 분석하여, 두 영상간의 유사도를 빠르고 정확하게 측정할 수 있는 지역 기술자 및 전역 기술자의 속성을 가지고 있는 LFH(Local Feature's Histogram)기반 영상식별자를 제안한다. 또한 GPU를 사용하여 LFH를 구현하는 방법을 제시하며, 제안한 LFH와 대표적인 지역, 전역 방식인 SIFT 및 EHD 방식과 저장용량, 추출 시간, 검색 속도 및 정확률에 대한 성능을 비교하였다.

색상의 공간적인 상관관계와 국부적인 푸리에 변환에 기반한 질감 특성을 이용한 영상 검색 (Image Retrieval Using Spatial Color Correlation and Texture Characteristics Based on Local Fourier Transform)

  • 박기태;문영식
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.10-16
    • /
    • 2007
  • 본 논문에서는 색상의 공간적인 상관관계와 질감 모멘트를 이용한 내용기반 영상 검색 기법을 제안한다. 이를 위해, 색상의 공간적인 상관관계를 표현하는 새로운 색상 기술자를 제안하고, 또한 제안된 색상 기술자와 국부적인 푸리에 변환에 기반한 질감 특성을 결합한 영상 검색 방법을 제안한다. 일반적으로 색상의 공간적인 상관관계를 표현하기 위해서 컬러 코렐로그램(color correlogram)이 사용되고 있다. 하지만 컬러 코렐로그램은 중심화소에 따른 이웃한 화소들의 색상 분포를 확률적으로 잘 나타내는 장점이 있지만, 색상의 구조적인 정보를 표현하지 못하는 단점이 있다. 그러므로 본 논문에서는 색상의 분포와 구조적인 정보를 표시할 수 있는 새로운 색상 기술자를 제안한다. 제안하는 새로운 색상 기술자는 중심 화소와 이웃 화소들과의 색상 거리를 계산한 후 최소 거리의 색상과 최대 거리의 색상을 추출한 후 최소-최대 색상 쌍이 이루는 각에 대한 각각의 빈도수를 계산한다. 그런 다음, 각각의 이루는 각에 대해서 최소 거리 색상에 대한 최대 거리 색상들의 평균값과 분산값으로 구성된 새로운 기술자(min-max color correlation descriptor, MMCCD)를 생성한다. 제안한 색상 기술자를 이용하여 검색한 결과는 기존 방법들과 비교했을 경우 정확률에서 최소 5.2%에서 최대 13.21% 향상된 검색 결과를 확인할 수 있었다. 또한, 국부적인 푸리에 변환에 기반한 질감 기술자를 새로운 색상 기술자와 결합하여 특징 벡터의 크기를 절반으로 줄이면서도 새로운 색상 기술자만을 사용할 경우와 비교하여 향상된 검색 결과를 확인할 수 있었다.

Robust Facial Expression Recognition Based on Local Directional Pattern

  • Jabid, Taskeed;Kabir, Md. Hasanul;Chae, Oksam
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.784-794
    • /
    • 2010
  • Automatic facial expression recognition has many potential applications in different areas of human computer interaction. However, they are not yet fully realized due to the lack of an effective facial feature descriptor. In this paper, we present a new appearance-based feature descriptor, the local directional pattern (LDP), to represent facial geometry and analyze its performance in expression recognition. An LDP feature is obtained by computing the edge response values in 8 directions at each pixel and encoding them into an 8 bit binary number using the relative strength of these edge responses. The LDP descriptor, a distribution of LDP codes within an image or image patch, is used to describe each expression image. The effectiveness of dimensionality reduction techniques, such as principal component analysis and AdaBoost, is also analyzed in terms of computational cost saving and classification accuracy. Two well-known machine learning methods, template matching and support vector machine, are used for classification using the Cohn-Kanade and Japanese female facial expression databases. Better classification accuracy shows the superiority of LDP descriptor against other appearance-based feature descriptors.

MPEG-7을 위한 에지 히스토그램 서술자 (An Edge Histogram Descriptor for MPEG-7)

  • 박동권;전윤석;박수준;원치선
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.31-40
    • /
    • 2000
  • 본 논문에서는 MPEG-7의 여러 가지 서술자 중 영상의 에지 정보를 효과적으로 표현하기 위한 에지 히스토그램 서술자를 제안한다. 영상에서 추출된 에지 정보를 효율적으로 서술하기 위하여 영상 전체(global), 부분 영역(semi-global), 그리고 국부(local) 영역에 대한 에지 히스토그램으로 구분하여 에지 히스토그램 서술자의 구조를 채택하였다. 또한, 제안된 서술자의 에지 검출 기법은 기존의 픽셀단위 검출 방법과는 달리 블록단위 에지 검출을 사용함으로써 에지 특징의 추출 속도를 높이며 블록을 압축의 기본단위로 하는 MPEG-1, 2의 압축 비트스트림에서도 빠른 속도로 직접 에지 특징을 검출할 수 있는 장점이 있다. 제안된 방법이 MPEG-7의 비균질 질감 서술자로써 같은 부류에 속하는 웨이브릿 기반 서술자 및 국부 에지 기반 서술자와 비교하여 검색 효율과 특징 추출 속도가 모두 우수함을 실험을 통해 확인하였다.

  • PDF

Robust Features and Accurate Inliers Detection Framework: Application to Stereo Ego-motion Estimation

  • MIN, Haigen;ZHAO, Xiangmo;XU, Zhigang;ZHANG, Licheng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권1호
    • /
    • pp.302-320
    • /
    • 2017
  • In this paper, an innovative robust feature detection and matching strategy for visual odometry based on stereo image sequence is proposed. First, a sparse multiscale 2D local invariant feature detection and description algorithm AKAZE is adopted to extract the interest points. A robust feature matching strategy is introduced to match AKAZE descriptors. In order to remove the outliers which are mismatched features or on dynamic objects, an improved random sample consensus outlier rejection scheme is presented. Thus the proposed method can be applied to dynamic environment. Then, geometric constraints are incorporated into the motion estimation without time-consuming 3-dimensional scene reconstruction. Last, an iterated sigma point Kalman Filter is adopted to refine the motion results. The presented ego-motion scheme is applied to benchmark datasets and compared with state-of-the-art approaches with data captured on campus in a considerably cluttered environment, where the superiorities are proved.

Shape Description and Retrieval Using Included-Angular Ternary Pattern

  • Xu, Guoqing;Xiao, Ke;Li, Chen
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.737-747
    • /
    • 2019
  • Shape description is an important and fundamental issue in content-based image retrieval (CBIR), and a number of shape description methods have been reported in the literature. For shape description, both global information and local contour variations play important roles. In this paper a new included-angular ternary pattern (IATP) based shape descriptor is proposed for shape image retrieval. For each point on the shape contour, IATP is derived from its neighbor points, and IATP has good properties for shape description. IATP is intrinsically invariant to rotation, translation and scaling. To enhance the description capability, multiscale IATP histogram is presented to describe both local and global information of shape. Then multiscale IATP histogram is combined with included-angular histogram for efficient shape retrieval. In the matching stage, cosine distance is used to measure shape features' similarity. Image retrieval experiments are conducted on the standard MPEG-7 shape database and Swedish leaf database. And the shape image retrieval performance of the proposed method is compared with other shape descriptors using the standard evaluation method. The experimental results of shape retrieval indicate that the proposed method reaches higher precision at the same recall value compared with other description method.