• 제목/요약/키워드: Feature extraction Template matching

검색결과 22건 처리시간 0.037초

특징정보 분석을 통한 실시간 얼굴인식 (Realtime Face Recognition by Analysis of Feature Information)

  • 정재모;배현;김성신
    • 한국지능시스템학회논문지
    • /
    • 제11권9호
    • /
    • pp.822-826
    • /
    • 2001
  • The statistical analysis of the feature extraction and the neural networks are proposed to recognize a human face. In the preprocessing step, the normalized skin color map with Gaussian functions is employed to extract the region of face candidate. The feature information in the region of the face candidate is used to detect the face region. In the recognition step, as a tested, the 120 images of 10 persons are trained by the backpropagation algorithm. The images of each person are obtained from the various direction, pose, and facial expression. Input variables of the neural networks are the geometrical feature information and the feature information that comes from the eigenface spaces. The simulation results of 10 persons show that the proposed method yields high recognition rates.

  • PDF

독립성분 분석 계수의 합성에 의한 가변 얼굴 생체정보 생성 방법 (Generation of Changeable Face Template by Combining Independent Component Analysis Coefficients)

  • 정민이;이철한;최정윤;김재희
    • 대한전자공학회논문지SP
    • /
    • 제44권6호
    • /
    • pp.16-23
    • /
    • 2007
  • 개인 인증 방법 중 하나인 생체인식(Biometrics)은 개인 생체정보의 수가 한정되어 있기 때문에 생체정보의 도난 시 프라이버시 침해라는 문제를 가진다. 이 문제를 해결하기 위해 등장한 개념이 가변 생체인식(Changeable biometrics)이다. 가변 생체 인식은 생체정보가 훼손당했을 경우 새로운 생체정보로 대체하기 어렵다는 생체인식의 가장 큰 단점을 보완하기 위한 방법으로 원 생체정보가 아닌 변환된 생체정보로 개인을 인증한다. 이 논문에서는 가변 생체인식 가운데 얼굴인식을 위한 가변 생체인식에 대해 제안한다. 기존에 알려진 얼굴인식의 방법 가운데 하나인 외형 기반 기법(Appearance-based method) 중 독립성분 분석(Independent Component Analysis)의 계수(coefficient)를 변형하는 방법을 제안한다. 제안된 얼굴 생체정보 생성 방법은 계수의 일부분을 가우시안 분포(Gaussian distribution)에 따른 임의의 값으로 치환한 후 계수의 순서를 임의로 변경하여 무수히 많은 가변 얼굴 정보를 생성할 수 있도록 하였고 서로 다르게 변경된 계수들을 서로 합성함으로써 비가역성(Non-invertibility)을 만족시키려고 시도했다.

의미론적 분할된 항공 사진을 활용한 영상 기반 항법 (Vision-based Navigation using Semantically Segmented Aerial Images)

  • 홍경우;김성중;박준우;방효충;허준회;김진원;박장호;서송원
    • 한국항공우주학회지
    • /
    • 제48권10호
    • /
    • pp.783-789
    • /
    • 2020
  • 영상 기반 항법은 GPS/INS 통합 항법 시스템의 취약점을 보강할 수 있는 보조 항법 기술로 비행체에서 촬영한 항공 영상과 기존의 데이터베이스를 비교하여 비행체의 위치를 구한다. 하지만 데이터베이스가 생성된 시점은 항공 영상 촬영 시점과 다를 수밖에 없으며, 이러한 시점 차이로 인해 두 영상 간의 다른 특징점들이 생성된다. 즉, 유사하지만 다른 두 영상이므로 일반적인 영상 대조 알고리즘을 항법 문제에 적용하기 힘들다. 따라서 본 논문에서는 인공지능 기법인 의미론적 분할을 활용하여 항공 영상에서 항법에 필요한 정보를 분류한 후 영상 대조를 수행하는 방법을 제안한다. 의미론적 분할로 시점 변화, 촬영 조건 변화가 있더라도 강건하게 두 영상이 정합 되도록 한다. 제안한 방법은 시뮬레이션과 비행 실험을 통해 성능을 확인하며, 일반적인 영상 대조 알고리즘을 이용하여 항법을 수행한 결과와 비교한다.

얼굴인식 기술동향 (Face Recognition: A Survey)

  • 문현준
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 3부
    • /
    • pp.172-177
    • /
    • 2008
  • 생체 인식은 개인의 고유한 생체 정보를 획득하여 개인 식별에 이용하는 기술로, 그중 얼굴 인식은 사용자의 편의성과 비강제성이라는 장점이 있는 응용기술로 평가 받고 있다. 본 논문에서는 얼굴인식 기술동향을 살펴보고 얼굴 영역 추출, 특정 추출, 매칭을 포함한 시스템에 대해 논한다. 얼굴 영역 추출에는 얼굴 형판 정합 방법과 얼굴 요소의 검출에 의한 방법을, 특정 추출에서는 PCA 와 LDA 등의 방법을, 그리고 매칭을 통한 인증 단계에서는 최근접 분류기를 소개한다. 다양한 얼굴 인식 기법들이 제시됨에 따라 공인된 성능 평가 방법이 필요하게 되는데, 대용량 표준 얼굴 DE의 구축과 얼굴 인식 성능 평가 방법 개발의 필요성을 제시한다. 향후 얼굴인식 시스템에서는 조명, 자세, 표정의 변화를 어떻게 보정하여 인식 할 것인가 하는 것이 연구되어야 할 핵심 분야로서 3차원 얼굴 영상 복원 기술을 통한 해결방법을 살펴본다.

  • PDF

Robust Facial Expression Recognition Based on Local Directional Pattern

  • Jabid, Taskeed;Kabir, Md. Hasanul;Chae, Oksam
    • ETRI Journal
    • /
    • 제32권5호
    • /
    • pp.784-794
    • /
    • 2010
  • Automatic facial expression recognition has many potential applications in different areas of human computer interaction. However, they are not yet fully realized due to the lack of an effective facial feature descriptor. In this paper, we present a new appearance-based feature descriptor, the local directional pattern (LDP), to represent facial geometry and analyze its performance in expression recognition. An LDP feature is obtained by computing the edge response values in 8 directions at each pixel and encoding them into an 8 bit binary number using the relative strength of these edge responses. The LDP descriptor, a distribution of LDP codes within an image or image patch, is used to describe each expression image. The effectiveness of dimensionality reduction techniques, such as principal component analysis and AdaBoost, is also analyzed in terms of computational cost saving and classification accuracy. Two well-known machine learning methods, template matching and support vector machine, are used for classification using the Cohn-Kanade and Japanese female facial expression databases. Better classification accuracy shows the superiority of LDP descriptor against other appearance-based feature descriptors.

Face Image Compression using Generalized Hebbian Algorithm of Non-Parsed Image

  • Kyung Hwa lee;Seo, Seok-Bae;Kim, Daijin;Kang, Dae-Seong
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -2
    • /
    • pp.847-850
    • /
    • 2000
  • This paper proposes an image compressing and template matching algorithm for face image using GHA (Generalized Hebbian Algorithm). GHA is a part of PCA (Principal Component Analysis), that has single-layer perceptrons and operates and self-organizing performance. We used this algorithm for feature extraction of face shape, and our simulations verify the high performance for the proposed method. The shape for face in the fact that the eigenvector of face image can be efficiently represented as a coefficient that can be acquired by a set of basis is to compress data of image. From the simulation results, the mean PSNR performance is 24.08[dB] at 0.047bpp, and reconstruction experiment shows that good reconstruction capacity for an image that not joins at leaning.

  • PDF

숫자의 형태 이해와 분할된 FSOM을 이용한 필기 숫자 인식에 관한 연구 (A Study On Handwritten Numeral Recognition Using Numeral Shape Grasp and Divided FSOM)

  • 서석배;김대진;강대성
    • 한국통신학회논문지
    • /
    • 제24권8B호
    • /
    • pp.1490-1499
    • /
    • 1999
  • 본 논문에서는 필기숫자의 형태와 FSOM을 이용한 새로운 필기숫자 인식 알고리즘을 제안한다. 제안한 알고리즘은 비슷한 형태를 가지는 숫자는 같은 그룹으로 분류된다는 사실에 기초한 알고리즘으로, 필기숫자의 외접선에 의한 형태결정과 템플레이트 매칭을 이용하여 필기숫자 데이터를 여러 개의 그룹으로 분할하고 분할된 각 그룹별로 인식 알고리즘을 적용한다. 본 실험에서는 필기숫자의 데이터를 16개의 그룹으로 분류하였으며, 분류된 그룹별로 각각의 특징추출과 SOM의 단점을 보완한 FSOM을 적용하였다. 분할된 16개의 FSOM은 각 그룹별로 독립적인 학습이 가능한 특징뿐만 아니라 한 그룹씩 단계적으로 학습을 할 수 있는 장점이 있다. 제안한 알고리즘의 성능을 입증하기 위해서 Concordia 대학의 필기 숫자 데이터를 사용하여 실험하였다.

  • PDF

색상분할 및 객체 특징정보의 계층적 적용에 의한 신호등 및 속도 표지판 인식 (Traffic Light and Speed Sign Recognition by using Hierarchical Application of Color Segmentation and Object Feature Information)

  • 이강호;방민영;이규원
    • 정보처리학회논문지B
    • /
    • 제17B권3호
    • /
    • pp.207-214
    • /
    • 2010
  • 본 논문에서는 실제 도로환경의 신호등 및 속도표지판 영역 검출 및 인식 방법을 제안하였다. 밝기정보 및 HIS 컬러모델에기반한 색상정보를 이용하여 신호등을 인식하였다. 또한 HSI 컬러정보로부터 적색강도를 추정함으로써 속도 표지판을 검출하였다. 표지판의 경사여부를 판단하여 시계방향, 반시계방향으로 각각 표지판을 회전시켜 기울기를 보정한 후 인식을 행함으로써 인식률을 제고하였다. 도로환경의 동영상을 대상으로 인식을 행한 결과 신호등과 속도표지판이 혼합된 영상에서도 매우 강건한 인식 결과를 보인다.

A Comparative Study on OCR using Super-Resolution for Small Fonts

  • Cho, Wooyeong;Kwon, Juwon;Kwon, Soonchu;Yoo, Jisang
    • International journal of advanced smart convergence
    • /
    • 제8권3호
    • /
    • pp.95-101
    • /
    • 2019
  • Recently, there have been many issues related to text recognition using Tesseract. One of these issues is that the text recognition accuracy is significantly lower for smaller fonts. Tesseract extracts text by creating an outline with direction in the image. By searching the Tesseract database, template matching with characters with similar feature points is used to select the character with the lowest error. Because of the poor text extraction, the recognition accuracy is lowerd. In this paper, we compared text recognition accuracy after applying various super-resolution methods to smaller text images and experimented with how the recognition accuracy varies for various image size. In order to recognize small Korean text images, we have used super-resolution algorithms based on deep learning models such as SRCNN, ESRCNN, DSRCNN, and DCSCN. The dataset for training and testing consisted of Korean-based scanned images. The images was resized from 0.5 times to 0.8 times with 12pt font size. The experiment was performed on x0.5 resized images, and the experimental result showed that DCSCN super-resolution is the most efficient method to reduce precision error rate by 7.8%, and reduce the recall error rate by 8.4%. The experimental results have demonstrated that the accuracy of text recognition for smaller Korean fonts can be improved by adding super-resolution methods to the OCR preprocessing module.

축구 경기 분석 I : 영상 모자익을 통한 축구 선수의 운동장 궤적 추출 (Soccer Game Analysis I : Extraction of Soccer Players' ground traces using Image Mosaic)

  • 김태원;홍기상
    • 전자공학회논문지S
    • /
    • 제36S권1호
    • /
    • pp.51-59
    • /
    • 1999
  • 본 논문에서는 축구 경기 자동 분석을 위한 첫걸음으로 일반적인 축구 경기 영상열에서 선수 및 공을 추적하고 영상 모자의 기법을 이용해서 운동장 모델 상에서 선수가 움직인 궤적을 알아내는 기법을 제시한다. 여기서 일반걱인 축구 경기 영상열이란 극도의 zoom-in 또는 zoom-out 아닌 경우로 TV 카메라가 공을 쫓아 자연스럽게 움직이는 상황의 영상을 말한다. 이러한 영상열로부터 선수의 궤적을 구하기 위해선 다음과 같이 크게 세 가지 문제를 해결해야한다. 첫째로 입력 영상에서 운동장 부분을 추출하는 문제, 둘째로 선수 및 공을 추적하고 선수들의 팀을 구분하는 문제, 마지막으로 영상에서의 선수의 위치를 실제 운동장 좌표로의 변환을 통해 선수가 움직인 자취를 운동장 모델 상에서 구하는 문제가 그것이다. 운동장의 추출은 칼라 정보를 이용하였고 이 추출된 운동장 영역 하에서 템플릿 매칭과 Kalman 필터링을 이용하여 선수와 공을 추적했다. 선수간 겹침 문제에 대해서는 CHBP(Color Histogram Back-Projection) 기법을 적용했다. 특히 선수가 운동장에서 움직인 궤적을 구하기 구하기 위해서 입력 영상에서 보이는 특징점들을 이용하여 운동장 모델 좌표와 입력 영상 좌표간의 변환을 구하고 이를 통해 운동장 모델에서의 선수의 위치를 구했다. 이때에 입력 영상에서 특징점이 충분치 않을 경우 영상 모자익 기법을 이용하여 특징점이 보이는 영상과의 좌표 변환 관계를 구함으로써 해결하였다. 실험적으로 실제 TV에서 방영된 축구 경기 영상열에 제안된 방법을 적용하여 얻어진 결과를 보인다.

  • PDF