• Title/Summary/Keyword: 특징 정규화

Search Result 357, Processing Time 0.025 seconds

Vector Quantizer Based Speaker Normalization for Continuos Speech Recognition (연속음성 인식기를 위한 벡터양자화기 기반의 화자정규화)

  • Shin Ok-keun
    • The Journal of the Acoustical Society of Korea
    • /
    • v.23 no.8
    • /
    • pp.583-589
    • /
    • 2004
  • Proposed is a speaker normalization method based on vector quantizer for continuous speech recognition (CSR) system in which no acoustic information is made use of. The proposed method, which is an improvement of the previously reported speaker normalization scheme for a simple digit recognizer, builds up a canonical codebook by iteratively training the codebook while the size of codebook is increased after each iteration from a relatively small initial size. Once the codebook established, the warp factors of speakers are estimated by comparing exhaustively the warped versions of each speaker's utterance with the codebook. Two sets of phones are used to estimate the warp factors: one, a set of vowels only. and the other, a set composed of all the Phonemes. A Piecewise linear warping function which corresponds to the estimated warp factor is adopted to warp the power spectrum of the utterance. Then the warped feature vectors are extracted to be used to train and to test the speech recognizer. The effectiveness of the proposed method is investigated by a set of recognition experiments using the TIMIT corpus and HTK speech recognition tool kit. The experimental results showed comparable recognition rate improvement with the formant based warping method.

Rotation, Translation and Scale-Invariant Human Iris Recognition System (회전, 이동, 크기에 불변한 홍채 인식 시스템)

  • 김응주;조성원
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.11a
    • /
    • pp.293-296
    • /
    • 2000
  • 본 논문에서는 최근 신원확인 수단으로 각광받고 있는 생체인식 중 가장 신뢰도가 높은 홍채인식에 관한 연구에 대해 기술하고 있다. 비접촉식 홍채인식 시스템의 경우 홍채영상의 획득 시 사람의 머리가 기울어지거나 움직임에 따라 영상이 좌측 혹은 우측으로 조금씩 회전, 혹은 이동하거나 크기가 달라지게 된다. 이런 경우 동일인의 홍채영상도 매번 조금씩 달라지게 되므로, 정확한 인식을 위해서는 획득된 각 영상의 정규화 과정과 함께 회전된 영상에 대한 보완 등의 전처리 과정이 매우 중요하다. 영상 필터를 통한 정확한 외곽 경계의 검출과 정규화, 비교방법을 통해 이를 보완하고, 웨이블렛 변환을 이용하여 특징값을 얻은 후 검증 실험 결과를 보임으로써 회전, 이동, 크기에 무관한 홍채 인식 방법을 제안하고자 한다.

  • PDF

Eye Detection Based on Texture Information (텍스처 기반의 눈 검출 기법)

  • Park, Chan-Woo;Park, Hyun;Moon, Young-Shik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.315-318
    • /
    • 2007
  • 자동 얼굴 인식, 표정 인식과 같은 얼굴 영상과 관련된 다양한 연구 분야는 일반적으로 입력 얼굴 영상에 대한 정규화가 필요하다. 사람의 얼굴은 표정, 조명 등에 따라 다양한 형태변화가 있어 입력 영상 마다 정확한 대표 특징 점을 찾는 것은 어려운 문제이다. 특히 감고 있는 눈이나 작은 눈 등은 검출하기 어렵기 때문에 얼굴 관련 연구에서 성능을 저하시키는 주요한 원인이 되고 있다. 이에 다양한 변화에 강건한 눈 검출을 위하여 본 논문에서는 눈의 텍스처 정보를 이용한 눈 검출 방법을 제안한다. 얼굴 영역에서 눈의 텍스처가 갖는 특성을 정의하고 두 가지 형태의 Eye 필터를 정의하였다. 제안된 방법은 Adaboost 기반의 얼굴 영역 검출 단계, 조명 정규화 단계, Eye 필터를 이용한 눈 후보 영역 검출 단계, 눈 위치 점 검출 단계 등 총 4단계로 구성된다. 실험 결과들은 제안된 방법이 얼굴의 자세, 표정, 조명 상태 등에 강건한 검출 결과를 보여주며 감은 눈 영상에서도 강건한 결과를 보여준다.

  • PDF

Regression Model With High Reliability by Using Neural Networks (신경망을 이용한 고신뢰성의 회귀분석 모델)

  • Jo, Yong-Hyeon
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.327-334
    • /
    • 2001
  • 본 논문에서는 기울기하강과 동적터널링이 조합된 학습알고리즘의 다층신경망을 이용한 고신회성의 회귀분석 모델을 제안하였다. 기울기하강은 빠른 수렴속도의 최적화가 가능하도록 하기 위함이고, 동적터널링은 국소최적해를 만났을 때 이를 벗어난 새로운 연결가중치를 설정하여 전역최적해로 수렴되도록 하기 위함이다. 또한 대용량의 입력 데이터를 통계적으로 독립인 특징들의 집합으로 변환시키는 주요성분분석 기법의 속성을 살려 학습데이터의 차원을 감소시킴으로서 고차원의 학습데이터에 따른 회귀분석 모델의 제약도 동시에 해결하였다. 제안된 기법의 신경망을 3개의 독립변수 패턴을 가진 암모니아 제조공정문제와 10개의 독립변수 패턴을 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 기존의 역전과 알고리즘의 신경망이나 주요성분분석에 의한 차원을 감소시키지 않은 학습패턴을 이용한 신경망보다 각각 더욱 우수한 학습성능과 회귀성능이 있음을 확인할 수 있었다. 또한 학습패턴의 영평균 정규화로 회귀용 신경망의 성능을 더욱 더 개선하였다.

  • PDF

Speech Recognition in Noisy Environments Using Modified Gain Function (변형된 이득함수를 이용한 잡음 환경에서의 음성인식)

  • Jin, Ho-Sung;Lee, Sang-Ho;Hong, Jae-Keun
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.05a
    • /
    • pp.119-123
    • /
    • 2010
  • 본 논문에서는 2단계 잡음제거 방법의 이득함수를 이용한 고조파 복원 잡음제거 방법의 이득함수를 조정하여 기존의 방법보다 음성개선을 향상시켰고, 제안한 방법으로 개선된 음성을 음성인식 기술에 적용하였다. 본 논문에서는 기존 방법으로 음성개선 결과 묵음구간에서 음성구간으로 변화는 구간에서 이전 프레임의 추정된 음성신호로 스펙트럼의 이득함수가 구해져서 음성이 발생하는 구간에서 왜곡이 발생한다. 따라서 본 논문에서는 이러한 현상을 개선시키기 위해 2단계 잡음제거 방법의 이득함수를 추정된 a priori SNR과 비교하여 이득함수를 조정하고, 2단계 잡음제거 방법의 이득함수를 고조파 복원 방법의 이득함수와 비교하여 이득함수를 조정하여 음성을 개선하는 방법을 제안하였다. 그리고 음성인식을 위한 특징벡터 추출을 위해 제안한 방법으로 개선된 음성의 대수 에너지를 정규화 하는 대수 에너지 정규화 방법(Log Energy Normalization)을 음성인식 방법에 적용하였다.

  • PDF

Unsupervised Classification of KOMPSAT EOC Imagery Based on Independent Component Analysis (독립 요소 분석 기반의 KOMPSAT EOC영상 무감독 분류)

  • 변승건;이호영;이쾌희
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2003.04a
    • /
    • pp.581-587
    • /
    • 2003
  • 독립 요소 분석 (Independent Component Analysis: ICA)는 텍스처를 의미 있는 특징으로 변환하는 강인한 영상 필터를 생성하기 위한 확률적 방법이다. ICA는 고차통계적 특성을 사용하여 ICA 필터와 독립 요소를 동시에 학습한다. 제안한 분류 방법은 fast ICA 알고리즘을 사용하여 KOMPSAT 영상으로부터 ICA 필터를 생성한 다음, 필터에 의해 투영된 텍스처들의 특징들을 독립 평면상에서 무감독 방법으로 분류한다. KOMPSAT 영상은 텍스처 성분이 뚜렷하지 않는 영역이 존재하기 때문에 본 논문에서는 투영된 특징 값들과 윈도우 내의 정규화된 평균 화소값으로 특징 벡터를 재구성하였다. 분류 방법으로는 K-means 클러스터링을 적용하였다. 6.6m 해상도를 가진 KOMPSAT 흑백 영상에 대해 제안한 방법은 우수한 분류 성능을 보인다.

  • PDF

A Technique for Shape Features Extraction Using the Discrete Cosine Transform (이산 코사인 변환을 이용한 형태 특징 추출 기법)

  • Kim, Kyung-Su;Lee, Yung-Sin;Kim, Yong-Kuk;Lee, Yun-Bae;Kim, Pan-Ku
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.5
    • /
    • pp.1357-1366
    • /
    • 1998
  • In this paper, we propose the method that extract shape features using the DCT(Discrete Cosine Transform) via simple invariant normalization. To retrieve effectively, we used measures, circularity and eccentricity, as filters to reduce the number of retrieved images. The experimental results show that our method is better than the methods of Fourier Descriptors and Moment Invariant for various leaf images.

  • PDF

Off-line recognition of Hanguls handprinted in sammool style with statistical feature extraction method (통계적 특징 추출 방법을 이용한 샘물체 필기 한글의 오프라인 인식)

  • Lee, Seong-Whan;Park, Jeong-Seon
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.237-248
    • /
    • 1992
  • 본 논문에서는 통계적인 특징 추출 방법을 사용하여 샘물체로 필기된 한글을 고속으로 인식하는 방법을 소개한다. 대부분이 직선 성분으로 이루어진 한글의 특성을 이응하기 위하여 입력 영상으로부터 수평, 수직, 사선, 역사선의 방향 성분을 추출하며, 검은 화소의 밀도에 따라 동적으로 그물을 결정함으로써 획 간의 접촉 변형에 무관한 특징 벡터를 추출한다. 이와 같은 통계적 특징 추출 방법은 크기 정규화나 세선화 과정이 필요없으며, 또한 샘물체라는 필기 형태의 제약에 의해 정합 대상 부류의 수가 현저히 줄어들기 때문에 인식에 소요되는 시간을 상당히 줄일 수 있음은 물론, 인식률을 향상시켰다. 제안된 방법의 타당성을 검증하기 위하여 샘물체로 필기된 KS 완성형 한글 2,350자에 대해 실험한 결과, 평균 90% 이상의 인식률을 보이며, IBM PC 486(33MHz)상에서 문자당 평균 0.17초의 인식 속도를 보임으로써, 실용적인 고속 OCR 시스템의 개발 가능성을 확인할 수 있었다.

  • PDF

Emotion Recognition of User using 2D Face Image in the Mobile Robot (이동로봇에서의 2D얼굴 영상을 이용한 사용자의 감정인식)

  • Lee, Dong-Hun;Seo, Sang-Uk;Go, Gwang-Eun;Sim, Gwi-Bo
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.11a
    • /
    • pp.131-134
    • /
    • 2006
  • 본 논문에서는 가정용 로봇 및 서비스 로봇과 같은 이동로봇에서 사용자의 감정을 인식하는 방법중 한가지인 얼굴영상을 이용한 감정인식 방법을 제안한다. 얼굴영상인식을 위하여 얼굴의 여러 가지 특징(눈썹, 눈, 코, 입)의 움직임 및 위치를 이용하며, 이동로봇에서 움직이는 사용자를 인식하기 위한 움직임 추적 알고리즘을 구현하고, 획득된 사용자의 영상에서 얼굴영역 검출 알고리즘을 사용하여 얼굴 영역을 제외한 손과 배경 영상의 피부색은 제거한다. 검출된 얼굴영역의 거리에 따른 영상 확대 및 축소, 얼굴 각도에 따른 영상 회전변환 등의 정규화 작업을 거친 후 이동 로봇에서는 항상 고정된 크기의 얼굴 영상을 획득 할 수 있도록 한다. 또한 기존의 특징점 추출이나 히스토그램을 이용한 감정인식 방법을 혼합하여 인간의 감성 인식 시스템을 모방한 로봇에서의 감정인식을 수행한다. 본 논문에서는 이러한 다중 특징점 추출 방식을 통하여 이동로봇에서의 얼굴 영상을 이용한 사용자의 감정인식 시스템을 제안한다.

  • PDF

Enhancement of the Correctness of Marker Detection and Marker Recognition based on Artificial Neural Network (인공신경망을 이용한 마커 검출 및 인식의 정확도 개선)

  • Kang, Sun-Kyung;Kim, Young-Un;So, In-Mi;Jung, Sung-Tae
    • Journal of the Korea Society of Computer and Information
    • /
    • v.13 no.1
    • /
    • pp.89-97
    • /
    • 2008
  • In this paper, we present a method for the enhancement of marker detection correctness and marker recognition speed by using artificial neural network. Contours of objects are extracted from the input image. They are approximated to a list of line segments. Quadrangles are found with the geometrical features of the approximated line segments. They are normalized into exact squares by using the warping technique and scale transformation. Feature vectors are extracted from the square image by using principal component analysis. Artincial neural network is used to checks if the square image is a marker image or a non-marker image. After that, the type of marker is recognized by using an artificial neural network. Experimental results show that the proposed method enhances the correctness of the marker detection and recognition.

  • PDF