• 제목/요약/키워드: Recognition Improvement

검색결과 1,496건 처리시간 0.029초

CNN을 적용한 조명변화에 강인한 얼굴인식 연구 (Research on Robust Face Recognition against Lighting Variation using CNN)

  • 김연호;박성욱;김도연
    • 한국전자통신학회논문지
    • /
    • 제12권2호
    • /
    • pp.325-330
    • /
    • 2017
  • 얼굴인식 기술은 지난 수십 년간 연구되어온 분야로서 보안, 엔터테인먼트, 모바일 서비스 등 다양한 영역에서 활용되고 있다. 얼굴인식 기술이 가진 주된 문제점은 밝기, 조명각도, 영상 회전등의 환경적 변화 요소에 따라 인식률이 현저하게 감소된다는 것이다. 따라서 본 논문에서는 최근 많은 계산량을 처리할 수 있는 컴퓨터 하드웨어와 알고리즘의 발전으로 재조명 받고 있는 CNN을 이용해 조명변화에 강인한 얼굴인식 방법을 제안하였다. 이후 성능검증을 위해 기존의 얼굴인식 알고리즘인 PCA, LBP, DCT와 결과 비교를 진행하였으며, 각각 9.82%, 11.6%, 4.54%의 성능 향상을 보였다. 또한 기존 신경망을 적용한 얼굴인식 연구결과 비교에서도 5.24%의 성능 향상을 기록하여 최종 인식률 99.25%를 달성하는 결과를 보였다.

On Wavelet Transform Based Feature Extraction for Speech Recognition Application

  • Kim, Jae-Gil
    • The Journal of the Acoustical Society of Korea
    • /
    • 제17권2E호
    • /
    • pp.31-37
    • /
    • 1998
  • This paper proposes a feature extraction method using wavelet transform for speech recognition. Speech recognition system generally carries out the recognition task based on speech features which are usually obtained via time-frequency representations such as Short-Time Fourier Transform (STFT) and Linear Predictive Coding(LPC). In some respects these methods may not be suitable for representing highly complex speech characteristics. They map the speech features with same may not frequency resolutions at all frequencies. Wavelet transform overcomes some of these limitations. Wavelet transform captures signal with fine time resolutions at high frequencies and fine frequency resolutions at low frequencies, which may present a significant advantage when analyzing highly localized speech events. Based on this motivation, this paper investigates the effectiveness of wavelet transform for feature extraction of wavelet transform for feature extraction focused on enhancing speech recognition. The proposed method is implemented using Sampled Continuous Wavelet Transform (SCWT) and its performance is tested on a speaker-independent isolated word recognizer that discerns 50 Korean words. In particular, the effect of mother wavelet employed and number of voices per octave on the performance of proposed method is investigated. Also the influence on the size of mother wavelet on the performance of proposed method is discussed. Throughout the experiments, the performance of proposed method is discussed. Throughout the experiments, the performance of proposed method is compared with the most prevalent conventional method, MFCC (Mel0frequency Cepstral Coefficient). The experiments show that the recognition performance of the proposed method is better than that of MFCC. But the improvement is marginal while, due to the dimensionality increase, the computational loads of proposed method is substantially greater than that of MFCC.

  • PDF

모바일 기기를 위한 음성인식의 사용자 적응형 후처리 (User Adaptive Post-Processing in Speech Recognition for Mobile Devices)

  • 김영진;김은주;김명원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권5호
    • /
    • pp.338-342
    • /
    • 2007
  • 본 논문에서는 모바일 환경에서 고립단어 음성인식을 할 경우 화자종속 방법을 이용하여 성능을 높이는 사용자 적응형 후처리 방법을 제안한다. 이 방법은 인식기의 정확한 인식 결과를 위한 추가적인 처리들로 구성된다. 즉 인식기의 출력과 정확한 최종 결과들 간의 관계를 학습하여 이를 잘못된 인식기의 출력을 수정하는 데에 사용한다. 학습에는 패턴인식에 강인한 다층 퍼셉트론을 사용하며 학습 시간을 고려하여 모델을 세분화하고 동적으로 동작할 수 있도록 구현한다. 이 결과 인식기의 오류에 대해 41%를 수정하는 성과(오류 수정률: 41%)를 보였다.

웨이블렛 변환을 이용한 음성에서의 감정 추출 및 인식 기법 (Emotion Recognition Method from Speech Signal Using the Wavelet Transform)

  • 고현주;이대종;박장환;전명근
    • 한국지능시스템학회논문지
    • /
    • 제14권2호
    • /
    • pp.150-155
    • /
    • 2004
  • 본 논문에서는 사람의 음성속에 내포된 6가지 기본 감정(기쁨, 슬픔, 화남, 놀람, 공포, 혐오)의 특징을 추출하고 인식하고자 한다. 제안한 감정인식 알고리즘은 웨이블렛 필터뱅크를 이용하여 각각의 감정별 코드북을 만들고, 인식단계에서 필터뱅크별 감정을 확인한 후 최종적으로 다중의사결정기법에 의해 감정을 인식하는 구조로 이루어져 있다. 이와 같은 웨이블렛 필터뱅크와 다중의사 결정기법에 기반을 둔 알고리즘의 유용성을 보이기 위해 실험에 사용된 음성은 20명의 화자로부터 6가지의 감정을 대상으로 각각 3번씩 발음한 감정음성을 녹음하여 총 360개의 데이터베이스로 구성하고 실험하였다. 이와 같이 제안한 알고리즘은 기존의 연구에 비해 5% 이상 향상된 인식률을 보였다.

앤트로피 거절을 활용한 음성인식 시스템의 성능 향상 (Improvement of Speech Recognition System using Entropy Rejection)

  • 송점동
    • 정보학연구
    • /
    • 제2권2호
    • /
    • pp.139-144
    • /
    • 1999
  • 본 논문은 음성인식 시스템에서 정확도를 높이기 위해 후처리 단계에서 후보 단어들의 엔트로피 정보를 이용하였다. 기존의 우도비 검출방법은 음성 데이터에 따라 음성인식 시스템의 성능이 변하고 N개의 후보단어들의 우도값이 비슷하여 오인식 발생확률이 높았다. 그러나 본 눈문에서는 각 후보 단어들의 엔트로피 값보다 인식대상 단어 외의 단어들의 엔트로피 값이 상대적으로 낮은 후보를 거절하는 후처리 방법을 사용하여 음성 데이터에 독립적이면서도 변별력을 높인 정확한 음성인식 시스템을 얻을 수 있었다. 실험 결과 본 논문에서 제안하는 엔트로피에 의한 후처리 방법은 우도비에 의한 방법보다 인식 시스템의 성능을 false alarm이 20%일 때 최대 3.6% 향상시킬 수 있었다.

  • PDF

한국어 음성인식 플랫폼(ECHOS)의 개선 및 평가 (Improvement and Evaluation of the Korean Large Vocabulary Continuous Speech Recognition Platform (ECHOS))

  • 권석봉;윤성락;장규철;김용래;김봉완;김회린;유창동;이용주;권오욱
    • 대한음성학회지:말소리
    • /
    • 제59호
    • /
    • pp.53-68
    • /
    • 2006
  • We report the evaluation results of the Korean speech recognition platform called ECHOS. The platform has an object-oriented and reusable architecture so that researchers can easily evaluate their own algorithms. The platform has all intrinsic modules to build a large vocabulary speech recognizer: Noise reduction, end-point detection, feature extraction, hidden Markov model (HMM)-based acoustic modeling, cross-word modeling, n-gram language modeling, n-best search, word graph generation, and Korean-specific language processing. The platform supports both lexical search trees and finite-state networks. It performs word-dependent n-best search with bigram in the forward search stage, and rescores the lattice with trigram in the backward stage. In an 8000-word continuous speech recognition task, the platform with a lexical tree increases 40% of word errors but decreases 50% of recognition time compared to the HTK platform with flat lexicon. ECHOS reduces 40% of recognition errors through incorporation of cross-word modeling. With the number of Gaussian mixtures increasing to 16, it yields word accuracy comparable to the previous lexical tree-based platform, Julius.

  • PDF

가버 텐서를 이용한 얼굴인식 성능 개선 (Efficiency Improvement on Face Recognition using Gabor Tensor)

  • 박경준;고형화
    • 한국통신학회논문지
    • /
    • 제35권9C호
    • /
    • pp.748-755
    • /
    • 2010
  • 본 논문은 가버 텐서(Gabor tensor)를 이용한 얼굴인식 시스템을 제안하였다. 가버 변환은 얼굴 고유의 특징을 잘 나타내주며 외부적인 영향을 줄일 수 있어 인식률 향상에 기여한다. 이러한 특징을 이용한 3차원의 텐서를 구성하여 얼굴인식을 수행하는 방법을 제안한다. 3차원의 가버 텐서를 입력으로 하여 기존의 1차원이나 2차원 주성분 분석법(PCA)보다 다양한 특징을 이용할 수 있는 다중선형 주성분 분석법(Multilinear PCA)를 수행한 다음 선형 판별법(LDA)을 수행하는 얼굴인식 방법을 제안하였다. 이러한 방법들은 표정이나 조명등의 변화에 강인한 특성을 가진다. 제안한 방법은 매트랩(Matlab)을 이용하여 실험하였다. ORL과 Yale 데이터베이스를 이용한 실험 결과를 기존의 방법들과 비교하였을 경우 제안한 방법이 기본적인 1차원 주성분 분석법보다 최대 9~27% 향상된 우수한 인식성능을 나타냄을 확인할 수 있었다.

GMM 지원을 위해 k-means 알고리즘을 이용한 어휘 인식 성능 개선 (Vocabulary Recognition Performance Improvement using k-means Algorithm for GMM Support)

  • 이종섭
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.135-140
    • /
    • 2015
  • 일반적인 CHMM 어휘 인식 시스템은 어휘 인식에 대한 모델들의 관측 확률 인식률이 낮고, 일부 단위 음소 모델에만 적용되어 제한적으로 사용되는 문제점이 있다. 또한, 어휘 탐색에서 어휘의 의미가 다양하여 탐색된 어휘가 사용자의 요구에 부합되지 않는 문제점을 가진다. 이러한 문제를 개선하기 위해 GMM(Gaussian Mixture Model)을 이용한 음소인식을 수행하고, 개선된 k-means 알고리즘을 이용하여 어휘 특성에 따른 제한적인 탐색 문제점을 해결하였다. 성능 실험은 기존의 시스템과 비교하여 정확도와 재현율로 대변되는 효과성을 측정하였으며, 성능 실험 결과 정확도는 83%, 재현율은 67%로 나타났다.

감정 상호작용 로봇을 위한 신뢰도 평가를 이용한 화자독립 감정인식 (Speech Emotion Recognition Using Confidence Level for Emotional Interaction Robot)

  • 김은호
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.755-759
    • /
    • 2009
  • 인간의 감정을 인식하는 기술은 인간-로봇 상호작용 분야의 중요한 연구주제 중 하나이다. 특히, 화자독립 감정인식은 음성감정인식의 상용화를 위해 꼭 필요한 중요한 이슈이다. 일반적으로, 화자독립 감정인식 시스템은 화자종속 시스템과 비교하여 감정특징 값들의 화자 그리고 성별에 따른 변화로 인하여 낮은 인식률을 보인다. 따라서 본 논문에서는 신뢰도 평가방법을 이용한 감정인식결과의 거절 방법을 사용하여 화자독립 감정인식 시스템을 일관되고 정확하게 구현할 수 있는 방법을 제시한다. 또한, 제안된 방법과 기존 방법의 비교를 통하여 제안된 방법의 효율성 및 가능성을 검증한다.

가정과 교사의 가정교과교육의 일반적 성격에 관한 인식과 관련변인 (Recognition of Middle School Home Economics Teachers on Home Economics Education and 1ts Related Variables)

  • 이종이
    • 한국가정과교육학회지
    • /
    • 제9권2호
    • /
    • pp.31-45
    • /
    • 1997
  • The theoretical rationale and basic materials for the improvement of the recognition on home economics teachers are suggested in this study through the close examination of the teacher’s recognition and its related variables. For this study, review of literature and questionnaire survey were performed. As the results, the following may be suggested. 1. There teachers more experienced and non-majored the home economics or those who finished professional course should be reeducated adequately for new direction of home economics education in secondary school and new curriculum. 2. The development of qualification for home economics teacher and the educational system and program for training preliminary should be try to find a solution to improve the new and positive recognition of home economics education in secondary school. 3. The institutional and environmental conditions, such as pay and welfare facilities, should be improved to satisfy home economics teacher with new view of home economics education in secondary school with their duties. 4. The systematic and concrete teaching programs for contents of improving new recognition of home economics education in secondary school, and for promoting positive self-recognition as home economics teacher, and for training the abilities of developing teaching materials and guiding practical techniques should be developed.

  • PDF