• Title, Summary, Keyword: 음성인식

Search Result 2,234, Processing Time 0.055 seconds

Design and Implementation of Bimodal System using Face and Audio (얼굴과 음성 정보를 이용한 바이모달 시스템 설계 및 구현)

  • Kim, Myung-Hun;Lee, Chi-Geun;Jung, Sung-Tae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • /
    • pp.701-704
    • /
    • 2005
  • 최근 들어 바이모달 인식에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 음성과 얼굴을 이용하여 바이모달 시스템을 구현하였다. 얼굴인식은 객체 분류 기법인 SVM을 이용하여 얼굴을 검출 및 인식하였으며, 음성인식은 HMM을 이용하여 음성인식을 하였다. 각기 인식된 결과에 대해 합성을 통하여 잡음에 의해 낮아지는 음성 인식률을 얼굴 인식과 같이 사용함으로서, 전체적인 인식률 향상을 볼 수 있다.

  • PDF

A Korean Large Vocabulary Speech Recognition System for Automatic Telephone Number Query Service (자동 전화번호 안내를 위한 한국어 대용량 음성 인식 시스템)

  • 구준모;김형순;은종관
    • The Journal of the Acoustical Society of Korea
    • /
    • v.11 no.1E
    • /
    • pp.86-97
    • /
    • 1992
  • 인식어휘수가 1160단어이며 자동 전화번호 안내에 사용될 수 있는 한국어 대용량 음성 인식 시 스템에 관하여 소개하였다. 이 시스템은 네 개의 부시스템으로 구성되어 있다. 첫 번째는 HMM 방식으 로 입력음성중의 단어를 인식하는 처리부에서 인식할 어휘를 제한하므로써 인식시간을 감축시켜 주는 인식 시간 감축부이다. 이 부시스템은 언어학적 정보뿐만 아니라 음향학적 정보도 이용한다. 마지막은 음성인식 시스템의 파라미터를 새로운 화자의 음성에 신속하게 적응시켜 주는 화자적응부이다. 마지막 부시스템은 VQ 적응방식과 스펙트럼 mapping 방식에 근거한 HMM 파라미터 적응방식을 이용한다. 또 한, 본 논문에서는 대용량 음성인식 시스템의 성능을 향상시키기 위한 최근의 연구결과들에 관하여 살 펴보았다. 이 연구들은 화자 독립 음성인식을 위한 음향학적 처리부와 인식 시간 감축부의 성능향상에 초점이 맞추어져 있다. 마지막으로 화자적응을 위한 새로운 연구결과라도 기술하였다.

  • PDF

한국어 음성인식

  • 정차균
    • The Magazine of the IEIE
    • /
    • v.24 no.9
    • /
    • pp.75-82
    • /
    • 1997
  • 한국어 음성인식기술은 1980년대를 전후로 비약적인 발전을 하여왔다. 본 논문에서는 한국어 음성인식에 적용된 기술을 검토하고, 문제점을 고찰해서 향후 한국어 음성인식의 나아갈 방향을 조명해 본다.

  • PDF

Speaker Recognition Technique by Extracting Speech Feature Vector using Wiener Filter Method (위너필터 방법을 사용한 음성 특징 벡터 추출에 의한 화자인식 기법)

  • Choi, Jae-seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • /
    • pp.617-618
    • /
    • 2017
  • 음성인식의 적절한 성능을 구하기 위하여 잡음환경 하에서 최적인 음성의 특징 벡터를 선택할 필요가 있다. 본 논문에서는 위너필터 방법과 인간의 청각계의 특성을 활용한 멜 주파수 켑스트럼 계수를 사용한 음성인식 방법을 제안한다. 본 논문에서 제안하는 음성의 특징 벡터는 음성 중에서 배경잡음을 제거한 후에 깨끗한 음성신호의 벡터를 추출하는 방법이며, 다층 퍼셉트론 신경회로망에 멜 주파수 켑스트럼 계수를 입력하여 학습시킴으로써 음성인식을 구현한다. 본 실험에서는 멜 주파수 켑스트럼 계수의 특징 벡터를 사용하여 백색잡음이 혼합된 경우에 대하여 음성인식 실험을 실시하였다.

  • PDF

음성인식 연구의 국내외 연구현황과 전망

  • 정현열
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • /
    • pp.23-30
    • /
    • 1998
  • 음성인식기술이 어떻게 변천되어 왔는가를 살펴보고, 음성인식 연구에 관한 최근의 국내외 연구동향과 앞으로의 전망에 관하여 논하고자 한다. 국외의 경우 국가적 차원에서 대규모 프로젝트를 중심으로 연구가 진행되어 음성인식 기술이 크게 발전하여 현재 일부 실용화 시스템이 개발되어 사용되고 있다. 국내의 경우 1980년대부터 비교적 활발한 연구가 이루어져 최근 몇 년간 많은 발전을 가져왔다. 최근에는 대어휘 연속음성인식에서도 신뢰할 만한 결과가 많이 보고되고 있으며, 음성 인식 기술 뿐만 아니라 멀티미디어 기술을 이용한 다양한 휴먼 인터페이스를 제공하는 보다 편리한 휴대용 단말기에 관한 연구도 활발해지고 있다.

  • PDF

Parallel Speech Recognition on Distributed Memory Multiprocessors (분산 메모리 다중 프로세서 상에서의 병렬 음성인식)

  • 윤지현;홍성태;정상화;김형순
    • Proceedings of the Korean Information Science Society Conference
    • /
    • /
    • pp.747-749
    • /
    • 1998
  • 본 논문에서는 음성과 자연언어의 통합처리를 위한 효과적인 병렬 계산 모델을 제안한다. 음소모델은 continuous HMM에 기반을 둔 문맥종속형 음소를 사용하며, 언어모델은 knowledge-based approach를 사용한다. 또한 계층구조의 지식베이스상에서 다수의 가설을 처리하기 위해 memory-based parsing기술을 사용하였다. 본 연구의 병렬 음성인식 알고리즘은 분산메모리 MIMD 구조의 다중 Transputer 시스템을 이용하여 구현되었다. 실험을 통하여 음성인식 과정에서 발생하는 speech-specific problem의 해를 제공하고 음성인식 시스템의 병렬화를 통하여 실시간 음성인식의 가능성을 보여준다.

  • PDF

Information Retrieval System Using Korean Speech Recognition on the Web Browser (웹 브라우저 상에서 한국어 음성인식을 이용한 정보검색 시스템)

  • 이항섭
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • /
    • pp.35-38
    • /
    • 1998
  • 웹 브라우저 상에서 한국어 음성인식을 이용한 정보검색 시스템에 대한 것이다. 이 시스템의 특징은 웹 브라우저 상에서 보여지는 Hypertext Word를 인식할 수 있는 거승로 기존의 웹 브라우저를 마우스 click 대신 음성인식을 이용하여 사용할 수 있다는 것이다. 웹 브라우저를 통해서 보여지는 고정되지 않고 계속 하여 변화하는 인식후보를 인식하기 위해 당 연구실에서 개발한 가변 어휘 인식기를 사용하였다. 시스템은 windows 95/NT 환경에서 개발되었으며, 사용자가 새로운 인터페이스를 배울 필요 없이 바로 사용할 수 있도록 사용자 편의성 부분도 고려하여 개발되었다. 개발된 시스템은 독립 환경, 독립 화자에 대해 실험한 결과 130여개의 단어에 대해 편균 90% 정도의 인식성능을 보인다.

  • PDF

음성에 의한 Man-Machine Communication 기술의 현황

  • 은종관
    • The Magazine of the IEIE
    • /
    • v.15 no.2
    • /
    • pp.75-87
    • /
    • 1988
  • 본 논문에서는 음성에 의한 man-machine communication의 핵심기술인 음성인식 및 합성의 전반적인 기술에 관하여 그 현황을 알아본다. 먼저 음성인식에서 해결되어야 할 문제점들을 고찰하고 격리단어 인식, 연결단어 인식, 그리고 연속언어 인식의 기술현황을 기술한다. 격리단어 인식에서는 pattern matching 방법에서 사용되는 입력어휘의 특징 추출, reference와의 유사도 측정, 유사도 측정 결과에 의한 인식결정에 관해서 논한다. 연결단어 및 연속언어 인식에서는 현재 연구가 되고 있는 "bottom-up approach"와 "top-down approach"에 관해서 설명하고 이들 방법의 어려운 점들을 고찰한다. 다음 음성 합성에서는 기존의 여러 가지 합성 방식을 검토하고 이들의 장단점을 기술한다. 마지막으로 한 예로서 한국어 text-to-speech 변환 시스템에 관하여 기술한다.

  • PDF

Design of Multi-Purpose Preprocessor for Keyword Spotting and Continuous Language Support in Korean (한국어 핵심어 추출 및 연속 음성 인식을 위한 다목적 전처리 프로세서 설계)

  • Kim, Dong-Heon;Lee, Sang-Joon
    • Journal of Digital Convergence
    • /
    • v.11 no.1
    • /
    • pp.225-236
    • /
    • 2013
  • The voice recognition has been made continuously. Now, this technology could support even natural language beyond recognition of isolated words. Interests for the voice recognition was boosting after the Siri, I-phone based voice recognition software, was presented in 2010. There are some occasions implemented voice enabled services using Korean voice recognition softwares, but their accuracy isn't accurate enough, because of background noise and lack of control on voice related features. In this paper, we propose a sort of multi-purpose preprocessor to improve this situation. This supports Keyword spotting in the continuous speech in addition to noise filtering function. This should be independent of any voice recognition software and it can extend its functionality to support continuous speech by additionally identifying the pre-predicate and the post-predicate in relative to the spotted keyword. We get validation about noise filter effectiveness, keyword recognition rate, continuous speech recognition rate by experiments.

Speech Identification of Male and Female Speakers in Noisy Speech for Improving Performance of Speech Recognition System (음성인식 시스템의 성능 향상을 위한 잡음음성의 남성 및 여성화자의 음성식별)

  • Choi, Jae-seung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • /
    • pp.619-620
    • /
    • 2017
  • 본 논문에서는 음성인식 알고리즘에 매우 중요한 정보를 제공하는 화자의 성별인식을 위하여 신경회로망을 사용하여 잡음 환경 하에서 남성음성 및 여성음성의 화자를 식별하는 성별인식 알고리즘을 제안한다. 본 논문에서 제안하는 신경회로망은 MFCC의 계수를 사용하여 음성의 각 구간에서 남성음성 및 여성음성의 화자를 인식할 수 있는 알고리즘이다. 실험결과로부터 백색잡음이 중첩된 잡음환경 하에서 음성신호의 MFCC의 특징벡터를 사용함으로써 남성음성 및 여성음성의 화자에 대해서 양호한 성별인식 결과가 구해졌다.

  • PDF