• 제목/요약/키워드: 음성인식알고리즘

검색결과 447건 처리시간 0.025초

선형예측계수를 사용한 화자인식 (Speaker Recognition using Linear Prediction Coefficient)

  • 최재승;정병구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.509-511
    • /
    • 2011
  • 본 논문에서는 다층 퍼셉트론 신경회로망과 선형예측계수를 사용한 화자인식 알고리즘을 제안한다. 제안하는 화자인식 알고리즘은 입력받은 음성신호에 대해서 유성음 구간을 추출한다. 추출된 유성음구간에 대하여 선형예측 분석에 의하여 화자의 특성을 가지고 있는 선형예측계수를 구한다. 구해진 선형예측계수를 분류하기 위하여 선형예측계수를 퍼셉트론 신경회로망의 입력으로 사용하여 네트워크의 학습을 수행한다. 본 실험에서는 선형예측계수와 신경회로망을 사용하여 본 화자인식 알고리즘이 유효하다는 것을 인식률을 통하여 확인한다.

  • PDF

코드북과 VQ 최적화에 의한 음소/고립단어 인식률 분석 (Analysis of Phoneme/Isolated Word Recognition Rate Using Codebook and VQ Optimization)

  • 안홍진;주상현;진원;김기두
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 하계종합학술대회 논문집
    • /
    • pp.675-678
    • /
    • 1999
  • 본 논문에서는 음소별 코드북 개수의 선택과 벡터 양자화에 따른 음소 인식률과 고립단어 인식률에 대하여 다룬다. 음성모델은 이산 확률 밀도를 갖는 DHMM(Discrete Hidden Markov Model)을 사용하였으며, 코드북 생성과 벡터 양자화 알고리즘으로는 K-means 알고리즘과 LBG(Linde, Buzo, Gray) 알고리즘을 사용하였다 음소별 코드북 개수와 벡터 양자화를 최적화함으로써 음소 인식률을 향상시킬 수 있으며, 그 결과 안정된 고립단어 인식률을 얻을 수 있다.

  • PDF

성별 구별방법에 의한 자동차 내 음성 인식 성능 향상 (Improving the Performance of a Speech Recognition System in a Vehicle by Distinguishing Male/Female Voice)

  • 양진우;김순협
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권12호
    • /
    • pp.1174-1182
    • /
    • 2000
  • 본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작 없이 상시 음성의 입, 출력이 가능한 시스템을 제안하였다. 이대 잡음에 강인한 threshold 값을 구하기 위하여, 1.5초마다 기준 에너지와 영 교차율을 변경하였으며 대역 통과 여과기를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점 검출을 처리하였다. 또한 남성, 여성을 피치검출로 구분하여 모델을 선택하게 하였고, 주행중인 자동차 속도에 따라 가장 적합한 모델을 사용하기 위하여 Idle-40km, 40-80km, 80-100km로 구분하여 남성, 여성 모델을 각각 구분하여 인식할 수 있게 하였다. 그리고, 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 OSDP(one-Stage Dynamic Programming)을 사용하였다. 본 실험은 서울시내 도로 및 내부 순환도로에서 각각 속도별로 구분하여 화자독립 인식 실험을 한 결과 40-80km 상태에서 남자는 96.8%, 여자는 95.1%, 80-100km 상태에서는 남자 91.6%, 여자는 90.6%의 인식결과를 얻을 수 있었고, 화자종속 인식실험 결과 40-80km 상태에서 남자는 98%, 여자는 96%, 80-100km 상태에서는 남자는 96%, 여자는 94%의 높은 인식률을 얻었으므로, system의 유효성을 입증하였다.

  • PDF

화자적응화 연속음성 인식 시스템의 구현에 관한 연구 (A Study on Realization of Continuous Speech Recognition System of Speaker Adaptation)

  • 김상범;김수훈;허강인;고시영
    • 한국음향학회지
    • /
    • 제18권3호
    • /
    • pp.10-16
    • /
    • 1999
  • 본 연구에서는 소량의 음성 데이터만으로 적응화가 가능한 MAPE(최대사후확률추정)을 이용한 연속음성 인식시스템 개발에 대해 연구하였다. 음절단위 모델을 구축한 후 적응화 하고자 하는 화자의 데이터를 연결학습법과 Viterbi 알고리즘으로 음절단위의 추출을 자동화 한 후 MAPE로 적응화하였다. 자동차 제어문에 대해 화자 적응화한 경우의 인식률(O(n)DP인 경우)은 77.18%로 적응화 전의 결과보다 약 6%향상되었다.

  • PDF

새로운 음성 인식 모델 : 동적 국부 자기 조직 지도 모델 (A New Speech Recognition Model : Dynamically Localized Self-organizing Map Model)

  • 나경민;임재열;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권1E호
    • /
    • pp.20-24
    • /
    • 1994
  • 이 논문에서는 새로운 음성 인식 모델인 동적 국부 자기 조직 지도 모델과 그 학습 알고리즘을 제안한다. 동적 국부 자기 조직 지도 모델은 음성의 시간적, 공간적 왜곡을 프로그래밍 기법과 국부 자기 조직 지도로 각각 정규화 시킨다. 한국어 숫자음에 대한 실험 결과로 제안하는 모델이 예측 신경회로망 모델보다 적은 수의 연결을 갖고서도 약간 높은 인식률을 보여 효과적임을 알 수 있었다.

  • PDF

음소 인식을 위한 수정된 LVQ2 알고리즘의 고찰 (A Modified LVQ2 Algorithm for Phonemes Recognition)

  • 황철준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1996년도 영남지부 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.76-79
    • /
    • 1996
  • 본 논무에서는 한국어 음소를 대상으로 Kohonen 이 제안한 LVQ2 방법의 결저을 보완한 MLVQ2 방법으로 인식실험을 행하고 MLVQ2 알고리즘의 유효성을 검토하고자 한다. 인식실험을 위한 음성자료는 ETRI 611단어로부터 추출한 49음소를 사용하였다. 그리고 인식실험에 있어서는 먼저 파열음을 대상으로 학습회수, 표준패턴의 수, 샘플수에 따른 인식률의 변화를 조사하였으며, 이 결과 표준패턴의 수 15개, 학습회수 10회 이하, 샘플 수 3000 개일 경우가 가장 좋은 인식률을 보였다. 이 결과를 참고로 음소군별 인식실험 결과 모음 69.11%, 파열음 74.69%, 마찰음 및 파찰음 86.31%비음 및 유음 74.51%의 평균 인식률을 얻었다. 또한 , 한국어 49음소 전음소에 대한 인식실험 결과 71.2%의 인식률 얻어 MLVQ2의 유효성을 확인하였다.

  • PDF

가상현실 기반의 인공지능 영어회화 시스템 (English Conversation System Using Artificial Intelligent of based on Virtual Reality)

  • 천은영
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.55-61
    • /
    • 2019
  • 외국어 교육을 실현하기 위하여 기존의 다양한 교육 매체들이 제공되고 있지만, 교구 및 매체프로그램에 대한 비용이 많이 들고 실시간 대응력이 떨어지는 단점이 존재한다. 이 논문에서는 VR과 음성인식을 기반으로 한 인공지능 유형의 영어회화 시스템을 제안한다. 시스템 구축을 위해 Google CardBoard VR과 Google Speech API를 이용하며 가상현실 환경 제공 및 대화를 위한 인공지능 알고리즘을 개발하였다. 제안하는 음성인식 서버시스템에서는 사용자가 발화한 문장을 단어 단위로 분리해 데이터베이스에 저장된 데이터 단어들과 비교하여 확률적으로 가장 높은 것을 답으로 제공할 수 있으며 사용자들이 가상현실의 인물과 적절한 대화 및 응답이 가능하다. 대화가 제공되는 기능은 상황별 대화와 주제에 독립적이며, AI 비서와 나눈 대화 내용을 사용자 시스템에서 실시간 확인이 가능하도록 구현하였고 실험을 통하여 음성인식에 대한 응답비율을 확인하였다. 이 논문에서 제안하는 가상현실과 음성인식 기능을 접목한 시스템을 통하여 4차 산업혁명에 관련한 가상교육 콘텐츠 서비스 확장에 이바지할 것을 기대한다.

음성 정보와 DTW 알고리즘을 활용한 성인 컨텐츠 필터링 (Adult Contents Filtering using Voice Information and DTW)

  • 조정익;이일병
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.432-434
    • /
    • 2008
  • 본 논문은 필터링 수행율을 향상시키기 위해, DTW 알고리즘을 제시한다. 여기에서 말하는 컨텐츠 필터링은 음성의 특징을 사용해서 컨텐츠를 구분하는 것을 확인하는 기술이다. 즉, 이 방법이 일반 컨텐츠와 성인 컨텐츠를 구분한다. 음성에 대한 정보를 추출하는 방법이 컨텐츠를 필터링하는데 있어서 기여를 할 수 있다. 즉, DTW 알고리즘을 사용하여 필터링 인식률을 향상하는 방법이라고 제안을 한다. 마지막으로, 본 논문에서 제안한 방법의 적용 가능성과 일반성을 평가하기위하여 수치적인 예를 적용한다. 제안하는 성질의 정확도를 시험하기 위해서 실험을 제공하였다. 결과적으로 일반 컨텐츠와 성인 컨텐츠 특성의 차이를 알았다. 추후에 이 성질을 필터링 성능 향상에 응용할 수 있다.

  • PDF

Levelbuilding 알고리즘을 이용한 참조패턴의 자동생성 알고리즘에 관한 연구 (A Study On the Automatic Generation Algorithm of Reference Pattern Using Levelbuilding Algorithm.)

  • 김윤중
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.79-82
    • /
    • 1998
  • 본 연구에서는 연결단어 음성인식 상에서 올바른 참조 패턴을 생성하기 위해 Levelbuilding 알고리즘을 이용하여 인식대상 단어의 표본 집합(훈련패턴 집합)으로부터 참조 패턴을 자동적으로 생성하는 알고리즘을 개발하였다. 본 연구는 분한 K-Mans 훈련방법에 기초하고 있으며, Levelbuilding 알고리즘을 이용하여 훈련패턴으로부터 참조 패턴을 생성하는 것이다. 먼저 초기화 과정에서 훈련 패턴을 그에 포함된 단어 수만큼 등간격 분리하여 분리된 단어들을 소속 Cluster로 분류하고 각 Cluster의 Center들로 초기 참조패턴을 구성한다. 그리고 참조패턴, 제어정보 및 Levelbuilding 알고리즘을 이용하여 각 훈련패턴을 분리하고, 분리된 단어들을 소속 Cluster로 분류하여 단어 Cluster집합을 구성한 후 DTW 및 minimax알고리즘을 이용해 각 Cluster의 Center를 구하여 참조 패턴을 생성한다. 참조패턴 구성에 변화가 없을 때까지 전 단계의 참조패턴과 본 알고리즘을 반복 수행하여 최적의 참조패턴을 생성한다. 본 알고리즘을 이용하여 3개 숫자의 연결단어 집합으로부터 영('0')에서 구('9')까지 숫자음에 대한 참조패턴을 자동 생성하였다. 참조패턴 생성과정에서 가정 중요한 처리인 훈련패턴 분리과정을 분석하기 위하여 각 반복과정에서 분리된 정보를 그래프로 도시화하여 확인하였다.

  • PDF

변형된 AMDF를 이용한 음성 신호의 피치 주기 검출에 관한 연구 (A Study on Pitch Period Detection of Speech Signal Using Modified AMDF)

  • 서현수;배상범;김남호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.515-519
    • /
    • 2005
  • 음성 신호 처리에서 중요한 요소인 피치 주기는 음성 인식, 화자 식별, 음성 분석 및 합성 등의 많은 분야에 이용되고 있으며, 피치 검출에 관련된 다양한 알고리즘이 지금까지 연구되고 있다. 피치검출에 사용되는 알고리즘의 하나인 AMDF(average magnitude difference function)는 각 valley점의 거리를 피치 주기로 계산한다. 이 때 피치 주기 검출을 위한 valley점 선정에 있어서 계산량이 증가하는 문제점이 발생한다. 따라서 본 논문에서는 변형된 AMDF를 이용하여 전체 최소 valley점을 음성 신호의 피치 주기로 검출하는 간단한 알고리즘을 사용하였으며, 시뮬레이션을 통해 기존의 방법들과 비교하였다.

  • PDF