• 제목/요약/키워드: 모음 인식

검색결과 192건 처리시간 0.025초

한국어 음소인식을 위한 기준 프레임 추출 (Typical Frame Etraction for Korean Phoneme Recognition)

  • 김범국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.121-124
    • /
    • 1994
  • 음소를 인식의 기본으로 하는 한국어 음성인식 시스템을 구현하기 위한 기초 연구의 일환으로서 각 음소의 특징 가장 잘 표현하는 기준프레임 추출을 위한 연구를 수행하였다. 이를 위하여 먼저 선행 실험과 분산비 분석을 통해서 인식에 필요로한 시간 패턴의 길이를 추출한 후 이를 바탕으로 통계적 인식방법인 베이즈 결정법칙을 이용하여 시단 프레임으로부터 3프레임씩 시점을 1프레임씩 옮기면서 인식 실험을 해?여, 각 음소별 특징이 가장 풍부한 기준 프레임을 추출하였다. 그리고 이 기준 프레임을 중심으로 각 음소군별 인식 실험을 수행하여 그 결과를 시단을 기준으로 한 경우와 비교 검토하고 한국어 전 음소별로 확장하여 인식 실험을 실시하였다. 이 실험 결과 모음의 경우 시단으로부터 5프레임, 파열음은 시단에서부터 5프레임사이, 마찰음은 3프레임에서부터 10프레임까지, 파찰음은 5프레임까지, 비음과 유음의 경우 초성은 시단 프레임에서 6프레임, 종성은 종단으로부터 전 4프레임 구간이 인식률이 높게 나타나 이 부분의 특징이 인식에 가장 유효함을 알 수 있었다.

  • PDF

음소 인식을 위한 수정된 LVQ2 알고리즘의 고찰 (A Modified LVQ2 Algorithm for Phonemes Recognition)

  • 황철준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1996년도 영남지부 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.76-79
    • /
    • 1996
  • 본 논무에서는 한국어 음소를 대상으로 Kohonen 이 제안한 LVQ2 방법의 결저을 보완한 MLVQ2 방법으로 인식실험을 행하고 MLVQ2 알고리즘의 유효성을 검토하고자 한다. 인식실험을 위한 음성자료는 ETRI 611단어로부터 추출한 49음소를 사용하였다. 그리고 인식실험에 있어서는 먼저 파열음을 대상으로 학습회수, 표준패턴의 수, 샘플수에 따른 인식률의 변화를 조사하였으며, 이 결과 표준패턴의 수 15개, 학습회수 10회 이하, 샘플 수 3000 개일 경우가 가장 좋은 인식률을 보였다. 이 결과를 참고로 음소군별 인식실험 결과 모음 69.11%, 파열음 74.69%, 마찰음 및 파찰음 86.31%비음 및 유음 74.51%의 평균 인식률을 얻었다. 또한 , 한국어 49음소 전음소에 대한 인식실험 결과 71.2%의 인식률 얻어 MLVQ2의 유효성을 확인하였다.

  • PDF

대화체 음성에서의 한국어 연결 숫자음 인식 (Recognition of Korean Connected Digits in a Natural Spoken Dialog)

  • 김중철;고종철;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.377-379
    • /
    • 2000
  • 대화체 음성의 인식을 위해서는 음성 파형에 관한 음향학적인 연구뿐만 아니라 인식하려는 언어자체에 대한 언어학적인 연구를 필요로 한다. 본 논문에서는 숫자음의 언어학적인 요소를 고려하고, 포만트 주파수를 숫자음 검출과 숫자음 인식에 적용하는 방식을 제안한다. 시스템의 입력은 특정 질의에 대한 응답으로 대화체 문장이며, 끝점 추출 기술을 이용하여 고립단어로 분류한 후, 숫자음만을 검출해 내고, 검출된 숫자음을 인식하기 위해 포만트 주파수를 이용한다. 한국어 연결 숫자음 인식은 한국어 숫자음이 단음절로 구성된다는 점과 발음상의 조음효과 등으로 한계를 가지고 있다. 본 논문에서는 숫자음과 발성에 필요한 음소들을 추출하고, 숫자들을 모음에 따라 6개의 그룹으로 분류하여 인식의 범위를 좁히고, 포만트 주파수 정보와 음소 HMM 모델에 의한 두 단계에 걸친 인식을 수행함으로써 연결 숫자음 인식에 대한 성능을 향상시킨다.

  • PDF

음소에 의한 한국어 음성의 분석과 인식 (The Analysis and Recognition of Korean Speech Signal using the Phoneme)

  • 김영일;이건기;이문수
    • 한국음향학회지
    • /
    • 제6권2호
    • /
    • pp.38-47
    • /
    • 1987
  • 한국어는 발음상의 특징과 구조에 의해서 음소철로 분리가 가능하므로, 한국어를 자음 음소, 모음 음소, 받침 음소로 나눌 수 있다. 분리된 각각의 음소들을 편자기 상관계수를 이용하여 분석하였는데, 이 때 예측 차수는 15차이다. 분석 실험에서 동일한 음소들은 그 특성이 거의 유사하였다. 한국어 단음 675개를 자음 음소. 모음 음소, 받침 음소로 각각 분리하여 인식한 결과 각각 $85.0(\%)$, $90.7(\%)$, $85.5(\%)$의 인식률을 얻었고, 이 음소들을 결합시킨 단음에서는 $72.1(\%)$의 인식률을 얻었다. 따라서, 이와 같은 방법을 이용하여 한국어 단음을 작은 데이터 양으로 처리 시간을 단축시킬 수 있고, 더 나아가 한국어의 모든 단음, 단어, 문장 둥을 인식할 수 있다.

  • PDF

MRF를 이용한 수화 동영상에서의 효율적인 손 형상 추출 (The Extraction of the Shape of Hands in the Sign Language Sequence by using MRF Model)

  • 송효섭;양윤모
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.395-397
    • /
    • 2000
  • 영상 처리를 통한 수화(手話)의 인식에 있어 가장 중요한 정보는 손의 형상, 위치, 이동방향 등을 들 수 있다. 이 중 손의 형상은 세가지 정보 중 가장 중요하며, 실제로 자음과 모음, 숫자 등을 나타내는 지문자의 경우 손의 형상만으로도 인식될 수 있다. 본 논문에서는 선 처리 모델(Line Process Model)을 3차원으로 확장하여 적용한 Markov Random Field(MRF)를 사용하여 효율적으로 손의 형상을 추출하였다.

  • PDF

숫자음성 자동 인식에 관한 일실험 (An Experiment of a Spoken Digits-Recognition System)

  • 오영환
    • 대한전자공학회논문지
    • /
    • 제15권6호
    • /
    • pp.23-28
    • /
    • 1978
  • 본 논문은 복수화자를 대상으로 한 숫자음성자동 시스템의 개발을 위한 기초 실험 결과의 보고다. ZCR, 대수 에너지등의 파라메터에 의한 무성자음의 분류, 선형예측에 의한 formant 주파수의 추정 및 그를 이용한 모음 및 유성자음의 인식을 행했다. 성인 남성 한 사람의 숫자음에 대한 인식실험의 결과, 음소(phoneme) 결합시의 과도 부분이나, 음소 인식 단계에서의 국소적 오인식을 흡수 할 수 있는 algorithm을 채용함으로써 양호한 인식 결과를 얻을 수 있었다. 앞으로, 독수제자를 대상으로 한 인식실험, 인식시스템의 개선과 한께 국어의 음성학적 제성질의 연구를 해 나갈 예정이다.

  • PDF

HMM Segmentation과 LVQ를 이용한 한국어 음절인식에 관한 연구 (A study on the recognition of Koreans syllable using HMM segmentation and LVQ)

  • 안종영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.378-382
    • /
    • 1994
  • HMM 세그멘테이션을 이용하여 LVQ 알고리즘에 적용시킨 하이브리드 음성인식에 관한 연구이다. LVQ 학습알고리즘은 정적 패턴 분리를 위한 참조벡터 즉, 고정차원인 벡터들을 생성하는데 유리하다. 하이브리드 알고리즘은 정적패턴 인식에 사용 되어지는 LVQ 알고리즘에 HMM 세그멘테이션을 접목시켜 입력패턴을 정규화된 의미있는 값으로서 바꾸어 사용하는데 있다. 한국어 음절중 8개 모음 아, 이, 우, 에, 오, 애, 어, 으를 추출하여 인식실험을 하였다. 인식률은 화자종속일 경우 코드북수 256개를 기준으로 LVQ1, LVQ2, LVQ3, OLVQ1 알고리즘순으로 91.7%, 91.8%, 91.1%의 인식률을 구했고 화자 독립의 경우는 83.4%, 83.9%, 86.8%, 85.3%의 인식률을 구했다.

  • PDF

반음절 단위 HMM을 이용한 연속 숫자 음성인식 (Continuous Digits Speech Recognition using Semisyllable Unit HMM)

  • 윤재선;홍광석
    • 한국음향학회지
    • /
    • 제17권5호
    • /
    • pp.73-78
    • /
    • 1998
  • 본 논문에서는 조음 효과에 대처할 수 있는 새로운 음성인식 단위로 반음절, 반음절 +반음절 단위 HMM을 제안하여 연속 숫자 음성인식을 하였다. 반음절 단위는 무음과 안정 구간으로, 반음절+반음절 단위는 안정, 천이, 안정구간으로 구성되어 있고, 음성인식 단위 분 할시 비교적 스펙트럼의 변화가 안정한 모음구간에서 분할하므로 분할 위치가 약간 변하여 도 인식성능에는 큰 영향을 주지 않게 된다. 또한, 제안된 반음절, 반음절+반음절 인식단위 는 그 패턴 안에 다음 숫자열의 정보를 포함하고 있기 때문에 모든 HMM 패턴들과 비교하 는 것이 아니라, 다음 숫자열의 정보를 포함한 HMM 패턴들과 비교한다. 인식실험결과 제 안된 방법이 효율적임을 확인하였다.

  • PDF

무제한 단어인식 시스템을 위한 VCCV분할에 관한 연구 (A Study on VCCV Segmentation in Unrestricted Word Recognition System)

  • 윤재선;정광우;홍광석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.103-106
    • /
    • 2000
  • 무제한 인식 시스템을 구현하기 위해서는 적절한 인식단위, 훈련 데이터 베이스의 확보, 인식단위의 분할, 인식 알고리즘과 같은 문제점을 모두 해결하여야 한다. 따라서 본 논문에서는 무제한 음성인식 시스템의 인식의 기본 단위로 모음의 안정구간을 검출하여 분할하는 CV(Consonant-Vowel), VC(Vowel-Consonant), VC CV(Vowel-Consonant-Consonant-Vowel)단위와 분할 파라미터를 제안하고, 분할 실험을 통해 그 유효성을 확인하고자 한다.

  • PDF

SCHMM 기반 7연속 숫자음 인식에 관한 연구 (A Study on 7-Connected Digits Speech Recognition using SCHMM)

  • 김세용;정희석;강철호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.127-130
    • /
    • 2002
  • 본 연구에서는 우리말 연속 숫자음 인식에서 본래의 숫자음을 변이 시키는 주된 요인인 연음현상에 대한 인식을 높이기 위해 별도의 연음부분의 레퍼런스를 작성하여 매칭 시키는 방식을 제안한다 또한 단모음으로 이루어진 /2/와 /5/의 연속된 음에 대하여도 레퍼런스를 작성하였다. 제안한 방식에 의하여 전체적으로 $1.4\%$정도 인식률이 상승됨을 볼 수 있다. 특히 발성 목록중 /82/, /62/, /31/, /15/, /75/ 등의 연음과 /226/, /755/등과 같이 모음의 연속된 발성이 포함된 숫자 열에서 제안된 방식이 인식률에 영향을 미치는 것을 볼 수가 있었다. 이는 연음에서 발생하는 오류가 연속 숫자음에 많은 영향을 미치는 것을 알 수 있다. 그 외에 /22/, /55/등과 같이 단모음으로 이루어진 숫자음의 연속 발성 또한 인식률을 저하시키는데 한 요인으로 작용함으로서 이에 대한 레퍼런스도 작성하여 인식률이 상승되는 것을 볼 수 있었다.

  • PDF