• 제목/요약/키워드: 모음 인식

검색결과 191건 처리시간 0.03초

Spatio-temporal 방법을 이용한 우리말 모음 인식에 관한 연구 (A Study on the Vowel Recognition of Korean Speech using Spatio-temporal Method)

  • 송도선;김선일;김석동;이행세
    • 한국음향학회지
    • /
    • 제12권4호
    • /
    • pp.57-62
    • /
    • 1993
  • 본 논문은 신경망을 이용한 우리말 모음에 대한 인식 연구이다. 음성을 나누거나. 음소별 인식이나, 시간 신축 방법을 사용하지 않고 모음을 인식하였다. 식나의 변화에 따른 음성의 변화를 정적인 음성으로 취급하였다. 10개로 균등히 나눈 프레임에 각 프레임마다 10차의 PARCOR계수를 추출하였다. 신경망의 구조를 간단히 하기 위해서 단모음과 복모음을 구분하여 학습시켰으며, 출력 노드의 수를 감소시키기 위해 이진 코드 형태로 구성하였다.

  • PDF

온라인 한글 필기 인식 알고리즘 개발 (Development of Algorithm for Online Handwriting Hangul Recognition)

  • 정다빈;이강은;정민진;문창진;김성석;김재현;양순옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.1000-1003
    • /
    • 2020
  • 본 논문은 기계학습 기반 온라인 한글 필기 인식 시스템의 첫 구현 결과를 담고 있다. 한글의 글자는 최소한 하나의 모음을 포함하고 있으며, 이 모음은 대개 직선으로 필기한다는 사전 지식을 활용하여 인식에 적용하고자 한다. 이를 위해 사용자가 온라인으로 필기하면 획 데이터를 획득하여 중성에 해당하는 모음을 찾는 알고리즘을 개발하였다. 제안한 알고리즘에서는, 우선 필기한 글자를 포함하는 사각형 R과 각 획을 둘러싸는 사각형 SR을 생성한 후, 직선을 판별하고, 이 직선들이 모음을 구성하는 후보군을 찾는 과정으로 구성되어 있다. 아직 초기 연구이므로, 다양한 경우에 대한 분석이나 실험 결과는 없지만, 이를 활용하여 온라인 필기 인식 모델에 적용하여 인식 성능을 높이기 위한 추후 연구의 기반으로 활용하고자 한다.

파형 특징 추출과 신경망 학습 기반 모음 'ㅣ' 음성 인식 (Speech Recognition for the Korean Vowel 'ㅣ' based on Waveform-feature Extraction and Neural-network Learning)

  • 노원빈;이종우;이재원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.69-76
    • /
    • 2016
  • 최근 모든 산업에서 사물인터넷에 대한 관심이 집중되면서 집, 회사, 차, 길거리 등 인간이 생활하는 모든 환경에 컴퓨팅 기술이 접목되고 있다. 이 같은 사물인터넷 환경에서 음성인식은 중요한 HCI 수단으로 자리 잡고 있다. 현존하는 서버 기반의 음성인식은 속도가 빠르고 꽤 높은 인식률을 보여주고는 있지만, 데이터베이스 내에 저장되어 있는 단어 단위로 인식하기 때문에 인터넷 연결과 복잡한 컴퓨팅이 필수적이다. 본 논문은 한국어 음소 모음 'ㅏ', 'ㅓ' 인식에 대한 휴리스틱 알고리즘에 이은 연구로 모음 'ㅣ'에 대한 음성 인식을 구현하고자 한다. 모음 'ㅣ' 음성의 여러 파형 패턴들을 관찰한 결과 모음 'ㅏ', 'ㅓ'와는 다른 특정한 파형의 패턴을 가지고 있음을 발견하였고, 그 패턴을 인식하는 알고리즘을 제시한다. 또한, 제시한 알고리즘에 신경망 학습을 적용하여 인식성공률을 높이는 실험 결과도 제시한다. 모음 'ㅣ'에 대한 본 알고리즘은 파형의 특징적인 부분 추출 기반으로 인식하며, 신경망 학습까지 적용한 후 실험한 결과 90% 이상의 정확도로 모음 'ㅣ'를 인식하는 것을 확인하였다.

신경회로망을 이용한 화자 식별 (Speaker Identification using Neural Network)

  • 황영수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.383-387
    • /
    • 1998
  • 신경회로망을 이용한 화자 식별에 대한 논문으로서, 화자 식별을 하기 위하여, 신경회로망중 패턴 인식의 성능이 우수하다는 ARTMAP을 이용하여 화자 식별 성능을 검토하였다. 본 논문에서 화자 식별 실험에 사용한 데이터는 25.6ms 와 51.2ms 구간의 모음들을 사용하였다. 실험 결과, 입력 모음에 따라 80.7%에서 98%까지의 인식률을 보였으며, 모음 '이'의 인식 결과가 화자 식별시 가장 좋은 결과를 보였다.

  • PDF

Incremental Neural Network 과 LPCC을 이용한 화자인식 (Speaker Identification using Incremental Neural Network and LPCC)

  • 허광승;박창현;이동욱;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.341-344
    • /
    • 2002
  • 음성은 화자들의 특징을 가지고 있다. 이 논문에서는 신경망에 기초한 Incremental Learning을 이용하여 화자인식시스템을 소개한다. 컴퓨터를 통하여 녹음된 문장들은 FFT를 거치면서 Frequency 영역으로 바뀌고, 모음들의 특징을 가지고 있는 Formant를 이용하여 모음들을 추출한다. 추출된 모음들은 LPC처리를 통하여 화자의 특성을 가지고 있는 Coefficient값들을 얻는다. LPCC과정과 Vector Quantization을 통해 10개의 특징 점들은 학습을 위한 Input으로 들어가고 화자 수에 따라 증가되는 Hidden Layer와 Output Layer들을 가지고 있는 신경망을 통해 화자인식을 수행한다.

다단계 신경 회로망을 이용한 블랙박스 영상용 차량 번호판 인식 알고리즘 (A License Plate Recognition Algorithm using Multi-Stage Neural Network for Automobile Black-Box Image)

  • 김진영;허서원;임종태
    • 한국정보통신학회논문지
    • /
    • 제22권1호
    • /
    • pp.40-48
    • /
    • 2018
  • 본 논문은 차량과 함께 카메라의 위치가 이동하는 블랙박스 영상을 위한 차량 번호판 인식 알고리즘을 제안한다. 카메라의 흔들림이나 빛의 변화가 많은 블랙박스 영상에서 다단계 신경 회로망을 사용하여 한글 문자의 인식률을 높여 전체적인 차량 번호판의 인식률을 높이고자 한다. 제안한 알고리즘은 차량 번호판의 한글 문자의 모음과 자음을 분리하여 인식한다. 먼저, 1차 신경 회로망으로 모음을 인식하고, 종모음('ㅏ','ㅓ')과 횡모음('ㅗ','ㅜ')로 구분한 뒤 각각의 모음군에 2차 신경 신경회로망을 이용하여 자음을 구분한다. 실제 블랙박스 영상을 획득하여 차량 번호판 인식 시뮬레이션을 수행하였으며, 그 결과 제안한 인식 시스템이 기존의 신경 회로망 기법을 사용한 차량 번호판 인식 시스템보다 높은 인식률을 보임을 확인하였다.

벌크 지표의 신경망 학습에 기반한 한국어 모음 'ㅡ'의 음성 인식 (Speech Recognition of the Korean Vowel 'ㅡ' based on Neural Network Learning of Bulk Indicators)

  • 이재원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권11호
    • /
    • pp.617-624
    • /
    • 2017
  • 음성 인식은 HCI 분야에서 널리 사용되는 기술 중 하나이다. 가정 자동화, 자동 통역, 차량 내비게이션 등 음성 인식 기술이 적용될 수 있는 많은 응용들이 현재 개발되고 있다. 또한, 모바일 환경에서 작동 가능한 음성 인식 시스템에 대한 수요도 급속히 증대되고 있다. 본 논문은 한국어 음성 인식 시스템의 일부로서, 한국어 모음 'ㅡ'를 빠르게 인식할 수 있는 방안을 제시한다. 제안하는 방식은 주파수 영역 대신, 시간 영역에서 계산되는 지표인 벌크 지표를 사용하므로, 인식을 위한 계산 비용을 절감할 수 있다. 모음 'ㅡ'의 전형적인 시퀀스 패턴들을 표현하는 벌크 지표들에 대한 신경망 학습을 수행하며, 최종적인 인식을 위해 학습된 신경망을 사용한다. 실험 결과를 통해, 제안하는 방식이 모음 'ㅡ'를 88.7%의 정확도로 인식할 수 있음을 확인하였고, 인식 속도는 어절 당 0.74msec이다.

음소인식 기반의 립싱크 구현을 위한 한국어 음운학적 Viseme의 제안 (Korean Phonological Viseme for Lip Synch Based on Phoneme Recognition)

  • 주희열;강선미;고한석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.70-73
    • /
    • 1999
  • 본 논문에서는 한국어에 대한 실시간 음소 인식을 통한 Lip Synch 구현에 필수요소인 Viseme(Visual Phoneme)을 한국어의 음운학적 접근 방법을 통해 제시하고, Lip Synch에서 입술의 모양에 결정적인 영향을 미치는 모음에 대한 모음 인식 실험 및 결과 분석을 한다.모음인식 실험에서는 한국어 음소 51개 각각에 대해 3개의 State로 이루어진 CHMM (Continilous Hidden Makov Model)으로 모델링하고, 각각의 음소가 병렬로 연결되어진 음소네트워크를 사용한다. 입력된 음성은 12차 MFCC로 특징을 추출하고, Viterbi 알고리즘을 인식 알고리즘으로 사용했으며, 인식과정에서 Bigrim 문법과 유사한 구조의 음소배열 규칙을 사용해서 인식률과 인식 속도를 향상시켰다.

  • PDF

시간 영역 시퀀스 패턴에 기반한 한국어 모음 'ㅐ'의 음성 인식 (Speech Recognition of the Korean Vowel 'ㅐ', Based on Time Domain Sequence Patterns)

  • 이재원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.713-720
    • /
    • 2015
  • 컴퓨팅 기술과 네트워크의 발달로 인해, 정보 기기가 소형화되고 이동성이 강조되고 있다. 이에 따라 모바일 환경에서 작동 가능한 음성 인식 시스템에 대한 수요가 최근 급격히 증대되고 있다. 본 논문은 음소 기반 한국어 음성 인식 시스템의 일부로서, 한국어 모음 'ㅐ'에 대한 새로운 인식 방식을 제안한다. 제안하는 방식은 주파수 영역에서의 분석을 배제하고, 시간 영역에서의 시퀀스 패턴에 기반하여 인식을 수행함으로써, 계산 비용을 현저히 절감할 수 있다. 'ㅐ'의 전형적인 시퀀스 패턴들을 탐지하기 위한 세 가지 알고리즘이 제시되며, 이를 결합하여 최종 판별을 수행한다. 실험 결과를 통해, 제안하는 방식이 89.1%의 정확도로 모음 'ㅐ'를 인식할 수 있음을 확인하였다.

한국어 자소 음가 분류에 관한 연구 (A Study on the Korean Grapheme Phonetic Value Classification)

  • 유승덕;김학진;김순협
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.89-92
    • /
    • 2001
  • 본 논문에서는 한국어 대용량 음성인식 시스템의 기초가 되는 자소(grapheme)가 지니는 음가를 분류하였다. 한국어 자소를 음성-음운학적으로 조음 위치와 방법에 따라 분류하여, 그 음가 분석에 관한 연구와 함께 한국어 음성인식에서 앞으로 많이 논의될 청음음성학(auditory phonetics)에 대하여 연구하였다. 한국어는 발음상의 구조와 특성에 따라 음소 분리가 가능하여 초성, 중성, 종성 자소로 나눌 수 있다. 본 논문에서 초성은 자음음소 18개, 중성은 모음 음소(단모음, 이중모음) 17개, 그리고 'ㅅ' 추가 8종성체계의 자음음소로 하였다. 청음음성학적 PLU(Phoneme Like Unit)의 구분 근거는 우리가 맞춤법 표기에서 주로 많이 틀리는 자소(특히, 모음)는 그 음가가 유사한 것으로 판단을 하였으며, 그 유사음소를 기반으로 작성한 PLU는 자음에 'ㅅ' 종성을 추가하였고, 모음에 (ㅔ, ㅐ)를 하나로, (ㅒ, ㅖ)를 하나로, 그리고 모음(ㅚ, ㅙ, ㅞ)를 하나의 자소로 분류하였다. 혀의 위치와 조음 방법과 위치에 따라 분류한 자음과 모음의 자소를 HTK를 이용하여 HMM(Hidden Markov Model)의 자소 Clustering하여 그것의 음가를 찾는 결정트리를 검색하여 고립어인식과 핵심어 검출 시스템에 적용 실험한 결과 시스템의 성능이 향상되었다.

  • PDF