통합 검색 | Korea Science

음성 단어를 이용한 구간검출에 의한 패턴인식 (Pattern Recognition by Section Detection Using Speech Word)

최재승
- 한국정보통신학회:학술대회논문집
- /
- 한국정보통신학회 2016년도 춘계학술대회
- /
- pp.681-682
- /
- 2016
본 논문에서는 화자 식별에서 음성신호의 애매한 점을 보완할 수 있는 신경회로망의 오차역전파학습 알고리즘과 모음구간 검출에 기초하여 입력되는 음성의 화자 패턴을 구분하는 일본어 단어 패턴인식 알고리즘을 제안한다. 제안하는 알고리즘에서는 일본어 데이터베이스로부터의 단어를 사용하여 음성의 특징벡터를 추출하여 분석하고 이러한 음성의 특징벡터의 차이를 이용하여 일본어 화자에 대한 패턴인식 실험을 수행하였다.
PDF

발화속도와 한국어 분절음의 음향학적 특성 (Speech Rate and the Acoustic Features of Korean Segments)

이숙향;고현주
- 한국음향학회지
- /
- 제23권2호
- /
- pp.162-172
- /
- 2004
본 연구에서는 산출실험을 통해 발화속도와 한국어의 분절음의 지속시간 및 포만트 특성과의 관계와 모음의 지속시간과 포만트 간의 상관관계를 살펴보았다. 빠른 발화일수록 음절 및 자음과 모음의 지속시간은 짧게 나타났으며 대부분의 화자에서 폐쇄음의 폐쇄구간 대 기식구간의 비율이나 한 음절 내의 모음 대 자음 지속시간의 비율은 발화속도의 영향을 받지 않는 반면 일부 화자들은 발화속도의 영향을 받는 것으로 나타났다. 발화속도의 영향을 받는 화자들에서 폐쇄음의 경우 폐쇄구간이 기식구간보다 영향을 더 받으며 음절의 경우 모음이 자음보다 더 영향을 받는 것으로 나타났다. 발화속도와 모음의 포만트값과의 관계 분석 결과 발화속도가 모음약화에 영향을 미치는 정도가 화자간에 차이를 보였으며 이는 화자마다 모음의 포만트값 구현에 관하여 다른 발화기재를 이용하고 있다는 것을 간접적으로 시사해주는 것이라고 할 수 있다. 즉, 발화속도의 증가에 따라 조음기관의 움직임의 속도를 증가시키는 화자가 있는 반면 발화속도의 변화에 관계없이 일정한 속도를 유지하는 화자가 있다는 것을 의미한다.
PDF KSCI

모음연장 음성 샘플의 분석 구간에 따른 음향학적 파라미터 비교 (Comparison of Acoustic Parameters According to the Section of Analysis in Sustained Vowel Phonation)

신유정
- 한국산학기술학회논문지
- /
- 제18권7호
- /
- pp.269-274
- /
- 2017
본 논문은 임상에서 음성장애 환자의 객관적 음성 분석 대상으로 주로 쓰이는 모음연장 발성이 분석하는 구간에 따라 어떠한 음향학적 차이를 보이는지 밝히고자 하였다. 본 연구에서는 성대결절 환자 17명의 /아/ 모음연장 발성을 시작, 중간, 끝 구간으로 편집하여 MDVP를 통해 각 구간의 jitter, shimmer, NHR을 산출하였고, 비교를 위하여 정상 음성 집단 12명의 음성도 분석하였다. 산출 결과는 R 통계프로그램을 활용하여 Fridman test와 사후 검정을 실시하였다. 음성장애 환자집단은 모음연장 발성의 끝 구간이 중간 구간에 비해 jitter, shimmer, NHR 값이 모두 유의하게 높은 것으로 나타났다. 또한, 발성의 시작 구간은 중간 구간에 비해 세 파라미터 모두에서 높게 산출됐지만 유의한 차이는 없었다. 반면, 정상 집단은 발성의 시작, 중간, 끝 모든 구간에서 유의한 차이가 없었다. 모음연장 발성은 구간에 따라 음향학적 파라미터의 분석 결과가 다르고 발성 끝 구간에서 중간 구간보다 유의하게 음성이 불안정해지는 것으로 나타났다. 이러한 결론은 임상 현장에서 모음연장 발성의 분석 구간 선택과 결과 해석에 유용하게 활용될 수 있을 것이다.
https://doi.org/10.5762/KAIS.2017.18.7.269 인용 PDF KSCI

모음 기반 하자 식별 모델을 이용한 화자 인덱싱 (Speaker Indexing using Vowel Based Speaker Identification Model)

금지수;박찬호;이현수
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.151-154
- /
- 2002
본 논문에서는 음성 데이터에서 동일한 화자의 음성 구간을 찾아내는 화자 인덱싱(Speaker Indexing) 기술 중 사전 화자 모델링 과정을 통한 인덱싱 방법을 제안하고 실험하였다. 제안한 인덱싱 방법은 문장 독립(Text Independent) 화자 식별(Speaker Identification)에 사용할 수 있는 모음(Vowel)에 대해 특징 파라미터를 추출하고, 이를 바탕으로 화자별 모델을 구성하였다. 인덱싱은 음성 구간에서 모음의 위치를 검출하고, 구성한 화자 모델과의 거리 계산을 통하여 가장 가까운 모델을 식별된 결과로 한다. 그리고 식별된 결과는 화자 구간 변화와 음성 데이터의 특성을 바탕으로 필터링 과정을 거쳐 최종적인 인덱싱 결과를 얻는다. 화자 인덱싱 실험 대상으로 방송 뉴스를 녹음하여 10명의 화자 모델을 구성하였고, 인덱싱 실험을 수행한 결과 $91.8\%$의 화자 인덱싱 성능을 얻었다.
PDF

연속음성인식을 위한 음성구간과 피치검출에 관한 연구 (A Study on Speech Period and Pitch Detection for Continuous Speech Recognition)

김태석;장종칠
- 한국멀티미디어학회논문지
- /
- 제8권1호
- /
- pp.56-61
- /
- 2005
본 논문은 연속음성인식을 위한 음성구간과 피치를 검출하는 알고리즘을 제안한다. 이것은 연속음성을 입력받아 프레임 단위로 자/모음을 구분하며, 구분된 유성음에서 피치를 검출하는 방법이다 실제 잡음 환경에서 음성을 입력받아 적당한 문턱치 에너지를 사용함으로써 잡음환경에서 강인한 음성구간 추출이 가능하였고 추출한 음성구간에서 프레임단위로 영교차율과 단구간에너지를 이용한 알고리즘으로 유성음의 피치를 검출함과 동시에 자/모음을 구분하는 개선된 방식이다.
PDF

모음 스펙트럼에 기반한 전후 비자음 조음위치 판별 (Classification of nasal places of articulation based on the spectra of adjacent vowels)

윤지현;성철재
- 말소리와 음성과학
- /
- 제15권1호
- /
- pp.25-34
- /
- 2023
본 연구에서는 한국어 비음의 조음위치 변별을 위한 지표로서 모음 음향 특성의 활용 가능성을 타진하였다. 비음에 인접한 /ㅏ/ 모음 시료를 대용량 한국어 자연발화 말소리 자료에서 추출하여 모음 구간의 25%, 50%, 75% 시점에서 음향 매개변수를 측정하였다. 이 스펙트럼 및 지속시간 변수를 이용하여 판별분석을 수행하고 이를 바탕으로 선행 또는 후행 비자음의 조음위치 분류정확도를 추정하였다. 또한 조음위치 공조음(coarticulation)의 관점에서 순행적 공조음과 역행적 공조음의 영향을 확인하기 위하여 측정 대상 모음에 비음이 선행하는 경우와 후행하는 경우로 나누어 비교하였다. 분석 결과, 전후 비자음의 조음위치 분류정확도는 약 50%-60%로 나타났다. 모음의 음향 매개변수 측정값만으로 비음의 조음위치를 예측·분류하기에는 어려움이 있으나, 공조음 정도가 가장 약할 것으로 예상되는 모음 정중 구간에서 측정된 음향 변수만으로도 위와 같은 정확도를 얻었다는 점에서 비음 구간의 분석결과와 함께 모음 측정치를 활용함으로써 비음 조음위치 인식률 향상에 기여할 수 있을 것으로 기대한다. 한편 측정 대상 모음에 선행 또는 후행하는 비음 조건 간에 비교하였을 때, 후행 비음 조음위치의 분류정확도가 더 높게 나타났다는 점에서 역행적 조음위치 공조음의 영향이 더 클 가능성이 확인되었다.
https://doi.org/10.13064/KSSS.2023.15.1.025 인용 PDF

신경회로망을 이용한 화자 식별 (Speaker Identification using Neural Network)

황영수
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.383-387
- /
- 1998
신경회로망을 이용한 화자 식별에 대한 논문으로서, 화자 식별을 하기 위하여, 신경회로망중 패턴 인식의 성능이 우수하다는 ARTMAP을 이용하여 화자 식별 성능을 검토하였다. 본 논문에서 화자 식별 실험에 사용한 데이터는 25.6ms 와 51.2ms 구간의 모음들을 사용하였다. 실험 결과, 입력 모음에 따라 80.7%에서 98%까지의 인식률을 보였으며, 모음 '이'의 인식 결과가 화자 식별시 가장 좋은 결과를 보였다.
PDF

반음절 단위 HMM을 이용한 연속 숫자 음성인식 (Continuous Digits Speech Recognition using Semisyllable Unit HMM)

윤재선;홍광석
- 한국음향학회지
- /
- 제17권5호
- /
- pp.73-78
- /
- 1998
본 논문에서는 조음 효과에 대처할 수 있는 새로운 음성인식 단위로 반음절, 반음절 +반음절 단위 HMM을 제안하여 연속 숫자 음성인식을 하였다. 반음절 단위는 무음과 안정 구간으로, 반음절+반음절 단위는 안정, 천이, 안정구간으로 구성되어 있고, 음성인식 단위 분 할시 비교적 스펙트럼의 변화가 안정한 모음구간에서 분할하므로 분할 위치가 약간 변하여 도 인식성능에는 큰 영향을 주지 않게 된다. 또한, 제안된 반음절, 반음절+반음절 인식단위 는 그 패턴 안에 다음 숫자열의 정보를 포함하고 있기 때문에 모든 HMM 패턴들과 비교하 는 것이 아니라, 다음 숫자열의 정보를 포함한 HMM 패턴들과 비교한다. 인식실험결과 제 안된 방법이 효율적임을 확인하였다.
PDF

프레임간 에너지 차를 이용한 음성신호의 종성 폐쇄음 구간 검출에 관한 연구 (On the Interval Detection of Implosive Stop Sounds by Frame Energy Difference)

배명진;최정아;안수길
- 대한전자공학회논문지
- /
- 제26권4호
- /
- pp.145-150
- /
- 1989
음성 신호의 인식 시스템에서 분류 인식과정은 최종 인식과정에 필요한 복잡한 처리 과정을 줄여주기 때문에 유용하다. 본 논문에서는 종성 폐쇄음의 구간을 검출하는 분류인식 아고리듬을 제안하였다. 한국어의 종성 폐쇄음은 항상 모음 뒤에 발음되며, 그 특징은 모음 구간 내에 포함된다. 종성 폐쇄음 발음시에 연구개가 급히 닫히므로 에너지의 급격한 감소가 일어나고, 폐쇄 구간은 50~150msec간 지속된다. 이러한 성질을 나타내는 파라미터로 프레임간 에너지 차를 제안한다.
PDF

켑스트럼 계수에 의한 모음검출을 위한 음성인식 (Speech Recognition for Vowel Detection using by Cepstrum Coefficients)

최재승
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2011년도 추계학술대회
- /
- pp.613-615
- /
- 2011
본 논문에서는 켑스트럼 계수를 이용하여 음성인식을 하는 알고리즘을 제안한다. 본 논문에서 제안하는 방법은 사람이 발성한 음성을 두 영역의 켑스트럼 계수로 분리한 후에, 신경회로망을 사용하여 음성인식을 하는 방법이다. 본 논문에서 제안하는 신경회로망은 오차가 거의 없어지는 일정 기간 동안 네트워크를 학습시킨 후에 신경회로망의 학습 데이터와는 다른 새로운 음성이 신경회로망에 입력된 경우에 대하여 각 음성 구간에서 분류가 가능한 모음검출을 위한 음성인식 시스템을 제안한다.
PDF

검색결과 50건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)