• 제목/요약/키워드: 발음분석

검색결과 253건 처리시간 0.031초

대조 분석 기반의 중국인 학습자의 한국어 발음 변이 양상 예측 (Prediction of Chinese Learners' Korean Pronunciation Variations based on Contrastive Analysis)

  • 양승희;정민화
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.206-210
    • /
    • 2014
  • 음성언어처리 기술의 발전과 외국어로서의 한국어 교육에 대한 관심이 커지면서 컴퓨터를 활용한 언어교육 (CALL) 기반의 한국어 학습 시스템에 대한 연구가 활발히 진행되고 있다. 학습자의 모국어와 학습언어의 대조 분석은 양 언어의 유사점과 차이점을 찾아내어 학습자들이 무엇을 학습해야 하고, 학습자들이 보이는 오류가 어떤 것인지 판단할 수 있는 중요한 자료를 제공한다. 본 논문에서는 중국인 학습자를 위한 컴퓨터 기반 한국어 학습 시스템 개발을 위해서 선행연구의 대조분석과 실험 결과를 정리하고, 이를 토대로 중국어 학습자들이 보일 수 있는 분절음 발음 변이 양상을 예측한다.

  • PDF

중국인 학습자의 한국어 발음 오류에 대한 음성 신호 파라미터들의 비교 연구 - 한국어의 /ㄹ/ 발음을 중심으로 (A Comparison Study on the Speech Signal Parameters for Chinese Leaners' Korean Pronunciation Errors - Focused on Korean /ㄹ/ Sound)

  • 이강희;유광복;임하영
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권6호
    • /
    • pp.239-246
    • /
    • 2017
  • 본 논문은 중국인 학습자들이 많은 오류를 나타내는 한국어 /ㄹ/발음을 중심으로 중국인 학습자들의 음성 신호 파라미터들을 한국인의 것과 비교하였다. 설측음 혹은 탄설음의 변이음으로 나타나는 한국어의 /ㄹ/ 발음에 대한 중국어의 유사 발음과의 관계를 언어학적 관점에서 알아봄으로 많은 오류를 보이는 이유를 확인해 보았다. 본 논문에서는 신호의 에너지, 시간 영역에서의 파형, 주파수 성분 분석이 가능한 스펙트로그램, 자기 상관 함수를 이용해 구한 피치 (F0), 포먼트 주파수 (f1, f2, f3, 그리고 f4) 등을 사용하여서 음성학적 측면에서 비교 분석 하였다. 본 논문에서 사용한 데이터는 국어학적 분석을 통한 제시어로 구성한 것을 사용하였고 이를 시뮬레이션 하였다. 에너지와 spectrogram 분석의 결과를 보면, 중국인 학습자는 한국어 /ㄹ/ 발음에서 한국인 화자들과 많은 차이를 보인다. 이외의 다른 음성 신호 파라미터들에서도 차이가 나는 것을 알 수 있다. 본 논문이 비교한 파라미터들을 이용하여서 중국인 화자가 한국어 학습시 나타나는 오류들을 상당히 줄일 수 있을 것으로 기대할 수 있다.

한국어 발음열 자동 생성을 위한 형태소 태그 정보 기반의 텍스트 전처리기 (Text Preprocessor for Generating Korean Automatic Pronunciation Variants Using Morpheme-trg Information)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.199-201
    • /
    • 2001
  • 일반적으로 발음열 자동 생성기는 음성 인식 및 음성 합성에 사용되며, 그 주된 역할은 입력된 한글 철자에 대해 발음 나는 데로 표기된 음소열로 출력하는 것이다. 그러나 실제 입력되는 문장에는 특수 기호 및 알파벳. 아라비아 숫자, 영어 단어, 알파벳과 숫자가 혼용된 약어, 기호 단위 명사 등이 포함되어 있다. 게다가 아라비아 숫자의 경우 단위 명사의 종류에 따라서 뿐만 아니라, 문맥에 따라 숫자를 읽는 방식이 달라지게 된다. 이러한 모든 현상들을 발음열 생성기 내부에서 처리하게 되면 선행작업이 상대적으로 크게 되어 과부하 문제 가 발생된다. 또한 어절 내의 문맥 정보만으로 정확한 변환 결과를 얻기 힘들기 때문에 형태소 분석 수행 결과 및 예외처리를 위 한 루틴을 포함하여 한글 자소 단위의 입력형식으로 변환하는 전처리 시스템을 구성하였다.

  • PDF

한국어 양순 파열음 발음시 구강내압과 폐쇄기, VOT에 대한 연구 (The Study on Intraoral Pressure, Closure Duration, and VOT During Phonation of Korean Bilabial Stop Consonants)

  • 표화영;최홍식
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1996년도 제6회 학술대회 심포지움
    • /
    • pp.89-89
    • /
    • 1996
  • 정상인 20명을 대상으로 하여, 우리말의 양순 파열음인 /ㅂ, ㅃ, ㅍ/의 발음시, 각각의 음소에서의 구강내압의 크기와 폐쇄기 및 VOT의 길이를 측정하고, 목표 자음이 어두에 나올 때 및 음절 초에 나올 때, 그리고 어음을 보통 소리로 말했을 때와 큰 소리로 말했을 때, 그 세 측정치가 어떻게 변화하는지를 파악하기 위한 실험을 실시하였다 채취된 어음의 구강내압은 발음시 Pressure sensor를 사용함으로써 산출된 파형을 이용하여 측정하였고, 폐쇄기와 VOT는 컴퓨터에 입력된 음성신호를 Spectrogram으로 분석하여 측정하였다. 그 결과, 양순 파열음 중 구강내압은 /ㅍ/>/ㅃ/>/ㅂ/의 순이었고, 폐쇄기의 길이는 /ㅃ/>/ㅍ/>/ㅂ/, 그리고, VOT의 길이는 /ㅍ/>/ㅂ/>/ㅃ/의 순이었다. 양순 파열음이 어두에 올 패보다 음절 초에 올 때 더 큰 구강내압을 보였으며, 폐쇄기의 길이는 더 짧아지는 경향을 보였고, VOT의 길이도 폐쇄기와 마찬가지로 짧아지는 경향을 보였다 그리고, 양순 파열음을 큰 소리로 발음했을 때, 목표 자음의 위치에 상관없이, 구강내압의 크기는 의미 있게 커졌으며, 폐쇄기와 VOT는 짧아지는 경향을 보였다.

  • PDF

구개인두부전증 환자와 모의 음성의 모음과 자음 분석 (Analysis on Vowel and Consonant Sounds of Patent's Speech with Velopharyngeal Insufficiency (VPI) and Simulated Speech)

  • 성미영;김희진;권택균;성명훈;김우일
    • 한국정보통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.1740-1748
    • /
    • 2014
  • 본 논문에서는 구개인두부전증 (VPI) 환자 발음과 정상인의 모의 발음에 대한 듣기 평가와 음향 분석을 실시한다. 본 연구를 위해 음성 데이터 수집을 위해 50개의 단어, 모음 및 단음절로 이루어진 발음 목록을 설정한다. 듣기 평가실험의 편의를 위해 웹 기반의 듣기 평가 시스템을 구축한다. 듣기 평가 결과는 실제 VPI 환자의 발음에 대한 오인식 경향과 모의 발음의 오인식 경향이 유사함을 나타낸다. 이러한 유사성은 모음의 포먼트 위치와 자음의 스펙트럼의 비교를 통해서도 확인할 수 있다. 실험 결과는 본 연구에서 사용한 정상인의 VPI 모의 발화 기법이 실제 환자의 음성을 비교적 효과적으로 모의하는 것을 반영하는 결과이다. 향후 VPI 환자의 음성 인식 과정에서 정상인의 모의 발화음성 데이터를 음향 모델의 적응 기법과 같은 분야에 유용하게 사용할 수 있을 것으로 기대한다.

조합분음기호에 의한 영어 발음기호의 컴퓨터 입력방법에 관한 연구 (A Study on the Inputting Method of English Pronunciation for a Computer by the Combining Diacritical Mark)

  • 이현창
    • 전자공학회논문지CI
    • /
    • 제43권4호
    • /
    • pp.31-38
    • /
    • 2006
  • 본 논문에서는 영어 발음기호의 2단계 강세뿐만 아니라 3단계, 4단계 강세기호 및 기타 특수기호를 쉽게 입력할 수 있는 방법을 위해 영어 발음기호 및 강세기호 체계와 컴퓨터 계통의 일부에서 제한적으로 사용되고 있는 영어 발음기호 표현방법들을 분석하였으며, 이에 따라 조합분음기호를 이용한 영어 발음기호의 입력방법을 제시하였다. 제시한 방법을 적용한 새로운 글 자체와 자판배치를 구성해 실험한 결과 워드프로세서뿐만 아니라 스프레드시트, 데이터베이스, 프레젠테이션 등 각종 응용 프로그램에서 모두 영어 발음기호의 입력이 가능함은 물론 각 프로그램 간 데이터 호환이 이루어지며, 특히 4단계 강세 체계까지 쉽게 입력할 수 있음에도 불구하고 개별모음 자판을 이용한 경우와 워드프로세서의 고유기능을 이용한 경우에 비해 입력속도가 크게 향상됨을 확인하였다.

피춰 추출 관점에서 기준 화자 수 증가에 따른 음성 인식 성능 분석 (Performance Analysis of Speech Recognition by Increasing the Number of Reference Speaker)

  • 이철희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 학술대회
    • /
    • pp.111-114
    • /
    • 1998
  • 음성을 인식하기 위해서는 주어진 음성을 미리 정한 기준 음성과 비교하여 가장 유사한 것을 갖는 과정을 거치게 된다. 같은 단어라도 화자에 따라서 발음 속도, 음의 강약이 틀리므로 화자 독립 음성 인식을 위해서는 여러 화자가 발음한 음성을 기준 음성으로 사용하여 인식 성능을 향상시킬 수 있다. 그러나 화자 수를 증가시켜도 인식 성능의 향상에는 한계를 보이고 있다. 이러한 문제점은 현재 음성에서 추출되는 피춰가 인식에 필요한 정보를 충분히 포함하지 않는 것과 인식 알고리즘의 효율성 등에서 원인을 찾을 수 있다. 본 논문에서는 남자 10명과 여자 10명이 발음한 한국어 숫자음을 인식 대상으로 하여 멜켑스트럼을 추출하고 DTW에 의해 인식을 수행하여 피춰 추출의 관점에서 화자 수 증가에 따른 인식률의 변화와 그 한계에 대해서 분석한다.

  • PDF

불어의 "묵음 e (e muet)"에 관한 연구 (Some notes on the French "e muet")

  • 이정원
    • 대한음성학회지:말소리
    • /
    • 제31_32호
    • /
    • pp.173-193
    • /
    • 1996
  • 불어의 "묵음 e(e muet)"에 대한 정의를 내리기는 매우 까다롭다. 불어에서 "e"가 "묵음 e(e muet)"로 불리우는 이유는 "e"가 흔히 탈락되기 때문이다. 현재 "e muet"는 다음 발화체에서 볼 수 있듯이 열린음절에서만 나타난다. "Je/le/re/de/man/de/ce/re/por/ta/ge/." [omitted](나는 그 리포트를 다시 요구한다. : 이 경우 실제 발화시 schwa 삭제 규칙이 적용된다.) 둘째, 접두사에 나타나는 "e muet"는 s의 중자음 앞에서 s가 유성음, [z]로 발음되는 것을 막기 위해 쓰인다. "ressembler[omitted](닮다); ressentir[omitted](느끼다)" 같은 경우, 셋째, 몇몇 낱말의 경우 고어의 철자가 약화되어 "e muet"로 발음이 되고 있다. "monsieur[$m{\partial}sj{\emptyset}$](미스터), faisan[$f{\partial}z{\tilde{a}}$](꿩), faisait[$f{\partial}z{\varepsilon}$]("하다"동사의 3인칭 단수 반과거형)"등. 또 과거 문법학자들은 이를 "여성형의 E"로 불렀는데, 이는 형태론적으로 낱말의 여성형을 남성형과 구분짓기 위해 사용되고 있기 때문이기도 하다. 예를 들어, "$aim{\acute{e}}-aim{\acute{e}}e$"(발음은 둘 다 [${\varepsilon}me$]로 동일하다 : 사랑받다)의 경우. 현대불어의 구어체어서 "e muet"는 어말자음을 발음하기 위해 쓰이고 있다. 예를 들어, "pote[pot](단짝)-pot[po](항아리)". 이러한 "e muet"는 발음상으로 지역적, 개인적 및 문맥적 상황에 따라 그 음색 자체가 매우 불안정하며 여러 가지 음가(열린 ${\ae}$ 또는 닫힌 ${\O}$)로 나타난다. 예를 들어 "seul[$s{\ae}l$](홀로), ceux[$s{\O}$](이것들)"에서와 같이 발음되며, 또한 원칙적으로 schwa, [${\partial}$]로 발음이 되는 "Je[$\Im\partial$]"와 "le[$l{\partial}$]"의 경우, Paris 지역에서는 "Je sais[${\Im}{\ae}{\;}s{\Im}$](나는 안다); Prends-le[$pr{\tilde{a}}{\;}l{\ae}$](그것을 집어라)"로 발음을 하는 한편, 프랑스 북부 지방세서는 동일한 발화체를 [${\ae}$]대신에 [${\o}$]로 발음한다. 실제로 언어학적 측면에서 고려되는 "e muet"는 schwa로 나타나는 "Je[$\Im\partial$]"와 "le[$l{\partial}$]"의 경우인데, 불어 음운론에서는 schwa에 의해 대립되는 낱말짝이 없기 때문에 schwa를 음소로 인정할 것인가에 대해 논란이 있다. 그러나 불어에서 schwark 음운론적 역할을 한다는 사실은 다음과 같은 예에서 찾아 볼 수 있다. 첫째, 발음상으로 동사의 변화형에서 "porte[$p{\jmath}rte$](들다: 현재형), porte[$p{\jmath}rte$](과거분사형), porta[$p{\jmath}rte$](단순과거형)"등이 대립되며, 이휘 "Porto[$p{\jmath}rte$](포르토)"와도 대립된다. 둘째, 어휘적 대립 "le haut[$l{\partial}o$](위)/l'eau[lo](물)"와 형태론적 대립 "le[$l{\partial}$](정관사, 남성단수)/les[le](정관사, 복수)"등에서 "묵음 e"는 분명히 음운론적 역할을 하고 있다. 본 논문에서는 이와 같이 음색이 복잡하게 나타나는 "e muet"의 문제를 리듬단위, 문맥적 분포 및 음절모형 측면, 즉 음성학 및 음운론적 측면에서 다양하게 분석하여 그 본질을 규명해 보고 "e muet"탈락현상을 TCG(Theorie de Charme et de Gouvernement) 측면에서 새롭게 해석해 보았다.

  • PDF

음성특징의 거리에 기반한 한국어 발음의 시각화 (Visualization of Korean Speech Based on the Distance of Acoustic Features)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.197-205
    • /
    • 2020
  • 한국어는 자음과 모음과 같은 음소 단위의 발음은 고정되어 있고 표기에 대응하는 발음은 변하지 않기 때문에 외국인 학습자가 쉽게 접근할 수 있다. 그러나 단어와 어구, 문장을 말할 때는 음절과 음절의 경계에서 소리의 변동이 다양하고 복잡하며 표기와 발음이 일치하지 않기 때문에 외국어로서의 한국어 표준 발음 학습은 어려운 면이 있다. 그러나 영어 같은 다른 언어와 달리 한국어의 표기와 발음의 관계는 논리적인 원리에 따라 예외 없이 규칙화 할 수 있는 장점이 있으므로 발음오류에 대해 체계적인 분석이 가능한 것으로 여겨진다. 본 연구에서는 오류 발음과 표준 발음의 차이를 컴퓨터 화면상의 상대적 거리로 표현하여 시각화하는 모델을 제시한다. 기존 연구에서는 발음의 특징을 단지 컬러 또는 3차원 그래픽으로 표현하거나 입과 구강의 변화하는 형태를 애니메이션으로 보여 주는 방식에 머물러 있으며 추출하는 음성의 특징도 구간의 평균과 같은 점 데이터를 이용하는데 그치고 있다. 본 연구에서는 시계열로 표현되는 음성데이터의 특성 및 구조를 요약하거나 변형하지 않고 직접 이용하는 방법을 제시한다. 이를 위해서 딥러닝 기법을 토대로 자기조직화 알고리즘과 variational autoencoder(VAE) 모델 및 마코브 확률모델을 결합한 확률적 SOM-VAE 기법을 사용하여 클러스터링 성능을 향상시켰다.

한국어 /ㅛ/의 발음 양상 연구: 발음형 빈도와 음향적 특징을 중심으로 (Pronunciation of the Korean diphthong /jo/: Phonetic realizations and acoustic properties)

  • 이향원
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.9-17
    • /
    • 2023
  • 이 연구의 목적은 한국어 이중모음 /ㅛ/가 다양한 언어학적 환경에서 어떠한 발음 변이 양상을 보이는지 밝히는 것이다. 특히 음성적 변이와 분포 범위의 연관성에 주목하여 /ㅛ/의 발음 양상을 논의하였다. 서울코퍼스의 여성 화자 10명의 발화에서 나타난 /ㅛ/의 운율적 위치(단음절, 어절 초, 어절 중, 어절 말)와 어휘 부류(내용어, 기능어)를 분석하였다. 각 환경에서 /ㅛ/의 출현 빈도를 파악한 결과, 운율적 위치에 따라 어휘 부류와 발음형 실현이 달라지는 양상을 보였다. 음향 분석을 통해 기능어에서 나타나는 /ㅛ/에서는 음성적 약화가 빈번하게 일어나는 것을 확인하였다. 어휘 부류는 /ㅛ/의 평균적인 음가를 달라지게 하지는 않았지만 개별 토큰의 분포 양상에서는 차이가 발견되었다. 이를 통해 언어학적 환경이 모음의 음성적 분포 양상에 영향을 미친다는 것을 알 수 있었다.