• 제목/요약/키워드: 발음 판별

검색결과 11건 처리시간 0.033초

구개열 환자 발음 판별을 위한 특징 추출 방법 분석 (Analysis of Feature Extraction Methods for Distinguishing the Speech of Cleft Palate Patients)

  • 김성민;김우일;권택균;성명훈;성미영
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1372-1379
    • /
    • 2015
  • 본 논문에서는 구개열 환자의 장애 발음과 정상인의 발음을 자동으로 구분하여 판별하는데 사용될 수 있는 특징 추출 방법들의 성능을 분석하는 실험에 대하여 소개한다. 이 연구는 발성 장애인의 복지 향상을 추구하며 수행하고 있는 장애 음성 자동 인식 및 복원 소프트웨어 시스템 개발의 기초과정이다. 실험에 사용된 음성 데이터는 정상인의 발음, 구개열 환자의 발음, 그리고 모의 환자의 발음의 세 그룹으로부터 수집된 한국어 단음절로서 14개의 기본 자음과 5개의 복합 자음, 7개 모음이다. 발음의 특징 추출은 LPCC, MFCC, PLP의 세 가지 방법으로 각각 수행하였고, GMM 음향 모델로 인식 훈련을 한 후, 수집된 단음절 데이터를 대상으로 하여 인식 실험을 실시하였다. 실험 결과, 정상인과 구개열 환자의 장애 발음을 구별하기 위하여 특징을 추출함에 있어서 MFCC 방법이 전반적으로 가장 우수하였다. 본 연구의 결과는 구개열 환자의 부정확한 발음을 자동으로 인식하고 복원하는 연구와 구개열 장애 발음의 정도를 측정할 수 있는 도구에 대한 연구에 도움이 될 것으로 기대된다.

Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별 (Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization)

  • 이창수;천주룡;김주근;김태일;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.76-81
    • /
    • 2017
  • 외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

  • PDF

Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별 (Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization)

  • 이창수;천주룡;김주근;김태일;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.76-81
    • /
    • 2017
  • 외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

  • PDF

일본인을 대상으로 한 영어 청취판별 테스트 (English auditory discrimination test for Japanese)

  • 이현복;송윤경;공정혜
    • 대한음성학회지:말소리
    • /
    • 제37호
    • /
    • pp.119-128
    • /
    • 1999
  • 이 논문의 목적은 일본 학생들의 영어 청취 능력에 대한 확실한 평가를 내릴 수 있는 청취판별테스트를 개발하는 데에 있다. 이 테스트를 통하여 일본사람들이 범하는 청취 오류를 평가, 분석하고 일본어의 음성·음운체계가 이러한 오류에 미치는 영향을 평가한다. 테스트의 결과는 청취 및 발음훈련에 적용될 수 있으므로 일본인의 영어 능력을 향상시키는데 공헌할 수 있을 것이다.

  • PDF

영어 단어 학습 애플리케이션 설계 및 구현 (A Design and Implementation of English Word Learning Application)

  • 이원주;이기원;이민철;이진호;허민호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.59-60
    • /
    • 2022
  • 본 논문에서는 유아 영어 단어 학습 애플리케이션을 설계하고 구현한다. 이 애플리케이션은 키넥트 센서의 음성 인식 기능을 활용하여 동물과 음식 분야의 단어 학습 기능을 제공한다. 화면에 출력된 이미지에 해당하는 영어 단어를 말하면 키넥트 센서에서 그 음성을 인식하여 해당 단어의 발음이 정확한지 판별한다. 주어진 시간 내에 다양한 단어를 정확하게 발음함으로써 높은 점수를 취득하도록 구현한다.

  • PDF

음절신호의 음소 분리와 시간-주파수 판별 패턴의 설정 (Phoneme Separation and Establishment of Time-Frequency Discriminative Pattern on Korean Syllables)

  • 류광열
    • 한국통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.1324-1335
    • /
    • 1991
  • 본 논문은 음절을 음소로 분리하고 각각의 특징을 추출하여 음소를 판별할 수 있는 패턴을 설정하는 실험에 관한 연구이다. 음소분리는 피치검출, 각 성문피크펄스의 폭, 포락실, 진폭의 바이어스, 발성시간 등의 파라메타를 적용한다. 최초의 피치는 성문펄스의 폭, 에너지, 정규화와 성문피크의 가변바이어스 등의 변화에 따라 모음 포라선의 봉우리 부분에서 검출, 이를 기준으로 전체의 피치구간을 추적한다. 모음은 포만트 패턴의 유동을 감소시키는 방법과 제2포만트만으로 모음의 판별이 가능함을 제시하며, 피치 고저에 무관한 압축파형을 추정한다. 자음은 포락실, 스펙트럼, 압추파형, 분석방법 등을 발음방법과 음소 상호 영향에서 패턴을 추출한다. 실험결과 모음음소 90%, 초성자음80%, 종성자음 60% 판별된다.

  • PDF

한국 EFL 학생들의 영어 순자음 인지 (Identification of English Labial Consonants by Korean EFL Learners)

  • 초미희
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.186-191
    • /
    • 2006
  • 기존의 유표성 이론에 따르면 마찰음이 파열음보다 유표적이므로 발음하기 어렵다는 것은 잘 알려진 사실이다. 따라서 본 연구에서는 한국 EFL 학습자들이 발음하기 어려운 마찰 [f, v]를 어떻게 인지하는지 살펴보기 위해서 영어 순자음 [p, b, f, v]를 판별하는 실험을 기획하였다. 40명의 한국 학생들이 영어 순자음이 들어간 임시어를 인지하는 테스트를 실행한 결과, 순자음의 운율적 위치가 인지 정확도를 결정짓는데 영향을 마침을 발견하였다. 특히 유표성 이론의 예상과 달리, 무성 마찰음 [f]의 정확도가 강세 뒤 모음사이의 위치를 제외한 모든 위치에서 높게 나왔다. 영어 순자음의 평균 인지 정확도는 강세 앞 모음사이 위치와 어두 초성에서 높은 반면에 어말 종성과 강세 뒤 모음사이 위치에서는 낮았다. 한국 학생들의 영어 순자음 인지에는 유표성 이론뿐 만 아니라 음향학적 두드러짐과 강세를 포함하는 청각적인 요소도 작용함을 보여주고 있다.

  • PDF

한국 EFL 학습자들의 영어 순자음의 인지 (Identification of English labial consonants by Korean EFL learners)

  • 초미희
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.788-791
    • /
    • 2006
  • 기존의 유표성 이론에 따르면, 마찰음이 파열음보다 유표적이므로 발음하기 어렵다는 것은 잘 알려진 사실이다. 따라서 본 연구에서는 한국 EFL 학습자들이 발음하기 어려운 마찰음 [f, v]를 어떻게 인지하는지 살펴보기 위해서 영어 순자음 [p, b, f, v]를 판별하는 실험을 기획하였다. 40명의 한국 학생들이 영어 순자음이 들어간 임시어를 인지하는 테스트를 실행한 결과, 순자음의 운율적 위치가 인지 정확도를 결정짓는데 영향을 미침을 발견하였고 특히 유표성 이론의 예상과 달리 무성 마찰음[f]의 정확도가 비강세 모음사이의 위치를 제외한 모든 위치에서 높게 나왔다. 영어 순자음의 평균인지 정확도는 강세 모음사이와 어두 초성에서 높은 반면에 어말 종성과 비강세 모음사이에서는 낮았다.

  • PDF

한국 학습자들의 영어 순자음 혼동 (Confusion in the Perception of English Labial Consonants by Korean Learners)

  • 초미희
    • 한국콘텐츠학회논문지
    • /
    • 제9권1호
    • /
    • pp.455-464
    • /
    • 2009
  • 영어 마찰음을 발음하기 어려운 점은 잘 알려졌는데, 한국 대학생들이 마찰음을 포함하는 영어 순자음을 인지하는데도 마찬가지로 어려움을 느끼는지 알아보기 위하여 40명의 한국 대학생들을 대상으로 영어 순자음이 들어간 임시어를 4가지 다른 운율적 위치(초성, 종성, 강세 앞 모음사이, 강세 뒤 모음사이)에서 인지하는 테스트를 실행하였다. 실험 참가자들은 초성이나 강세 앞 모음사이처럼 강한 위치의 자음을 종성이나 강세 뒤 모음사이의 약한 위치보다 더 정확하게 판별하는 인지패턴을 보여주었다. 한국 학생들의 인지의 어려움은 모든 운율 위치에서 영어 목표자음의 조음방법 혼동 때문에 대부분 발생하였다. 그밖에, 조음장소와 유무성의 혼동도 일어났는데, 조음장소의 혼동은 모든 운율 위치에서 주로 [f]의 음향적 속성 때문에 일어났으며 유무성의 혼동은 운율 위치의 영향 때문에 발생하였다. 이러한 조음방법, 조음장소, 유무성의 혼동은 목표자음의 음성적 속성 그리고/또는 피실험자의 모국어 속성으로 설명되었다.

CSL을 통한 음향특성과 사상체질간의 상관성 연구 (An Study on the Correlation between Sound Characteristics and Sasang Constitution by CSL)

  • 신미란;김달래
    • 사상체질의학회지
    • /
    • 제11권1호
    • /
    • pp.137-157
    • /
    • 1999
  • 1. 연구배경 사상인은 생리 및 병리 현상에 차이를 나타낼 뿐만 아니라 섭생법 및 치료법에서도 각기 다른 방법을 적용하고 있다. 그러므로 사상의학에 있어서 체질변증분야가 매우 중요한 과제라 하겠다. 동무는 사상인변증의 진단지표를 외형 심성 병증 등을 제시하였고, 많은 의가들에 의해 여러 가지 새로운 체질변증의 방법이 모색되어 임상에 시도 활용되고 있는 추세이나 체질변증의 객관성유지에 어려운 점이 많아서 학문의 발전에 적지 않은 난관이 따랐다. 최근에는 음성과학의 발달에 힘입어 음성의 특성을 가시적 수치적으로 객관화 할 수 있는 가능성이 높아졌다. 본 연구는 이러한 음성과학을 바탕으로 여러 의가들에 의해 제시되어 온 사상인의 음성적 특정을 각 개인의 사상체질과 직접적으로 연관성이 있다고 판단되는 공명주파수와 기본주파수 등 여러 음성학적인 pattern자료들을 모집단으로부터 획득하여 체질별로 객관적인 수치로 비교 분석함으로써 음성과 체질과의 관계에 대하여 살펴보고 개인의 성문에 의한 사상체질 판단의 기본자료로 활용하고자 하였다. 2. 연구방법 상지대한의과대학 남학생 132명과 기타8명을 대상으로 하였다. 음향특성과 체질과의 상관성에 관하여 문헌조사를 하였다. 설문지와 체질전문가에 의하여 연구대상자를 체질 판별하였다. 연구대상자의 음성특성에 대한 설문조사를 하였고 CSL로 Pitch. Formant Frequency. Energy, Time of reading composition 등을 분석하고 통계 처리하여 체질 판별을 시도하였다. 3. 연구결과 1) 설문조사결과 소음인은 음성이 낮고 완만하며 조용한 편으로, 소양인은 음성이 높고 밝으며 급하고 함부로 말을 하는 것으로, 태음인은 음성이 낮고 무거우며 완만하고 굵고 성량이 풍부한 것으로 나타났다. 2) 문장의 평균 발음 시간에서 태양인은 다른 체질에 비하여 유의성 있게 길었다. 몸무게에서 태음인은 다른 체질에 비하여 유의성 있게 높았다. Formant frequency 1에서는 태양인이, Bandwidth 1에서는 소음인과 태양인이 다른 체질에 비하여 유의성 있게 낮았으며, Bandwidth 2와 Formant frequency 5에서는 태양인이 유의성 있게 높았다. Pitch Maximum과 Pitch Maximum-Pitch Minimum에서는 소음인과 태양인이 유의성 있는 차이를 나타내었다. Energy Mean에서는 태양인과 태음인에서 유의성 있는 차이를 나타내었다. 3) Multi-dimensional 4-class minimum-distance classifier 분석결과 모든 항목으로 분석한 것 보다 체질별로 특정 항목을 갖고 분석한 것이 높은 일치를 나타내었다. SPSS/PC+프로그램에서 일원분산분석과 판별분석결과 네 체질사이에서의 정판별력보다 소양인을 제외한 3체질 사이에서의 정판별력이 높았다. CART모형에서 앞에서 제시된 다른 방법들보다 높은 예측율을 보이고 있다. 연구수행과정 중에 표준화, 녹음기술, 적적한 문장의 선택, 음성분석 항목선택, 통계기법, 적절한 알고리즘의 개발 등의 많은 문제점이 나타나고 있으며 관련분야의 보완과 연구진행이 지속적으로 있어야 할 것으로 사려 된다. 다각도로 진행되고 있는 사상의학에서의 객관화 노력과 통계적인 방법론들이 적용되고 체질진단에 있어 가장 최적의 알고리즘을 찾아낼 수 있다면, 정확한 체질 진단과 더불어 그에 따른 환자들의 치료와 약물처방에 있어서도 많은 도움을 줄 수 있으리라 생각된다. 성문과 음성특성의 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다.

  • PDF