• 제목/요약/키워드: 한국어 발화 분석

검색결과 128건 처리시간 0.021초

한국어 학습자를 위한 드라마 <도깨비> 속 관용표현 교육 방안 연구 (A Study Regarding Education Method on Idiomatic Expressions Appearing in the Korean Drama for Learners of Korean Language)

  • 송대헌
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권5호
    • /
    • pp.181-191
    • /
    • 2020
  • 이 연구는 일상생활에서 쉽게 접할 수 있는 드라마를 한국어 교육에 활용하여 한국어 관용표현의 효율적 교수·학습 방향을 제시하는 것을 목적으로 한다. 한국어 학습자들의 흥미와 교육적 효과를 높이기 위해서 한국에서 인기리에 방영된 드라마 <도깨비>를 교육 자료로 활용하였다. 관용표현은 한국의 역사와 문화, 사회적 배경을 통해 형성되어 사용하고 있기 때문에 한국의 문화와 정서가 담겨있는 드라마는 관용표현의 교수·학습에 적합한 자료라고 할 수 있다. 한국어 교육용 관용표현을 선정하기 위해 드라마 <도깨비>를 분석하여 실제 발화된 어휘를 바탕으로 드라마 내에서 277개의 유의미한 어휘를 추출하였다. 그중 중복 표현된 어휘를 제외하고 기준으로 124개의 관용표현을 분류하였다. 이렇게 분류한 관용표현은 사용 빈도 2회 이상의 어휘를 기본으로 하여 학습자 수준에 맞는 교육용 관용표현 선정을 위해 어휘의 난이도를 고려하여 최종 한국어 교육용 관용표현 46개를 선정하였다. 마지막으로 드라마 <도깨비>에서 선정한 자료를 교육적으로 활용할 때 교수·학습의 유의사항과 초급, 중급, 고급 등급별 관용표현의 교육 방향을 제시하였다.

비핵심어 모델의 가중치 기반 핵심어 검출 성능 향상에 관한 연구 (A Study of Keyword Spotting System Based on the Weight of Non-Keyword Model)

  • 김학진;김순협
    • 정보처리학회논문지B
    • /
    • 제10B권4호
    • /
    • pp.381-388
    • /
    • 2003
  • 본 논문에서는 핵심어 검출기의 성능 향상을 위해 가베지 클라스 클러스터링과 함께 필러 모델에 가중치론 부여하는 방안 및 태스크 도메인 이용자들의 발화 음성의 성향 분석을 통해 핵심어 천이 확률을 계산하여 핵심어 검출기반 대화 음성처리 시스템의 처리 시간 단축 방안을 제안한다. 제안한 방법은 음성학적으로 유사한 음소끼리 묶어서 사용함으로써 하나의 음소는 잘 표현하지 못하지만 비슷한 음소 그룹의 표현에는 유용한 방법으로 본 논문에서는 한국어 형태론과 태스크 도메인으로 선정한 증권거래 대화음성처리 시스템에서 활용되는 발화 문장을 분석하여 5 음소군을 제시한다. 또한 이들 음소군에 태스크 종속적인 필러 모델 가중치를 부여하며, 두 번째로는 시스템의 처리시간 단축을 위해 연속 발화 문장 속에 포함되어 있는 핵심어 천이 확률을 계산하여 시스템에 적용 실험한다. 제안한 시스템의 성능 평가를 위해 태스크 도메인에 활용되는 4,970 문장의 코퍼스를 구축하고, 이용자 중 20대∼30대 5명이 발성하게 하여 실험한 결과, 제안한 5 음소군에 가중치를 부여한 방법의 FOM은 87.5%로 Yapanel[1]의 7음소군 85.5%보다 우수한 성능을 보였으나, LVCSR의 89.8%보다는 약간 뒤지는 성능을 확인하였다. 계산시간에 있어서도 0.70초로 7음소군의 0.72초보다 우수한 성능을 보였다. 핵심어 천이 확률 분석을 통한 인식 시간 단축 실험에서는 천이 확률을 적용했을 때 약 0.04초∼0.07초의 처리 시간을 단축하는 것을 확인하였다.

뇌성마비 마비말장애 성인의 파찰음 실현 양상 분석 (Acoustic analysis of Korean affricates produced by dysarthric speakers with cerebral palsy)

  • 문지현;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.45-55
    • /
    • 2021
  • 본 연구는 경직형 경도-중등도 뇌성마비 마비말장애 성인이 산출한 한국어 파찰음의 음향학적인 특징을 분석한다. 한국어의 마찰음과 파찰음은 조음오류가 빈번하게 발생하는 자음인데, 기존 연구들은 마찰음에만 집중했다. 따라서 본 연구에서는 마비말장애 화자가 산출한 파찰음을 음향학적으로 분석하고자 한다. QoLT_SPEECH_2014 데이터베이스 내에서 파찰음 /tɕ, tɕh, ͈tɕ/이 어두 초성 및 어중 초성에 위치하는 단어를 선정하여 경도-중등도 경직형 장애 남성 화자 6명과 비장애 남성 화자 5명의 발화 데이터를 분석에 사용하였다. 한국어의 파찰음의 특성을 고려하여 파찰음의 음향학적 특징을 나타내는 매개변수를 선정하여 분석을 시행하였다: 마찰구간의 길이, 묵음 구간의 길이, 무게중심, 분산, 왜도, 첨도, 중심적률. 분석 결과는 다음과 같다: 1) 어중 초성 파찰음에서 마비말장애인이 유의하게 긴 마찰구간의 길이를 보였다, 2) 마비말장애인이 유의하게 긴 묵음 구간의 길이를 보였다, 3) 무게중심의 경우 두 집단 간의 유의한 차이가 존재하지 않았다, 4) 마비말장애인이 유의하게 큰 왜도 값을 보였다, 5) 마비말장애인이 유의하게 큰 중심적률 값을 보였다. 본 연구는 마비말장애인이 산출한 파찰음의 특성을 분석하고, 비장애인이 산출한 파찰음과의 차이를 밝혔다.

한국어 /ㅛ/의 발음 양상 연구: 발음형 빈도와 음향적 특징을 중심으로 (Pronunciation of the Korean diphthong /jo/: Phonetic realizations and acoustic properties)

  • 이향원
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.9-17
    • /
    • 2023
  • 이 연구의 목적은 한국어 이중모음 /ㅛ/가 다양한 언어학적 환경에서 어떠한 발음 변이 양상을 보이는지 밝히는 것이다. 특히 음성적 변이와 분포 범위의 연관성에 주목하여 /ㅛ/의 발음 양상을 논의하였다. 서울코퍼스의 여성 화자 10명의 발화에서 나타난 /ㅛ/의 운율적 위치(단음절, 어절 초, 어절 중, 어절 말)와 어휘 부류(내용어, 기능어)를 분석하였다. 각 환경에서 /ㅛ/의 출현 빈도를 파악한 결과, 운율적 위치에 따라 어휘 부류와 발음형 실현이 달라지는 양상을 보였다. 음향 분석을 통해 기능어에서 나타나는 /ㅛ/에서는 음성적 약화가 빈번하게 일어나는 것을 확인하였다. 어휘 부류는 /ㅛ/의 평균적인 음가를 달라지게 하지는 않았지만 개별 토큰의 분포 양상에서는 차이가 발견되었다. 이를 통해 언어학적 환경이 모음의 음성적 분포 양상에 영향을 미친다는 것을 알 수 있었다.

좌반구 손상과 우반구 손상 뇌졸중 환자의 의문문 유형에 따른 운율 특성 비교 (Comparison of prosodic characteristics by question type in left- and right-hemisphere-injured stroke patients)

  • 유영미;성철재
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.1-13
    • /
    • 2021
  • 의사소통에 중요한 역할을 하는 운율은 기능에 따라 언어적 운율과 정서적 운율로 구분한다. 대뇌 편재화 관점에서 정서적 운율 처리는 우반구가 주로 담당한다는 결과가 일반론적으로 받아들여지지만, 언어적 운율에 대한 연구들은, 연구간의 방법적인 차이로 인해 결과가 상이하게 나타난다. 본 연구는 정상 화자 9명과 뇌졸중 환자 14명(좌반구 손상 7명, 우반구 손상 7명)의 세 집단을 대상으로 대뇌 편재화의 관점에서 언어적 운율 특성을 살펴보기 위해 세 가지 형태 의문문(의문사 의문문, 예-아니오 의문문, 선택 의문문)에서의 발화속도, 지속시간, 음도, 강도와 관련된 운율 특징을 청지각 평가와 함께 살펴보았다. 연구결과, 통계적으로 유의한 주요변수들이 좌반구 손상 환자의 자료에서 결함을 보였으며, 예-아니오 의문문과 선택 의문문보다 의문사 의문문에서 더욱 두드러졌다. 이러한 경향은 특히 음도와 발화속도 관련 변수들에서 두드러졌다. 본 연구의 결과는 한국어 사용자의 의문사 사용에 있어서 어휘-의미론적, 구문론적 정보와 같은 언어학적으로 관련 있는 운율 처리의 경우 우반구보다 좌반구에서 대체로 우세하다는 점을 방증한다.

현대 한국어 접속어미 '-니까'의 인지.화용론적 연구 시론 (A Cognitive Pragmatic Approach to Discourse Connectives)

  • 서성교
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.460-475
    • /
    • 1994
  • 이 논문에서는 적합성 이론(Relevance Theory)에 의해서 현대 한국어 접속어미, 특히 담화표지(discourse marker) '-니까'가 담화의 이해에 어떻게 기여하는가를 고찰하고자 한다. '-니까'는 이제까지 '-(으)니-'와 별 의미나 기능의 차이가 없는 것으로 간주되어 왔는데, 이는 기존의 연구가 주로 통사 의미론적인 관점에서 수행되어 온 데 기인한다. 그러나 '-니까'는 엄연히 '-(으)니-'와 별개로 존재하고 있고, 더욱이 통시적으로 '-(으)니-' 보다는 '-니까'가 나중에 나타났다는 점을 고려한다면, '-니까'는 '-(으)니-'에 없는 특정한 기능을 반드시 수행하리라는 추측이 가능하다. 따라서 이 논문에서는 기존의 통사 의미적인 관점이 아닌 인지 화용론적 관점에서 '-(으)니-'와 '-니까'에 대한 새로운 분석을 시도하고자 한다. 아울러 '-니까'를 포함하는 '그러니까'도 함께 살펴보려고 한다. '그러니까'는 담화상에서 그에 선행하는 모든 정보를 맥락적 배경지식으로 놓고, 후속되는 발화를 그에 대한 맥락 함축(contextual implication)으로 나타내는 화용론적 기능을 담당하는 담화 연결표현이라고 주장하고자 한다. 영어의 'so'가 'therefore', 'thus', 'hence' 등과 구별되고, 그 기준이 적합성 원리에 의해 설명될 수 있듯이, 우리말의 '그러니까' 역시 '그래서', '그러므로' '그러니' 등과 구별되며, 그 차이점이 적합성 원리로 설명될 수 있다는 점을 보일 것이다. 더 나아가서, 현대 한국어의 여타 접속어미에도 본고에서와 같은 새로운 관점 또는 이론의 틀로써 잘 설명될 수 있는 현상이 존재하는지의 여부를 폭넓고 정밀하게 분석 연구하는 일이 요구된다는 점을 나타내고자 한다.편 어류에 함유된 유기주석화합물의 비율을 볼 때, BT 화합물의 경우 MBT 비율이 높게 나타난 반면 PT 화합물에서는 TPT 비율이 높게 나타났다. 전체적으로 볼 때 구룡포항에서 수획한 어패류의 유기주석화합물 농도는 국내 다른 항구의 어패류보다 높지 않은 것으로 나타났다.${\lrcorner}$ 내는 경우가 더 많았으며(75.4%), 남 여 대학생간 에는 고도로 통계적 유의성(p<0.001)이 인정되었다. 4. 음식선택 배경은 ${\ulcorner}$자신${\lrcorner}$이 결정하는 경우가 가장 많았고(52.1%), 선호하는 음식은 치킨, 햄버거, 피자 순이었으며, 남 여 대학생간에는 고도로 통계적 유의차(p<0.001)가 있었다. 즐기는 음료로는 ${\ulcorner}$콜라${\lrcorner}$가 가장 많았으며(46.8%), 그 다음은 사이다, 주스 등의 순으로 나타났으나, 남 여 대학생간에는 유의성있는 차이는 없었다. 음식의 먹는 시기는 점심과 저녁사이의 ${\ulcorner}$간식${\lrcorner}$이 가장 많았으며(42.2%), 남 여 대학생간에는 유의한 차이는 없었다. 패스트푸드는 많은 사람들이 ${\ulcorner}$${\lrcorner}$이 좋기 때문에 이용하며(62.8%), 남 여 대학생간에는 통계적 유의성(p<0.05)이 인정되었다. 5. ${\ulcorner}$입맛의 서구화(36.4%)와 외식을 선호(29.1%)${\lrcorner}$ 하기 때문에 패스트푸드를 이용하게 된 것으로 응답 하였으며, 남 여 대학생

  • PDF

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

한국인 영어학습자의 명사구 발화에서 영어 능숙도에 따른 관사와 단음절 명사 모음 길이 비교 (Comparison of vowel lengths of articles and monosyllabic nouns in Korean EFL learners' noun phrase production in relation to their English proficiency)

  • 박우지;모란;이석재
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.33-40
    • /
    • 2020
  • 본 연구는 기능어인 관사 및 1음절 내용어 명사로 구성된 명사구 내 두 단어의 모음 길이 비율과 영어 능숙도 사이의 상관관계를 밝히는 데 목적이 있다. 영어와 한국어 발음에 있어서 대표적 차이 중 하나는 발음상의 리듬이라는 특정적인 요소가 규칙적으로 나타나는지 여부이다. 특히 영어 발화시 내용어는 기능어 대비 상대적으로 더 두드러진(prominent) 소리를 가지게 되는데 이는 영어에서 내용어의 경우 강세를 갖게 되나 기능어의 경우 그 강세가 미비하거나 강세를 갖지 않기 때문이다. 따라서 영어의 내용어 단어 내 모음은 기능어 단어의 모음보다 길게 발음되며, 더 큰 소리로 발화되며, 더 높은 소리를 가지고 리듬을 만들어 내게 된다. 이를 근거로 본 연구에서는 내용어 내 강세를 갖는 모음과 기능어 내 강세를 갖지 않는 모음의 길이 차이에 초점을 두고 유창성이 평가된 L2 영어 음성 코퍼스(Rated K-SEC) 중 한국인 초등학생이 발화한 879(원어민 발화 20개 포함)개의 문장 내 명사구 음성 파일을 연구자료로 사용하였다. 이 879개의 문장은 영어 유창성 평가에 따라 4개의 등급으로 각각 재분류되었으며 이들 문장안에 들어 있는 명사구 내의 관사의 모음 길이와 명사의 모음 길이를 확인하고 그 비율을 측정하였다. 분석 결과 관사 모음 대비 명사 모음 길이 비율은 영어 능숙도와 양의 상관관계를 갖는 것을 확인하였다[Advanced(2.453)>Intermediate High(1.26)>Intermediate Low(1.034)>Novice(0.857)]. 또한 각 능숙도 그룹 간 내용어-기능어 간 모음 길이의 차이 및 그 비율의 차이가 통계적으로 유의미한 것으로 나타났다(p< .001). 이는 한국인 화자의 경우 영어 유창성이 높아질수록 영어 단어 발화 시 명사구 내의 기능어인 관사 모음보다 내용어인 명사 모음을 통계적으로 유의하게 더 길게 발화한다는 것을 의미한다.

Performance Comparison of Korean Dialect Classification Models Based on Acoustic Features

  • Kim, Young Kook;Kim, Myung Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.37-43
    • /
    • 2021
  • 말소리의 음향 특징을 이용하여 화자에 대한 중요한 사회, 언어학적 정보를 얻을 수 있는데 그 중 한 가지 핵심 특징은 방언이다. 화자의 방언 사용은 컴퓨터와의 상호작용을 방해하는 주요 요소이다. 방언은 발화의 음소, 음절, 단어, 문장 및 구와 같이 다양한 수준에서 구분할 수 있지만 이를 하나하나 식별하여 방언을 구분하기는 어렵다. 이에 본 논문에서는 음성 데이터의 특성 중 MFCC만 사용하는 경량화된 한국어 방언 분류 모델을 제안한다. 한국인 대화 음성 데이터를 통해 MFCC 특징을 활용하는 최적의 방법을 연구하고, 8가지 머신 러닝 및 딥러닝 분류 모델에서 경기/서울, 강원, 충청, 전라, 경상 5개의 한국어 방언 분류 성능을 비교한다. MFCC를 정규화하는 방법으로 대부분의 분류 모델에서 성능을 향상시켰으며, MFCC를 정규화하기 전 분류 모델의 최고 성능과 비교하여 정확도는 1.07%, F1-score는 2.04% 향상된 성능을 기록하였다.

대화체 문장 번역을 위한 토큰기반 변환중심 한일 기계번역 (A Token Based Transfer Driven Koran -Japanese Machine Translation for Translating the Spoken Sentences)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제4권4호
    • /
    • pp.40-46
    • /
    • 1999
  • 본 논문에서는 음성언어 자동 통역시스템의 일부 모듈로 구현한 한일 기계번역 시스템을 소개하였다. 이 번역시스템은 예제중심 기계번역(EBMT)에 기초를 둔 변환중심 기계번역(TDMT) 방법을 기반으로 구현하였다. 본 시스템에서는 토큰(TOKEN)이라는 새로운 번역단위를 정의하여 사용하였다. 토큰단위의 번역방법을 사용함으로써 한국어 문장의 매우 비 정형적인 점을 해결하고 번역의 질을 높일 수 있다. 본 시스템의 구문분석 단계에서는 대역어를 선정하기에 적합한 정도까지의 의존트리를 생성하는 간이파싱만을 함으로써 필요없는 노력을 경감시켰다. 대역어 사전은 한국전자통신 연구원이 수집한 음성 데이터베이스로부터 추출한 말뭉치를 사용해 구성하였다. 구현한 시스템은 여행 계획영역에서 수집된 600 발화 안의 문장을 대상으로 시험하였는데 제한된 환경에서 87%, 아무런 제약이 없는 환경에서는 71%의 성공률을 보였다.

  • PDF