통합 검색 | Korea Science

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

박영희;정민화
- 한국음향학회지
- /
- 제21권3호
- /
- pp.330-338
- /
- 2002
대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.
PDF KSCI

대화 시스템의 말뭉치 구축을 위한 Object-Action 반자동 추출기 (Semi-Automatic Object-Action Extractor to Build the Utterance Corpus for the Dialogue System)

윤정민;황재원;고영중
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
- /
- pp.220-223
- /
- 2015
본 논문은 대화 시스템에서 사용되는 말뭉치의 구축을 위해 Object와 Action을 반자동으로 추출하는 도구에 대해 기술한다. 제안하는 추출 도구는 형태소 분석과 의존 구문 분석의 결과를 기반으로 적절한 Object와 Action을 추출하는 것에 목표를 두고 있다. 그러나 형태소 분석과 의존 구문 분석의 결과는 여러 가지 오류가 포함될 수 있다. 이러한 오류는 잘못된 Object와 Action의 추출로 이어질 수 있다. 그리고 Object의 추출에 있어 해당 명사의 격이 중요한 정보를 가진다. 하지만 한국어의 특성한 조사의 생략 등으로 인해 격 태깅의 모호성이 발생하게 된다. 따라서 본 논문에서 제안하는 반자동 추출기는 형태소 분석과 의존 구문 분석의 잘못된 결과를 사용자가 손쉽게 수정할 수 있도록 하고 모호성이 발생할 수 있는 Object를 사용자에게 알려주어 올바른 Object와 Action의 추출을 가능하게 한다. 추출기를 이용한 말뭉치의 구축은 1) 형태소 분석 2) 의존 구문 분석 3) Object-Action 추출의 단계로 진행된다. 실험에서 사용된 발화는 관광 회화용 대화 시스템의 숙박, 공항 영역의 500개의 발화이며, 이 중 259개의 발화가 태깅 시 모호성이 발생하는 발화이다. 반자동 추출기를 통해 모호성이 발생한 발화를 태깅한 결과 전체 발화 중 51.8%의 발화를 빠르고 정확하게 태깅할 수 있었다.
PDF

영어원어민 강사와 비원어민 학생 간의 대화에서 의사소통을 위한 협상 (Negotiation in Conversations between Native Instructors and Non-native Students of English)

차미양
- 융합정보논문지
- /
- 제12권4호
- /
- pp.158-165
- /
- 2022
본 연구는 영어원어민과 비원어민이 영어로 대화할 때 의사소통을 위해 어떻게 상호 협상하는가를 조명하고자 하였다. 본 연구에는 영어원어민 20명과 한국 대학생 20명으로 총 40명이 참여하였다. 참여자들은 한 명의 영어원어민과 한 명의 비원어민으로 한 쌍을 이루는 식으로 해서 20쌍으로 나뉘었다. 데이터 수집을 위해서 참여자들에게 영어로 대화할 수 있는 과제들이 주어졌고 그들의 대화는 녹음되었다. 총 37개의 녹음된 대화가 전사되었고 전사된 대화는 분석에 사용되었으며 통계분석들을 실시하였다. 본 연구결과에 의하면, 영어원어민과 비원어민 모두 성공적인 의사소통을 위해 상호 노력한 것으로 나타났다. 특히 원어민들은 대체로 비원어민들이 말을 할 수 있도록 부추기며 대화의 자연스러운 흐름을 주도하는 역할을 한 반면에 비원어민들은 그들의 목표언어 능력의 부족으로 인하여 대화전략들을 많이 구사한 것으로 드러났다. 비원어민들은 대화를 지속하기 위해 광범위한 전략들을 활용하였다. 본 연구의 결과는 원어민과 비원어민 간의 상호작용에 대한 이해를 높이며 교육적인 시사점을 내포한다.
https://doi.org/10.22156/CS4SMB.2022.12.04.158 인용 PDF KSCI

MTRNN을 이용한 한국어 대화 모델 생성 (Korean Dialogue Modeling using MTRNN)

신창욱;차정원
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
- /
- pp.285-287
- /
- 2017
본 논문에서는 Multi-layer sequence-to-sequence 구조를 이용해 한국어 대화 시스템을 개발하였다. sequence-to-sequence는 RNN 혹은 그 변형 네트워크에 데이터를 입력하고, 입력이 완료된 후의 은닉층의 embedding에 기반해 출력열을 생성한다. 우리는 sequence-to-sequence로 입력된 발화에 대해 출력 발화를 내어주는 대화 모델을 학습하였고, 그 성능을 측정하였다. RNN에 대해서는 약 80만 발화를, MTRNN에 대해서는 5만 발화를 학습하고 평가하였다. 모델의 결과로 나타난 발화들을 정리하고 분석하였다.
PDF

MTRNN을 이용한 한국어 대화 모델 생성 (Korean Dialogue Modeling using MTRNN)

신창욱;차정원
- 한국어정보학회:학술대회논문집
- /
- 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
- /
- pp.285-287
- /
- 2017
본 논문에서는 Multi-layer sequence-to-sequence 구조를 이용해 한국어 대화 시스템을 개발하였다. sequence-to-sequence는 RNN 혹은 그 변형 네트워크에 데이터를 입력하고, 입력이 완료된 후의 은닉층의 embedding에 기반해 출력열을 생성한다. 우리는 sequence-to-sequence로 입력된 발화에 대해 출력 발화를 내어주는 대화 모델을 학습하였고, 그 성능을 측정하였다. RNN에 대해서는 약 80만 발화를, MTRNN에 대해서는 5만 발화를 학습하고 평가하였다. 모델의 결과로 나타난 발화들을 정리하고 분석하였다.
PDF

자유발화형 음성대화처리 기술동향 (Trends of Spontaneous Speech Dialogue Processing Technology)

권오욱;최승권;노윤형;김영길;박전규;이윤근
- 전자통신동향분석
- /
- 제30권4호
- /
- pp.26-35
- /
- 2015
모바일 혁명 빅데이터와 사물인터넷 시대에 접어들면서 인간의 음성과 말로 다양한 장치와 서비스를 제어하고 이용하는 것은 당연시되고 있다. 음성대화처리 기술은 인간 중심의 자유로운 발화를 인식하고 이해 및 처리하는 방향으로 발전하게 될 것이다. 본고에서는 현재 음성대화처리 기술 국내외 기술 및 산업 동향과 지식재산권 동향을 살펴보고, 인간 중심의 자유발화형 음성대화처리 기술 개념과 발전방향에 대해 기술한다.
PDF

장벽게임을 사용한 명료화 중재가 자폐범주성장애 아동의 대화단절 및 발화수정 전략에 미치는 효과 (The Effects of Clarification Training in Barrier Game on Conversational Breakdowns and Repair Strategies of Children with ASD)

유주현;홍경훈
- 한국콘텐츠학회논문지
- /
- 제18권6호
- /
- pp.374-384
- /
- 2018
연구목적: 본 연구는 초등 저학년 자폐범주성장애 아동3명을 대상으로 장벽게임을 사용한 명료화 중재가 이 아동들의 대화단절과 수정전략 산출에 미치는 효과를 알아보았다. 연구방법: 중재는 장벽게임 상황에서 체계적인 전략을 사용한 '명료화 훈련'을 사용하였다. 중재효과 분석을 위하여 대화단절과 발화 수정전략의 산출 변화를 분석하였다. 결과: 중재 이후 모든 대상 아동들이 대화단절의 총 산출률과 모든 유형의 산출점수에서 감소를 나타냈다. 반면, 수정전략의 전체 및 유형별 산출률과 성공률은 증가하였다. 논의 및 결론: 본 연구에서 사용한 '명료화 훈련'이 임상현장에서 구어 산출이 가능한 자폐범주성장애 아동들의 대화단절 감소와 적절한 수정전략 사용 능력을 향상시키는데 효과적인 방법이 될 수 있을 것이다.
https://doi.org/10.5392/JKCA.2018.18.06.374 인용 PDF KSCI

ChatGPT를 활용한 수자원시스템분야 문제해결사례 소개 및 고찰 (Research cases and considerations in the field of hydrosystems using ChatGPT)

유도근;이찬욱
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2023년도 학술발표회
- /
- pp.98-98
- /
- 2023
ChatGPT(Chat과 Generative Pre-trained Transformer의 합성어)는 사용자와 주고받는 대화의 과정을 통해 질문에 답하도록 설계된 대형언어모델로, 지도학습과 강화학습을 모두 사용하여 세밀하게 조정된 인공지능 챗봇이다. ChatGPT는 주고받은 대화와 대화의 문맥을 기억할 수 있으며, 보고서나 실제로 작동하는 파이썬 코드를 비롯한 인간과 유사하게 상세하고 논리적인 글을 만들어 낼 수 있다고 알려져있다. 본 연구에서는 수자원시스템분야의 문제해결에 있어 ChatGPT의 적용가능성을 사례기반으로 확인하고, ChatGPT의 올바른 활용을 위해 필요한 사항에 대해 고찰하였다. 수자원시스템분야의 대표적인 연구주제인 상수관망시스템의 누수인지와 수리해석을 통한 문제해결에 ChatGPT를 활용하였다. 즉, 딥러닝 기반의 데이터분석을 활용한 누수인지와 오픈소스기반의 수리해석 모델을 활용한 관망시스템 적정 분석을 목표로 ChatGPT와 대화를 진행하고, ChatGPT에 의해 제안된 코드를 구동하여 결과를 분석하였다. ChatGPT가 제시한 코드의 구동결과를 사전에 연구자가 직접 구현한 코드구동 결과와 비교분석하였다. 분석결과 ChatGPT가 제시한 코드가 보다 더 간결할 수 있으며, 상대적으로 경쟁력 있는 결과를 도출하는 것을 확인하였다. 다만, 상대적으로 간결한 코드와 우수한 구동결과를 획득하기 위해서는 해당 도메인의 전문적 지식을 바탕으로 적절한 다수의 질문을 해야 하며, ChatGPT에 의해 작성된 코드의 의미를 명확히 해석하거나 비판적 분석을 하기 위해서는 전문가지식이 반드시 필요함을 알 수 있었다.
PDF

양식 채우기 대화에서 음성 인식 오류의 보완을 위한 대화 전략 (Dialogue Strategies to Overcome Speech Recognition Errors in Form-Filling Dialogue)

강상우;이성욱;서정연
- 인지과학
- /
- 제17권2호
- /
- pp.139-150
- /
- 2006
음성 대화 시스템에서 음성 인식 오류는 전체 시스템의 치명적인 결과를 초래한다. 음성 인식 오류가 부분적으로 발생하여 화행 분석이 실패했을 때 시스템은 원활한 대화를 진행할 수 없다. 본 논문은 양식 채우기 대화 형식에서 발생하는 음성 인식 오류 유형에 따라 시스템이 사용자 발화의 화행을 추론하기 위한 부대화 생성 전략을 제안한다. 제안하는 방법을 계획기반 대화 모델로 구현하여 실험하였고, 사용자 작업 실패 오류의 약27%를 보완하여 성능을 향상시켰으며 전체 시스템의 사용자 작업 성공률은 약 89%이다.
PDF

대화형 홈네트워크 제어 시스템 (Dialogue Management System for Home Network Control)

김현정;은지현;손단영;장두성
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
- /
- pp.194-198
- /
- 2007
현재 서비스되고 있는 홈네트워크는 가전기기들에 대한 홈오토메이션 서비스로서 웹이나 TV 등을 통한 메뉴선택 방식으로 제어되고 있다. 본 논문에서는 홈네트워크에 SMS를 통한 대화형 인터페이스를 도입함으로서 시간과 장소의 제약이 없는, 가전기기 제어를 가능하게 하였다. 대화형 인터페이스의 구현을 위해 홈네트워크 영역의 요구분석을 통하여 23개의 화행과 22개의 의미성분으로 이루어진 의미구조를 수립하였으며, WOZ(Wizard-of-OZ)방식으로 9만 6천 대화쌍을 수집하였다. 대화 처리를 위하여 예제기반 대화추론 및 응답생성 방법을 사용하였으며, SMS 영역에서의 성능향상을 위하여 전처리를 도입하였다. 구현된 서비스에 대한 성능평가 실험을 통해 사용자 만족도를 조사하였다.
PDF

검색결과 1,047건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)