• Title/Summary/Keyword: 對話

Search Result 3,158, Processing Time 0.03 seconds

Concept and Application of Deep learning-based Automatic Spacing (문장 정보를 고려한 딥 러닝 기반 자동 띄어쓰기의 개념 및 활용)

  • Cho, Won Ik;Cheon, Sung Jun;Kim, Ji Won;Kim, Nam Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.181-184
    • /
    • 2018
  • 본 논문에서는, 한국어 활용에 있어 중의성을 해소해 주고 심미적 효과를 줄 수 있는 개념인 띄어쓰기를, 교정이 아닌 입력 보조의 관점에서 접근한다. 사람들에게 자판을 통한 텍스트 입력이 언어활동의 보편적인 수단이 되면서 가독성을 포기하고서라도 편의를 택하는 경우가 증가하게 되었는데, 본 연구에서는 그러한 문장들의 전달력을 높여 줄 수 있는 자동 띄어쓰기 및 그 활용 방안을 제시한다. 전체 시스템은 dense word embedding과 딥 러닝 아키텍쳐를 활용하여 훈련되었으며, 사용된 코퍼스는 비표준어 및 비정형을 포함하는 대화체 문장으로 구성되어 user-generate된 대화형 문장 입력의 처리에 적합하다.

  • PDF

CNN Based Speech-act Classification Using Sentence Types and Modalities (문장 유형과 양태 정보를 이용한 합성곱 신경망 기반의 대화체 발화 화행 분석)

  • Park, Yongsin;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.642-644
    • /
    • 2018
  • 화행(Speech-act)이란 어떤 목적을 달성하기 위해 발화를 통해 이루어지는 화자의 행위를 뜻하며, 화행 분석(Speech-act analysis)이란 주어진 발화의 화행을 결정하는 것을 뜻한다. 문장 유형과 양태는 화행의 일종으로, 문장 유형의 경우 화자의 기본적인 발화 의도에 따라 평서문, 명령문, 청유문, 의문문, 감탄문의 다섯 가지 유형으로 나눌 수 있고, 양태는 문장이 표현하는 명제나, 명제가 기술하는 상황에 대해서 화자가 갖는 의견이나 태도를 말한다. 본 논문에서는 종결어미와 보조용언으로부터 비교적 간단하게 추출 가능한 문장 유형과 양태 정보를 활용하여 대화체 발화문의 화행 분석 성능을 높이는 방법을 보인다. 본 논문에서 제안하는 모델은 합성곱 신경망(CNN)을 사용한 기본 모델에 비해 0.52%p 성능 향상을 보였다.

  • PDF

Automatic Tension Classification from Lecture Show Transcripts (강연의 자막을 이용한 긴장도 자동 분류)

  • Yoon, Seungwon;Yang, Wonsuk;Park, Jong C.
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.204-209
    • /
    • 2018
  • 긴장이라는 측면은 의사소통을 하거나 글을 읽을 때 사람에게 항상 영향을 주고 있다. 긴장의 개념은 자연언어처리 분야에서 광범위한 의미로 사용되어 왔는데, 본 논문은 이런 개념 중 강연과 같은 한 방향 대화에서 화자의 말에 대하여 청중이 가지는 긴장도에 집중하여 이를 정량화하는 방법을 제안한다. 한 명의 저자에 의해 서술된 문서에 긴장도 개념을 적용함에 있어, 한 방향 대화에서의 긴장도를 정량화하는 본 연구는 긴장도 개념을 일반 문서에 적용할 때에 보다 용이하게 활용될 것으로 예상한다. 본 연구에서는 먼저 화자의 말에 대한 청중의 긴장도가 주석되어 있는 새로운 말뭉치를 구축하였다. 또한 문맥을 고려하여 긴장도를 예측할 수 있는 모델과 이에 따른 긴장도 분류 성능에 대한 실험 결과를 통하여 자동 긴장도 분류가 계산적으로 가능하다는 것을 보인다.

  • PDF

Hierarchical attention based CNN-RNN networks for The Korean Speech-Act Analysis (계층 구조 어텐션 매커니즘에 기반한 CNN-RNN을 이용한 한국어 화행 분석 시스템)

  • Seo, Minyeong;Hong, Taesuk;Kim, Juae;Ko, Youngjoong;Seo, Jungyun
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.243-246
    • /
    • 2018
  • 최근 사용자 발화를 이해하고 그에 맞는 피드백을 생성할 수 있는 대화 시스템의 중요성이 증가하고 있다. 따라서 사용자 의도를 파악하기 위한 화행 분석은 대화 시스템의 필수적인 요소이다. 최근 많이 연구되는 심층 학습 기법은 모델이 데이터로부터 자질들을 스스로 추출한다는 장점이 있다. 발화 자체의 연속성과 화자간 상호 작용을 포착하기 위하여 CNN에 RNN을 결합한 CNN-RNN을 제안한다. 본 논문에서 제안한 계층 구조 어텐션 매커니즘 기반 CNN-RNN을 효과적으로 적용한 결과 워드 임베딩을 추가한 조건에서 가장 높은 성능인 91.72% 정확도를 얻었다.

  • PDF

A Joint Learning Model for Speech-act Analysis and Slot Filling Using Bidirectional GRU-CRF Based on Attention Mechanism (주의집중 메커니즘 기반의 양방향 GRU-CRF를 이용한 화행 분석과 슬롯 필링 공동 학습 모델)

  • Yoon, Jeongmin;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.252-255
    • /
    • 2018
  • 화행 분석이란 자연어 발화를 통해 나타나는 화자의 의도를 파악하는 것을 말하며, 슬롯 필링이란 자연어 발화에서 도메인에 맞는 정보를 추출하기 위해 미리 정의되어진 슬롯에 대한 값을 찾는 것을 말한다. 최근 화행 분석과 슬롯 필링 연구는 딥 러닝 기반의 공동 학습을 이용하는 연구가 많이 이루어지고 있고 본 논문에서는 한국어 특허상담 도메인 대화 말뭉치를 이용하여 공동 학습 모델을 구축하고 개별적인 모델과 성능을 비교한다. 또한 추가적으로 공동 학습 모델에 주의집중 메커니즘을 적용하여 성능이 향상됨을 보인다. 최종적으로 주의집중 메커니즘 기반의 공동 학습 모델이 기준 모델과 비교하여 화행 분류와 슬롯 필링 성능이 각각 3.35%p, 0.54%p 향상되어 85.41%, 80.94%의 성능을 얻었다.

  • PDF

Three Dimensional Audio Technologies for Realistic Broadcasting (실감방송을 위한 3차원 오디오 기술)

  • Jang, D.Y.;Seo, J.I.;Lee, T.J.;Park, G.Y.;Kang, K.O.
    • Electronics and Telecommunications Trends
    • /
    • v.19 no.4 s.88
    • /
    • pp.53-62
    • /
    • 2004
  • 차세대 방송 서비스는 입체감있는 3차원 AV 콘텐츠와 자연스럽게 사용자와 인터랙션하는 대화형 콘텐츠를 기반으로 하는 실감방송으로 변화되어 갈 것으로 예상된다. 이러한 실감방송 서비스에서는 현장감을 효율적으로 나타낼 수 있는 음상 정위 및 음장 재현 등 3차원 오디오 기술과 사용자 인터랙션을 위한 객체기반 오디오 처리 기술들이 필요하다. 본 고에서는 이러한 현장감과 사용자 인터랙션을 통하여 가상현실에 근접한 서비스를 제공하기 위한 대표적인 3차원 오디오 기술의 개발 동향을 살펴본다. 우선 3차원 오디오 기술의 기본 개념 및 개요를 기술하며, 이러한 3차원 오디오 기술에 기반한 대화형 3차원 오디오 기술 개발에 대한 최근 동향을 살펴보고, 국내에서 개발하고 있는 객체기반 3차원 오디오 기술에 대하여 간략히 설명한다.

App for communication among family members using Smartphone location services (스마트폰 위치 정보를 이용한 가족간 소통 앱)

  • Lee, Sei-Hoon;Kim, Hwal-Seok;Jung, Seung-Hyo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.07a
    • /
    • pp.241-244
    • /
    • 2013
  • 본 논문에서는 TCP 소켓을 이용해서 스마트폰의 GPS 및 3G/4G, WiFi 기능으로 위치전송을 통한 미아, 치매노인 찾기 및 약속잡기 App에 관해 제안한다. 이 App은 스마트폰 등 정보기기의 발달로 인한 가족 간의 대화 단절, 실종 및 비정상적이고 비윤리적인 사회문제를 해결하는데 이의를 둔다. App을 통해 온 가족을 하나의 그룹으로 묶어 그룹 간에 일정을 공유할 수 있고, 채팅 기능을 통해 가족의 대화를 유도해 효율적인 의사소통을 가능하게 한다. 또한 GPS 기능을 통해 위치정보를 공유하고 한 자리에 모이기 힘든 현대 가족에게 쉽게 가족 간에 약속장소를 정할 수 있으며, 유사시에는 위젯을 통해 자신의 위치를 가족들에게 신속히 문자메시지로 보내 브라우저로 위치를 확인할 수 있게 된다.

  • PDF

Implementation of an Interactive NPC with Community Bulletin Board and Game Ontology (커뮤니티의 게시글과 게임 온톨로지 이용한 대화형 NPC의 구현)

  • Park, Doo-Kyung;Yoon, Tae-Bok;Park, Kyo-Hyun;Lee, Jee-Hyong
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.162-167
    • /
    • 2007
  • 최근 컴퓨터 게임에 등장하는 NPC(Non-player Character)에 각종 인공지능 기법을 적용하는 연구들이 이루어지고 있다. 하지만 대부분의 연구가 플레이어를 상대하는 적대적 입장의 NPC들의 움직임 조절에 초점을 맞추고 있고 아직까지 게임 상에서 등장하는 모든 NPC는 항상 같은 말과 비슷한 행동을 되풀이하는 모습만을 보여주고 있다. 이는 플레이어가 게임을 비현실적으로 느끼게 만들고 결과적으로 게임의 재미를 저하시키는 요소로 작용한다. 플레이어에게 보다 현실적인 게임 환경을 제공하기 위해서는 NPC가 단순히 게임의 배경을 구성하는 오브젝트가 아니라 다양한 대화를 통해 플레이어에게 많은 영향을 주게 하여 게임의 기여도를 높여주어야 한다. 본 논문에서는 이를 위해 게임 속에서 주어지는 퀘스트를 구성하는 NPC, 몬스터, 보상 등의 속성 정보를 온톨로지로 구성하고, 인터넷에 존재하는 게임 커뮤니티에서 퀘스트 질의/응답 게시판의 글을 추출하여, 플레이어의 관련 질의에 응답하는 NPC를 구현하고자 한다. 이를 위해 온톨로지 정보를 이용한 검색 알고리즘을 구현하였고, 시뮬레이션을 통해 NPC가 커뮤니티 게시글(국문/영문) 정보를 이용하여 유저에게 고정되지 않은 다양한 메시지를 전달하면서 동시에 유저의 게임 진행을 도와주는 모습을 확인하였다.

  • PDF

Design and Implementation of the Speech Recognition-based Dynamic EPG Control System in Digital Broadcasting environment (디지털 TV 환경에서 음성인식을 통한 동적 EPG 제어 시스템 설계 및 구현)

  • Kim, Seong-Won;Na, Hee-Joo;Si, Jang-Hyun;Kim, Jung-Hwan;Jung, Moon-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.216-221
    • /
    • 2007
  • 디지털 방송은 수많은 프로그램과 기존의 아날로그 방송에서 볼 수 없었던 다양한 서비스를 제공하며 발전하고 있다. 하지만 시청자들에게는 방송 서비스 채널과 기능이 많아질수록 원하는 채널을 검색하고 전환하는 과정이 어렵고 복잡한 일이 되어 버릴 수 밖에 없을 것이다. 이에 본 논문에서는 이러한 정보 획득과정의 축소를 위해 전통적인 리모콘으로 채널을 검색하고 이동하는 절차를 벗어나 음성인식을 통한 동적 EPG(Electronic Program Guide) 제어 시스템을 설계하고 구현하고자 한다. 이는 EPG정보와 시청자의 TV시청 성향 및 History를 기반으로 구동되는 시스템으로 음성대화의 구조적 정의가 가능한 VXML(VoiceXML) 인터프리터를 활용한다. 본 논문에서 제안하는 대화형 인터페이스는 다양한 디지털방송 서비스에 접목이 가능 할 것이며, 새로운 형태의 디지털 가전기기 파일럿 인터페이스 개발에 도움이 될 것이라 기대한다.

  • PDF

대화형 멀티미디어 정보통신 서비스를 위한 단말기

  • 오승준
    • Information and Communications Magazine
    • /
    • v.11 no.12
    • /
    • pp.71-93
    • /
    • 1994
  • 본고에서는 멀티미디어 정보통신 서비스를 일반사용자에게 제공하기 위하여 제공될 각 종 단말기들의 기본적인 아키텍쳐와 그를 구성하는 핵심 모듈들을 살펴보고, 각 종 단말기들이 서로 호환성을 가지고 동작하기 위하여 필요한 코덱의 표준화와 망과의 접속문제 특히 ATM과의 접속문제를 알아본다. 멀티미디어 정보통신 서비스용 단말기 아키텍쳐를 살펴보고, ISDN 단말기, B-ISDN 단말기, 대화형 멀티미디어 정보검색용 단말기 구조를 설명한다. 단말기의 핵심을 이루는 오디오-비쥬얼 코덱과 코덱의 표준 알고리즘인 MPEG 알고리즘, 특히 MPEG-2와 각종 서비스 질에 맞추기 위한 MPEG-2 확장형 알고리즘을 살펴본다. 그리고 ATM 망에서 MPEG-2 비트스트림을 수용하기 위한 방법에 대하여 AAL 관점에서 살펴보고, 오디오-비쥬얼 코덱이 가지는 큰 문제점 중의 하나인 지연문제에 대하여 알아본다. 멀티미디어 서비스를 위한 각 종 응용물들을 일반사용자가 손쉽게 배워서 사용토록 할 수 있는 사용자 인터페이스를 단말기에서 제공하기 위하여 고려해야 될 사항과 해결해야 할 문제점들에 대하여 살펴본다.

  • PDF