• 제목/요약/키워드: Korean speech act classification

검색결과 11건 처리시간 0.021초

분류 우선순위 적용과 후보정 규칙을 이용한 효과적인 한국어 화행 분류 (Effective Korean Speech-act Classification Using the Classification Priority Application and a Post-correction Rules)

  • 송남훈;배경만;고영중
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.80-86
    • /
    • 2016
  • 화행이란 발화 속에 포함되어 있는 화자에 의해 의도된 언어적 행위이다. 대화 시스템에서 입력된 발화에 적합한 화행을 분류하는 것은 중요하다. 기존의 화행분류에 관한 연구는 규칙기반과 기계학습 기반의 방법을 많이 사용한다. 본 논문에서는 대표적인 기계학습 방법인 지지벡터기계(SVM)와 변환기반 학습(TBL)을 조합한 화행 분류 방법을 제안한다. 이를 위해, 화행별 학습 발화의 수에 기반하여 분류 우선순위를 조정함으로써 지지벡터기계의 분류 편향 문제를 해결하였고, 오답일 확률이 높은 분류 결과에 대해서 변환 기반 학습을 통해 생성된 보정 규칙을 적용함으로써 화행분류 성능을 개선하는 방법을 제안한다. 본 논문에서 화행별 학습 발화 수의 차이를 고려한 분류 우선순위 변화와 후보정 규칙을 이용한 화행분류 방법을 실험을 통해 평가하였으며, 이는 학습 발화 수가 낮은 화행의 우선순위를 고려하지 않은 기존의 화행 분류보다 성능이 향상되었다.

Conditional Random Fields를 이용한 영역 행위 분류 모델 (A Domain Action Classification Model Using Conditional Random Fields)

  • 김학수
    • 인지과학
    • /
    • 제18권1호
    • /
    • pp.1-14
    • /
    • 2007
  • 목적 지향 대화에서 사용자의 의도는 화행과 개념열의 쌍으로 구성된 영역 행위로 표현될 수 있다. 그러므로 지능적인 대화 시스템을 구성하기 위해서는 영역 행위를 정확히 파악하는 것이 매우 중요하다. 본 논문에서는 CRFs (Conditional Random Fields)를 이용하여 화행과 개념열을 동시에 결정하는 통계 모델을 제안한다. 편향 학습 문제를 피하기 위하여 제안한 모델은 어휘와 품사 같은 낮은 수준의 언어 자질을 입력 자질로 사용하며, 카이 제곱 통계량을 이용하여 불필요한 자질들을 제거한다. 일정 관리 영역에서 실험을 수행한 결과, 제안한 모델은 화행 분류 정착률에서 93.0%, 개념열 분류 정확률에서 90.2%의 좋은 성능을 보였다.

  • PDF

Review of Korean Speech Act Classification: Machine Learning Methods

  • Kim, Hark-Soo;Seon, Choong-Nyoung;Seo, Jung-Yun
    • Journal of Computing Science and Engineering
    • /
    • 제5권4호
    • /
    • pp.288-293
    • /
    • 2011
  • To resolve ambiguities in speech act classification, various machine learning models have been proposed over the past 10 years. In this paper, we review these machine learning models and present the results of experimental comparison of three representative models, namely the decision tree, the support vector machine (SVM), and the maximum entropy model (MEM). In experiments with a goal-oriented dialogue corpus in the schedule management domain, we found that the MEM has lighter hardware requirements, whereas the SVM has better performance characteristics.

Modality-Based Sentence-Final Intonation Prediction for Korean Conversational-Style Text-to-Speech Systems

  • Oh, Seung-Shin;Kim, Sang-Hun
    • ETRI Journal
    • /
    • 제28권6호
    • /
    • pp.807-810
    • /
    • 2006
  • This letter presents a prediction model for sentence-final intonations for Korean conversational-style text-to-speech systems in which we introduce the linguistic feature of 'modality' as a new parameter. Based on their function and meaning, we classify tonal forms in speech data into tone types meaningful for speech synthesis and use the result of this classification to build our prediction model using a tree structured classification algorithm. In order to show that modality is more effective for the prediction model than features such as sentence type or speech act, an experiment is performed on a test set of 970 utterances with a training set of 3,883 utterances. The results show that modality makes a higher contribution to the determination of sentence-final intonation than sentence type or speech act, and that prediction accuracy improves up to 25% when the feature of modality is introduced.

  • PDF

인식·행위 양태 다의성 어미의 의미와 억양 -구어 자유발화 분석을 통하여- (Meaning and Intonation of Endings with Polysemous Modality: Through the Analysis of the Spontaneous Speech)

  • 조민하
    • 한국어학
    • /
    • 제77권
    • /
    • pp.331-357
    • /
    • 2017
  • The purpose of this paper is to identify the workings of intonation realized in the endings through the spoken language. To achieve this objective, this paper has analyzed 300 minutes of spontaneous speech by women from Seoul and discussed the meanings of modality and their relationship with intonation. Intonation functions significantly in polysemous modal endings in epistemic and act modality. Epistemic modality is usually expressed through indirect and soft intonations such as L:, M: and LH, whereas act modality is expressed through direct and strong intonations such as H, HL and LHL. Intonation appears to be related to the Certainty degree of information, rather than classification of modality, Lengthening relate to indirectness, H with uncertainty, L with statements or affirmation, and HL and LHL relates to assertive attitude. This paper is significant as it has overcome the abstractness of existing modality studies and has engaged in objective and comprehensive analysis with actual spontaneous speech data.

목적 지향 대화를 위한 효율적 질의 의도 분석에 관한 연구 (Effective Text Question Analysis for Goal-oriented Dialogue)

  • 김학동;고명현;임헌영;이유림;지민규;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.48-57
    • /
    • 2019
  • 본 연구는 목적 지향 대화 시스템 내에서 단일 한국어 텍스트 형식의 질문으로부터 질의자의 의도를 파악하는 것을 목적으로 한다. 목적 지향 대화 시스템은 텍스트 또는 음성을 통한 사용자의 특수한 요구를 만족시켜주는 대화 시스템을 의미한다. 의도 분석 과정은 답변 생성에 앞서 사용자의 질의 의도를 파악하는 단계로, 목적 지향 대화 시스템 전체의 성능에 큰 영향을 준다. 생활화학제품이라는 특정 분야에 제안 모델을 사용하였고, 해당 분야와 관련된 한국어 텍스트 데이터를 이용하였다. 특정 분야에 독립적이며 범용적인 의도를 의미하는 화행과, 특정 분야에 종속적인 의도를 의미하는 개념열로 나누어 분석한다. 화행과 개념열을 분석하기 위하여 단어 임베딩 모델, 합성곱 신경망을 이용한 분류 방법을 제안한다. 단어 임베딩 모델을 통하여 단어의 의미정보를 추상화하고, 추상화된 단어의 의미정보를 기반으로 합성곱 신경망을 통하여 개념열 및 화행 분류를 수행한다.

Convolutional Neural Network에서 공유 계층의 부분 학습에 기반 한 화자 의도 분석 (Speakers' Intention Analysis Based on Partial Learning of a Shared Layer in a Convolutional Neural Network)

  • 김민경;김학수
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1252-1257
    • /
    • 2017
  • 대화에서 화자의 의도는 감정, 화행, 그리고 서술자로 표현될 수 있다. 따라서 사용자 질의에 정확하게 응답하기 위해서 대화 시스템은 발화에 내포된 감정, 화행, 그리고 서술자를 파악해야한다. 많은 이전 연구들은 감정, 화행, 서술자를 독립된 분류 문제로 다뤄왔다. 그러나 몇몇 연구에서는 감정, 화행, 서술자가 서로 연관되어 있음을 보였다. 본 논문에서는 Convolutional Neural Netowork를 이용하여 감정, 화행, 서술자를 동시에 분석하는 통합 모델을 제안한다. 제안 모델은 특정 추상화 계층과, 공유 추상화 계층으로 구성된다. 특정 추상화 계층에서는 감정, 화행, 서술자의 독립된 정보가 추출되고 공유 추상화 계층에서 독립된 정보들의 조합이 추상화된다. 학습 시 감정의 오류, 화행의 오류, 서술자의 오류는 부분적으로 역 전파 된다. 제안한 통합 모델은 실험에서 독립된 모델보다 좋은 성능(감정 +2%p, 화행 +11%p, 서술자 +3%)을 보였다.

도메인에 비종속적인 대화에서의 화행 분류 (Dialogue Act Classification for Non-Task-Oriented Korean Dialogues)

  • 김민정;한경수;박재현;송영인;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.246-253
    • /
    • 2006
  • 대화 에이전트와 관련된 지금까지의 연구는 대개 대상 도메인을 한정하고, 특정 목적을 달성하기 위해 사용자와 대화할 수 있는 에이전트에 관한 연구가 많았다. 본 연구에서는 도메인이 한정되지 않은 일반 도메인 대화에서 화행(speech act)정보를 수동으로 부착시켜 구축한 말뭉치에 대해 소개하고 이 말뭉치를 토대로 자동으로 화행을 분류할 수 있는 유용한 자질들을 선보인다. 그리고 도메인이 한정된 말뭉치와 도메인이 한정되지 않은 말뭉치를 자동으로 화행분류해 본 실험한 결과를 비교하였다.

  • PDF

폭력성 비디오게임에 대한 미국 연방순회항소법원판결이 한국게임법제도에 주는 시사점 : Video Software Dealers Association v. Arnold Schwarzenegger(2009) (Video Software Dealers Association v. Arnold Schwarzenegger(2009) of the United States Court of Appeals, Ninth Circuit and its Implication to the Korean Game Law)

  • 박민;황승흠
    • 한국게임학회 논문지
    • /
    • 제10권1호
    • /
    • pp.65-78
    • /
    • 2010
  • 이 논문은 2009년 2월 20일 미국의 제9 연방순회항소법원에서 내려진 Video Software Dealers Association v. Arnold Schwarzenegger 사건에 대한 판결의 의미와 한국게임법제도에의 시사점을 검토한 것이다. 이 사건에서 제9 연방순회항소법원은 폭력성 비디오게임을 18세 미만의 미성년자에게 판매하거나 대여하는 것을 금지하는 캘리포니아 주법(州法)이 미국 연방헌법에 명시된 미성년자 (minor)의 권리를 침해한다는 판결을 내렸다. 이에 비해서 한국의 헌법재판소는 청소년보호를 위한 청소년유해매체물 제도와 사전등급분류 제도에 대해서는 합헌이라는 결정을 하였다. 헌법재판소는 미국의 제9 연방항소법원의 판결과 같이 음란과 폭력성을 구분하여 접근하고 있고, 폭력성 개념이 대해서 간접적으로 위헌적이라는 결정을 한 바 있다. 미국법원의 덜 제한적인 수단의 선택이라는 법리와 헌법재판소의 최소침해성 원칙에서 본다면 청소년유해매체물 제도와 사전등급분류 제도의 중첩 적용은 문제될 수 있으며, 이 중에서 더 강한 규제가 위헌이 될 소지가 있다.

한국어 대화문 화행 자동분류를 위한 언어학적 기반연구 (A Linguistic Study of Automatic Speech Act Classification for Korean Dialog)

  • 구영은;김지연;홍문표;김영길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.17-22
    • /
    • 2017
  • 화행이란 의사소통 과정에서 발화자가 가지는 발화 의도를 말한다. 성공적인 의사소통을 위해서는 발화자의 화행을 정확하게 파악하는 것이 매우 중요하다. 본 논문에서는 한국어 대화체 문장의 화행 자동분류를 위해, 화행을 결정짓는 요인이 무엇인지 언어학적으로 분석하고자 하였다. 한국어 수업 대화를 분석하여 화행 분류 체계를 새롭게 자체 정립하였고, 언어학적 근거를 바탕으로 10개의 화행 분류 자질을 제안하였다. 또한 제안하는 화행 분류 자질을 검증하고자 웨카(Weka)를 이용하여 정확률 실험을 진행하였다.

  • PDF