Prediction of Prosodic Break Using Syntactic Relations and Prosodic Features

구문 관계와 운율 특성을 이용한 한국어 운율구 경계 예측

  • Jung, Young-Im (Department of Computer Engineering, Pusan National University) ;
  • Cho, Sun-Ho (Department of Computer Engineering, Pusan National University) ;
  • Yoon, Ae-Sun (Department of French, Pusan National University) ;
  • Kwon, Hyuk-Chul (Department of Computer Engineering, Pusan National University)
  • 정영임 (부산대학교 컴퓨터공학과) ;
  • 조선호 (부산대학교 컴퓨터공학과) ;
  • 윤애선 (부산대학교 불어불문학과) ;
  • 권혁철 (부산대학교 컴퓨터공학과)
  • Published : 2008.03.31

Abstract

In this paper, we suggest a rule-based system for the prediction of natural prosodic phrase breaks from Korean texts. For the implementation of the rule-based system, (1) sentence constituents are sub-categorized according to their syntactic functions, (2) syntactic phrases are recognized using the dependency relations among sub-categorized constituents, (3) rules for predicting prosodic phrase breaks are created. In addition, (4) the length of syntactic phrases and sentences, the position of syntactic phrases in a sentence, sense information of contextual words have been considered as to determine the variable prosodic phrase breaks. Based on these rules and features, we obtained the accuracy over 90% in predicting the position of major break and no break which have high correlation with the syntactic structure of the sentence. As for the overall accuracy in predicting the whole prosodic phrase breaks, the suggested system shows Break_Correct of 87.18% and Juncture Correct of 89.27% which is higher than that of other models.

본 논문에서는 자연스러운 한국어 운율구 경계를 예측하기 위해 (1) 문장 성분을 하위범주화하고, (2) 세분화된 문장 성분 간 의존관계를 이용하여 통사구를 추출하며 (3) 추출한 통사구의 유형에 따른 운율구 경계 예측 규칙을 설정하였다. 또한, (4) 통사적 정보 외에도 통사구와 문장의 길이, 통사구의 문장 내 위치, 문맥의 의미 정보 등에 따라 가변적인 운율구 경계를 판단하여 보다 자연스러운 한국어 운율구 경계 예측 시스템을 개발하였다. 그 결과 통사구 경계와 상관관계가 높은 강한 운율구 경계 예측과 운율구 내부 비경계 예측에 있어 90% 이상의 높은 재현율과 정확도를 보였으며, 전체 운율구 경계 예측에 있어서도 87% 이상의 성능을 보였다.

Keywords