DOI QR코드

DOI QR Code

A Method for Ranking Candidate Parse Trees using Weighted Dependency Relation

가중치를 가지는 의존관계를 이용한 구문분석 후보의 순위화 방법

  • Ryu, Jaemin (Dept. of Electrical and Computer Engineering, Pusan National University) ;
  • Kim, Minho (Dept. of Electrical and Computer Engineering, Pusan National University) ;
  • Kwon, Hyuk-Chul (Dept. of Electrical and Computer Engineering, Pusan National University)
  • 류재민 (부산대학교 전기전자컴퓨터공학과) ;
  • 김민호 (부산대학교 전기전자컴퓨터공학과) ;
  • 권혁철 (부산대학교 전기전자컴퓨터공학과)
  • Published : 2017.04.27

Abstract

통계 모형에 기반을 둔 구문분석기는 자료 부족 문제에 취약하거나 장거리 의존관계와 같은 특정 언어현상에 대한 처리가 어렵다는 단점이 있다. 이러한 한계점을 극복하고자 본 연구진은 규칙에 기반을 둔 한국어 구문분석기를 개발하고 있다. 다른 구문 분석기와 다르게 형태소 단위 구문분석을 시도하며 생성 가능한 모든 구문분석 후보를 보여주는 것이 특징이다. 본 연구진의 기존 연구에서 개발한 한국어 구문분석기는 형태소의 입력순서와 구문분석 후보의 생성 순서에 의존하여 구문분석 후보를 순서화하였다. 그러나 생성되는 구문분석 후보 중 가장 정답에 가까운 구문분석 후보의 순위를 낮추기 위해서는 각 구문분석 트리가 특정한 점수를 가질 필요가 있다. 본 논문에서는 품사 태거(tagger)에서 출력하는 어절별 형태소의 순위에 따른 가중치, 수식 거리에 따른 가중치, 특정한 지배-의존 관계에 대한 가중치를 이용해 가중치 합을 가지는 구문분석 후보를 구성하고 이를 정렬하여 이전 연구보다 향상된 성능을 가진 한국어 구문분석기 모델을 제안한다. 실험은 본 연구진이 직접 구축한 평가데이터를 기반으로 진행하였으며 기존의 Unlabeled Attachment Score(UAS) 87.86%에서 제안 모델의 UAS 93.34%로 약 5.48의 성능향상을 확인할 수 있었다.

Keywords

Acknowledgement

Grant : (엑소브레인-3세부) 컨텍스트 인지형 Deep-Symbolic 하이브리드 지능 원천 기술 개발 및 언어 지식 자원 구축

Supported by : 정보통신기술연구진흥센터