Methods of Transforming the Sejong Treebank to Improve Parser Performance

Choi, Dong-Hyun;Park, J.Y.;Lim, K.T.;Hahm, Y.G.;Choi, K.S.;

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

2012.06b
/
Pages.342-344
/
2012
/
1598-5164(pISSN)

Korean Institute of Information Scientists and Engineers (한국정보과학회)

Methods of Transforming the Sejong Treebank to Improve Parser Performance

구문 분석기 성능 향상을 위한 세종 트리뱅크 변환 방법

Choi, Dong-Hyun (Dept. of Computer Science, KAIST) ;
Park, J.Y. (Les Editions an Amzer Vak) ;
Lim, K.T. (Web Science & Technology Division, KAIST) ;
Hahm, Y.G. (Web Science & Technology Division, KAIST) ;
Choi, K.S. (Dept. of Computer Science, KAIST)

최동현 (한국과학기술원, 전산학과) ;
박정열 (암제르 박 출판사) ;
임경태 (한국과학기술원, 웹사이언스공학과) ;
함영균 (한국과학기술원, 웹사이언스공학과) ;
최기선 (한국과학기술원, 전산학과)

Published : 2012.06.22

⟨ Previous Next ⟩

Abstract

세종 트리뱅크는 현존하는 한국어 트리뱅크 중 비교적 최근에 구축되었고 그 규모가 가장 큰 자원이다. 세종 트리뱅크는 어절을 기반으로 구축되어 있어, 어절의 개념이 없는 영어를 기반으로 연구 개발된 대다수의 구문분석기를 학습하는 데 이용될 경우 모호성이 발생된다. 본 논문에서는 세종 트리뱅크를 변환하여 학습 시 모호성을 줄이고, 이를 통해 학습된 구문 분석기의 성능을 높이는 방법에 대하여 서술한다. 실험 결과에 따르면 본 논문에서 제시된 변환 결과를 통해 최소 2 %에서 최대 4 % 정도의 성능 향상 효과를 얻을 수 있었다.

Keywords

Acknowledgement

Supported by : 한국연구재단

Proceedings of the Korean Information Science Society Conference (한국정보과학회:학술대회논문집)

Methods of Transforming the Sejong Treebank to Improve Parser Performance

구문 분석기 성능 향상을 위한 세종 트리뱅크 변환 방법

Abstract

Keywords

Acknowledgement

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)