Methods of Transforming the Sejong Treebank to Improve Parser Performance

Choi, Dong-Hyun;Park, J.Y.;Lim, K.T.;Hahm, Y.G.;Choi, K.S.;

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
/
Pages.342-344
/
2012
/
1598-5164(pISSN)

한국정보과학회 (Korean Institute of Information Scientists and Engineers)

구문 분석기 성능 향상을 위한 세종 트리뱅크 변환 방법

Methods of Transforming the Sejong Treebank to Improve Parser Performance

최동현 (한국과학기술원, 전산학과) ;
박정열 (암제르 박 출판사) ;
임경태 (한국과학기술원, 웹사이언스공학과) ;
함영균 (한국과학기술원, 웹사이언스공학과) ;
최기선 (한국과학기술원, 전산학과)

Choi, Dong-Hyun (Dept. of Computer Science, KAIST) ;
Park, J.Y. (Les Editions an Amzer Vak) ;
Lim, K.T. (Web Science & Technology Division, KAIST) ;
Hahm, Y.G. (Web Science & Technology Division, KAIST) ;
Choi, K.S. (Dept. of Computer Science, KAIST)

발행 : 2012.06.22

⟨ 이전 논문 다음 논문 ⟩

초록

세종 트리뱅크는 현존하는 한국어 트리뱅크 중 비교적 최근에 구축되었고 그 규모가 가장 큰 자원이다. 세종 트리뱅크는 어절을 기반으로 구축되어 있어, 어절의 개념이 없는 영어를 기반으로 연구 개발된 대다수의 구문분석기를 학습하는 데 이용될 경우 모호성이 발생된다. 본 논문에서는 세종 트리뱅크를 변환하여 학습 시 모호성을 줄이고, 이를 통해 학습된 구문 분석기의 성능을 높이는 방법에 대하여 서술한다. 실험 결과에 따르면 본 논문에서 제시된 변환 결과를 통해 최소 2 %에서 최대 4 % 정도의 성능 향상 효과를 얻을 수 있었다.

키워드

과제정보

연구 과제 주관 기관 : 한국연구재단

한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)

구문 분석기 성능 향상을 위한 세종 트리뱅크 변환 방법

Methods of Transforming the Sejong Treebank to Improve Parser Performance

초록

키워드

과제정보

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)