통계/의미 정보를 이용한 한국어 의존 파싱

Korean Dependency Parsing Using Statistical/Semantic Information

  • 장명길 (시스템공학연구소 자연어정보처리연구부) ;
  • 류법모 (시스템공학연구소 자연어정보처리연구부) ;
  • 박재득 (시스템공학연구소 자연어정보처리연구부) ;
  • 박동인 (시스템공학연구소 자연어정보처리연구부) ;
  • 맹성현 (충남대학교 컴퓨터과학과)
  • Jang, Myung-Gil (Dept. of Natural Language Information Processing, Systems Engineering Research Institute(SERI)) ;
  • Ryu, Pum-Mo (Dept. of Natural Language Information Processing, Systems Engineering Research Institute(SERI)) ;
  • Park, Jae-Deuk (Dept. of Natural Language Information Processing, Systems Engineering Research Institute(SERI)) ;
  • Park, Dong-In (Dept. of Natural Language Information Processing, Systems Engineering Research Institute(SERI)) ;
  • Myaeng, Sung-Hyun (Dept. of Computer Science, Chungnam National University)
  • 발행 : 1997.10.10

초록

한국어 의존 파싱에서는 불필요한 의존관계의 과다한 생성과 이에 따른 다수의 구문분석 결과 생성에 대처하는 연구가 필요하다. 본 논문에서는 한국어 의존 파싱 과정에서 생기는 불 필요한 의존관계에 따른 다수의 후보 의존 트리들에 대하여 통계/의미 정보를 활용하여 최적 트리를 결정하는 구문 분석 방법을 제안한다. 본 논문의 구문 분석에서 사용하는 통계/의미 정보는 구문구조부착 말뭉치(Tree Tagged Corpus)를 이용하여 구축한 술어 하위범주화 정보 사전에서 얻었으며, 이러한 정보를 활용한 구문 분석은 한국어 구문 분석의 모호성 해소에 적용되어 한국어 구문 분석의 정확도를 높인다.

키워드