Bootstrapping for Semantic Role Assignment of Korean Case Marker

부트스트래핑 알고리즘을 이용한 한국어 격조사의 의미역 결정

  • Kim Byoung-Soo (Dept. of Graduate School for Information Technology, POSTECH) ;
  • Lee Yong-Hun (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Na Seung-Hoon (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Kim Jun-Gi (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Lee Jong-Hyeok (Dept. of Computer Science & Engineering, POSTECH, Advanced Information Technology Research Center(AITrc))
  • 김병수 (포항공대 정보통신대학원 정보처리학과) ;
  • 이용훈 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 나승훈 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 김준기 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터) ;
  • 이종혁 (포항공대 컴퓨터공학과, 첨단정보기술 연구센터)
  • Published : 2006.06.01

Abstract

본 논문은 자연언어처리에서 문장의 서술어와 그 서술어가 가지는 명사 논항들 사이의 문법관계를 의미 관계로 사상하는 즉 논항이 서술어에 대해 가지는 역할을 정하는 문제를 다루고 있다. 의미역 결정은 단어의 의미 중의성 해소와 함께 자연언어의 의미 분석의 핵심 문제 중 하나이며 반드시 해결해야 하는 매우 중요한 문제 중 하나이다. 본 연구에서는 언어학적으로 유용한 자원인 세종전자사전을 이용하여 용언격틀사전을 구축하고 격틀 선택 방법으로 의미역을 결정한 후. 결정된 의미역들에 대한 확률 정보를 확률 모델에 적용하여 반복적으로 학습하는 부트스트래핑(Bootstrapping) 알고리즘을 사용하였다. 실험 결과, 기본 모델에 대해 10% 정도의 성능 향상을 보였다.

Keywords