Restoring Encyclopedia Title Words Using a Zero Anaphora Resolution Technique

무형대용어 해결 기술을 이용한 백과사전 표제어 복원

  • Hwang, Min-Kook (Yonsei Univ., Computer & Telecommunications Eng. Div.) ;
  • Kim, Young-Tae (Yonsei Univ., Computer & Telecommunications Eng. Div.) ;
  • Ra, Dongyul (Yonsei Univ., Computer & Telecommunications Eng. Div.) ;
  • Lim, Soojong (ETRI, Knowledge Mining Research Team)
  • 황민국 (연세대학교 컴퓨터정보통신공학부) ;
  • 김영태 (연세대학교 컴퓨터정보통신공학부) ;
  • 나동열 (연세대학교 컴퓨터정보통신공학부) ;
  • 임수종 (한국전자통신연구원 지식마이닝연구실)
  • Published : 2014.10.07

Abstract

한국어 문장의 경우 문맥상 추론이 가능하다면 용언의 격이 생략되는 현상 즉 무형대용어 (zero anaphora) 현상이 흔히 발생한다. 무형대용어를 채울 수 있는 선행어 (명사구)를 찾는 문제는 대용어 해결 (anaphora resolution) 문제와 같은 성격의 문제이다. 이러한 생략현상은 백과사전이나 위키피디아 등 백과사전류 문서에서도 자주 발생한다. 특히 선행어로 표제어가 가능한 경우 무형대용어 현상이 빈번히 발생한다. 백과사전류 문서는 질의응답 (QA) 시스템의 정답 추출 정보원으로 많이 이용되는데 생략된 표제어의 복원이 없다면 유용한 정보를 제공하기 어렵다. 본 논문에서는 생략된 표제어 복원을 위해 무형대용어의 해결을 기반으로 하는 시스템을 제안한다.

Keywords