A Mathematical Equation Retrieval System Based on Formula Patterns Expressed in Korean

한글화된 수식 패턴을 이용한 수학식 검색 시스템

  • Kim, Shin-Il (Department of Computer Engineering, Dong-A University) ;
  • Yang, Seon (Department of Computer Engineering, Dong-A University) ;
  • Ko, Young-Joong (Department of Computer Engineering, Dong-A University)
  • 김신일 (동아대학교 컴퓨터곰학과) ;
  • 양선 (동아대학교 컴퓨터곰학과) ;
  • 고영중 (동아대학교 컴퓨터곰학과)
  • Published : 2011.06.29

Abstract

일반적인 문서에 대한 정보 검색 연구는 활발히 진행되고 있으며, 일상 생활 속에서도 대중화되어 많이 사용되고 있다. 이에 따라 음성, 이미지 검색 등 특정 분야의 검색에 대한 연구도 활발히 진행되고 있지만, 수학식 검색에 대한 연구는 비교적으로 미비한 실정이다. 수학식 검색과 관련된 연구들은 대부분 MathML (Mathematical Markup Language), TeX 등으로 작성된 수학식을 대상으로 진행되었지만, 특정 언어나 별개의 수학 입력 툴들을 이용한 검색 방법은 일반 사용자들이 사용하기에는 쉽지 않다는 단점이 있다. 그래서, 본 논문에서는 일반 문서 검색과 마찬가지로, 수학식을 읽듯이 한글을 입력했을 때 색인어 추출 방법 및 검색 방법에 대해 제안한다. 실험을 위해서 수학 문제집에 나오는 1,432개의 수학식을 한글화 시켰고, 한글화된 결과에 대해 패턴 등을 추출하여 MRR (Mean Reciprocal Rank), $Rel_{EQ}$@N(Relevance evaluation at N)로 평가하였다. 100개의 한글 질의어에 대해 MRR@5로 계산된 수학식 검색 결과가 약 0.6 정도 되는 것을 확인할 수 있었고, 학습 데이터에 포함되지 않은 질의수학식 5개에 대해 $Rel_{EQ}$@5로 계산했을 때 평균 60% 의 정확률을 보였다.

Keywords

Acknowledgement

Grant : 시각 및 언어 장애인을 위한 음성합성기 및 AAC 소프트웨어 개발

Supported by : 지식경제부, 한국산업기술평가관리원