Citation Record Extraction Using Template For Construction of Automatic Citation Index

자동 인용 색인 구축을 위한 템플릿을 적용한 인용 레코드 추출

  • 구희관 (과학기술연합대학원대학교 응용정보과학) ;
  • 황미녕 (한국과학기술정보연구원 정보소프트웨어 연구센터) ;
  • 홍순찬 (한국과학기술정보연구원 정보소프트웨어 연구센터) ;
  • 정한민 (한국과학기술정보연구원 정보소프트웨어 연구센터)
  • Published : 2012.06.22

Abstract

인용 레코드 추출은 인용 색인 구축의 모든 프로세스 입력으로 사용되기 때문에 이후의 과정에 미칠 수 있는 부작용을 고려해서 최대한 정확한 정보가 추출되어야 한다. 본 논문에서는 수집한 논문의 참고문헌 영역을 인식하고 이를 참고문헌 영역 내의 특징들을 이용하여 인용 레코드를 추출하는 템플릿 기반 인용 레코드 추출을 제안한다. 제안된 추출 방법은 기존 방법보다 18% 성능이 증가했으며 전체 인용 레코드에 대한 추출성능은 0.98(F1)의 성능을 보인다. 이는 향후 논문 저장소에서 논문을 대상으로 영역 인식을 통한 정보 추출에 유용하게 활용될 수 있으리라 기대된다.

Keywords