한국정보과학회:학술대회논문집 (Proceedings of the Korean Information Science Society Conference)
- 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
- /
- Pages.188-190
- /
- 2012
- /
- 1598-5164(pISSN)
자동 인용 색인 구축을 위한 템플릿을 적용한 인용 레코드 추출
Citation Record Extraction Using Template For Construction of Automatic Citation Index
- 구희관 (과학기술연합대학원대학교 응용정보과학) ;
- 황미녕 (한국과학기술정보연구원 정보소프트웨어 연구센터) ;
- 홍순찬 (한국과학기술정보연구원 정보소프트웨어 연구센터) ;
- 정한민 (한국과학기술정보연구원 정보소프트웨어 연구센터)
- Koo, Hee-Kwan (Dept. of Practical Information Science, UST) ;
- Hwang, Mi-Nyeong (Information and S/W Research Center, KISTI) ;
- Hong, Soon-Chan (Information and S/W Research Center, KISTI) ;
- Jung, Han-Min (Information and S/W Research Center, KISTI)
- 발행 : 2012.06.22
초록
인용 레코드 추출은 인용 색인 구축의 모든 프로세스 입력으로 사용되기 때문에 이후의 과정에 미칠 수 있는 부작용을 고려해서 최대한 정확한 정보가 추출되어야 한다. 본 논문에서는 수집한 논문의 참고문헌 영역을 인식하고 이를 참고문헌 영역 내의 특징들을 이용하여 인용 레코드를 추출하는 템플릿 기반 인용 레코드 추출을 제안한다. 제안된 추출 방법은 기존 방법보다 18% 성능이 증가했으며 전체 인용 레코드에 대한 추출성능은 0.98(F1)의 성능을 보인다. 이는 향후 논문 저장소에서 논문을 대상으로 영역 인식을 통한 정보 추출에 유용하게 활용될 수 있으리라 기대된다.
키워드