DOI QR코드

DOI QR Code

Developing a Test-Bed Toolkit for Scientific Document Analysis

기술 문헌 분석 테스트베드 툴킷 개발

  • 최성필 (한국과학기술정보연구원 소프트웨어연구실) ;
  • 송사광 (한국과학기술정보연구원 소프트웨어연구실) ;
  • 정한민 (한국과학기술정보연구원 소프트웨어연구실)
  • Received : 2012.07.02
  • Accepted : 2012.07.24
  • Published : 2012.08.28

Abstract

This paper introduces a test-bed toolkit for evaluating and enhancing text analysis engines which extract technological knowledge from articles, patents, reports and so forth. The toolkit consists of two test-beds for technical entity recognition and relation extraction engines, which are capable of identifying technical entities and predicting semantic relation types between the entities. With using the introduced toolkits, users and developers can efficiently perform the execution monitoring and error analysis of the technical text analysis engines.

본 논문은 논문, 특허, 연구보고서 등과 같은 다양한 과학 기술 문헌에 포함된 기술 지식을 효과적으로 추출하는데 필요한 텍스트 분석 엔진들의 효과적인 모니터링 및 성능 최적화를 위한 테스트베드 도구를 소개한다. 이 도구는 과학 기술 분야의 전문 용어를 비롯한 인명, 지명, 기관명 등을 자동으로 인식하는 기술 개체 인식 엔진을 위한 테스트베드와 인식된 기술 개체 간의 의미적 연관 관계를 자동으로 추출하는 기술개체 간 관계 추출 테스트베드로 구성되어 있다. 이를 활용함으로써 사용자 및 개발자들은 기술 문헌 분석 엔진의 실행 모니터링은 물론 오류 분석을 효율적으로 수행할 수 있다.

Keywords

References

  1. 최성필 "과학기술분야 시맨틱 전자 문헌의 반자동 구축에 관한 기반 연구," 한국언어정보학회 2010년 정기학술대회, pp.25-34, 2010.
  2. R. C. Bunescu and R. J. Mooney, "A Shortest Path Dependency Kernel for Relation Extraction," Proceedings of the Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing, Vancouver, B.C., pp.724-731, 2005
  3. 최윤수, 송사광, 전홍우, 정창후, 최성필, "과학기술문헌분석을 위한 기계학습기반 범용 전문용어 인식 시스템", 정보처리학회논문지, Vol.18, No.5, pp.329-338, 2011.
  4. 정창후, 전홍우, 최성필, 최윤수, 송사광, "술어-논항 구조의 패턴 유사도를 결합한 혼합 커널 기반 관계추출", 한국인터넷정보학회논문지, Vol.12, No.5, pp.73-85, 2011.
  5. 최성필, 최윤수, 전홍우, 정창후, 송사광, 정한민, "SINDI-WALKS: 과학기술지식발견 워크벤치", 한국컴퓨터종합학술대회(KCC), 2012.
  6. 정창후, 최성필, 이민호, "기술용어 간 관계추출의 성능평가를 위한 반자동 테스트 컬렉션 구축 프레임워크 개발", 한국콘텐츠학회논문지, Vol.10, No.2, pp.481-489, 2010. https://doi.org/10.5392/JKCA.2010.10.2.481
  7. 정창후, 최성필, 윤화묵, "그리드 기반의 고성능 과학기술지식처리 프레임워크 개발", 한국콘텐츠 학회논문지, Vol.9, No.12, pp.877-885, 2009. https://doi.org/10.5392/JKCA.2009.9.12.877
  8. 최성필, 정창후, 최윤수, 맹성현, "평면적 어휘 자질들을 활용한 확장 혼합 커널 기반 관계 추출", 정보과학회논문지, Vol.36, No.8, pp.642-652, 2009.