DOI QR코드

DOI QR Code

A Design and Implementation of Ontology-based Retrieval System for the Electronic Records of Universities

대학 전자기록물을 위한 온톨로지 기반 검색시스템 설계 및 구현

  • 이정희 (한국해양대학교 총무과 기록관) ;
  • 김희섭 (경북대학교 문헌정보학과)
  • Published : 2007.09.29

Abstract

The purpose of this study is to design and implement an ontology-based retrieval system for the electronic records of universities and to compare its performance with the existing keyword-based retrieval system. We used OntoStudio 1.4 for implementing an ontology-based retrieval system, and the test collection consisted of the following: (1) 5,099 electronic records of the 'personnel management notification' created by Korea Maritime University, (2) 20 topics (10 short-topics and 10 long-topics), and (3) the relevant assessments were conducted by the group of human experts. 10 university staff participated in the experiment of keyword-based searching and used the same test collection as used in the experiment of ontology-based searching. The ontology-based retrieval system outperformed to the keyword-based retrieval system in terms of Recall and Precision, and the same results showed in the test of the short-topics and long-topics comparison.

이 연구에서는 우리나라 국 공립 대학의 전자기록관리시스템이 보다 적합한 전자기록물을 검색할 수 있는 기반환경을 조성하기 위하여 온톨로지 기반의 검색시스템을 설계 및 구현하였고 그 성능을 기존의 키워드 기반 검색시스템과 비교해 보았다. 온톨로지 기반 검색시스템은 OntoStudio 1.4를 사용하여 자체 설계 및 구현하였으며, 실험에 사용된 실험 컬렉션의 구성은 다음과 같다: (1) 문서는 한국해양대학교의 2005년도 전자문서관리시스템에서 생성한 '인사발령통보' 5,099건의 전자기록물, (2) 질의집단은 장문10개와 단문10개 총20개, 그리고 (3) 적합성평가는 전문가 집단에 의하여 이루어졌다. 한편 기반 검색시스템의 성능평가 실험은 기존의 전자기록관리시스템을 이용하여 10명의 피실험자에 의하여 온톨로지 기반 검색시스템과 동일한 실험 컬렉션을 사용하여 이루어졌다. 재현율과 정확률에 의한 성능을 비교해본 결과 온톨로지 기반의 검색시스템이 기반의 검색시스템 보다 높은 성능을 보였다. 또한 장문과 단문의 질의집단 비교평가에서도 온톨로지 기반의 검색 성능이 기반의 검색시스템 보다 뛰어난 것으로 나타났다.

Keywords

References

  1. 김병곤. 2005. RDF 문서의 키워드 검색 서비스를 위한 리소스와 속성을 고려한 인텍싱 구조지. 정보과학회논 문, 2(1): 81-86
  2. 김중태. 2006. 웹 2.0 시대의 기회 시맨틱 웹, 서울: 디지털미디어리서치
  3. 김현희. 2005. 은행의 암묵적 지식과 형식적 지식의 통합관리를 위한 온톨로지 기반 지식 리포지토리 모형 개발 연구. 정보관리학회지, 22(2): 229- 251
  4. 설문원, 천주권. 2005. 전자기록철의 구조와 관리방안-영국 ERMS 표준을 중심으로. 한국기록관리학회지, 5(2): 49-72
  5. 송도규. 2006. 체언표현 개념분류체계와 OWL 온톨로지의 상관관계 연구. 한국컴퓨터정보학회지, 11(2): 93-99
  6. 윤주인. 2006. 시맨틱 웹 온톨로지를 이용한 문서 분류 시스템 설계 및 구현. 전북대학교 대학원 박사학위논문
  7. 이순복, 김진우, 송치양, 김영갑, 권주흠, 이태웅, 김현석, 백두권. 2007. 소프트웨어 제품 계열 공학의 온톨로지 기반 휘처 공통성 및 가변성 분석 기법. 정보과학회논문지, 34(3): 196-211
  8. 이현실, 이두영. 2003. 온톨로지 기반 한의학 처방 지식관리시스템 설계에 관한 연구. 한국정보관리학회지, 20(1): 341-371
  9. 임수연. 2004. 전문용어의 의미관계 정보를 이용한 도메인 온툴로지의 구축. 경북대학교 대학원 박사학위논문
  10. 정희준, 유명환, 이강찬, 김성한, 민재홍, 정인정. 2002. 시맨틱 웹 기반의 바이오 온톨로지 시스템의 설계. 한국정보과학회지, 29(2-II): 358-360
  11. 최정화, 박영택. 2006. 의미 중의성을 고려한 온톨로지 기반 메타데이타의 자동 생성. 정보과학회지, 33(11): 986-998
  12. 한성국, 이현실. 2007. 시맨틱 라이브러리를 위한 아키텍쳐 참조 모델. 정보관리학회지, 24(1): 75-101
  13. 한승희. 2006. 단어연상검사법을 이용한 탐색시소러스 구축에 관한 실험적 연구. 한국문헌정보학회지, 40(3): 289-304
  14. 함한희, 박순철. 2006. 디지탈 아카이브즈의 문제점과 방향-문화원형 콘텐츠를 중심으로. 한국비블리아학회지, 17(2): 23-42
  15. Initiative for the Evaluation of XML retrieval, 'INEX 2006 Interactive Track Guidelines. [cited 2007. 4. 3].
  16. Miller, E. An Introduction to the Resource Description Frame work. [cited 2007. 4. 25].
  17. Ontoprise. [cited 2007. 1. 7].
  18. OWL Web Ontology Language Overview. [cited 2007.2.9.]
  19. Protege. [cited 2006. 12. 23].
  20. Semantics Korea. [cited 2007. 4.5.]

Cited by

  1. Design and Evaluation of an Individual Instance-based Ontology Retrieval System for Archival Records of the "Saemaul Movement" vol.13, pp.3, 2013, https://doi.org/10.14404/JKSARM.2013.13.3.067
  2. A Study on the Improvement of Accessibility to Public Records: Based on the Construction of Subject Thesaurus for Presidential Archives vol.14, pp.4, 2014, https://doi.org/10.14404/JKSARM.2014.14.4.127