DOI QR코드

DOI QR Code

A Semantic-Based Information Filling System Using Ontology

온톨로지를 이용한 의미 기반 정보 채움 시스템

  • 민영근 (단국대학교 대학원 전자컴퓨터공학) ;
  • 김인수 (서호전기 시스템연구부) ;
  • 이복주 (단국대학교 전자컴퓨터공학부)
  • Published : 2007.08.31

Abstract

It is very iterative and complicated work to enter the personal information every time one fills the form-based resume or one joins the new membership page on the internet. Although there are some systems that have the personal information on the computer and fill the membership page automatically, their accuracies are not often satisfactory in that the fields and their values do not match exactly. The research proposes and implements a system that has user's information on the computer and reasons and fills the information automatically that a membership web page(target page) requests using the personal information ontology. During the reasoning process, the target page is analyzed to extract the requested fields. Then the requested field names are converted to the standard field names using synonym ontology. The converted requested fields find the appropriate level in the personal information ontology using ontology match making to generate the final field value. The system not only finds the similar fields but also generates the exact field values by reasoning on the information ontology hierarchy. By experimenting with several membership pages on the web, the system showed higher accuracy over the existing systems. The system can be easily applicable to the cases where one iteratively fills the same information such as resume form.

테이블 형태로 이루어진 이력서 양식이나 인터넷 회원 가입에서 개인의 신상 정보를 매번 입력하는 일은 매우 반복적이고 번거로운 일이다. 개인의 신상 정보를 컴퓨터에 저장하고 있다가 인터넷 회원 가입 페이지에 자동으로 채워 주는 몇 개의 시스템이 나와 있으나 필드와 필드 값이 잘못 매치되는 등 정확도가 떨어지는 면이 있다. 본 연구는 컴퓨터에 개인의 신상정보를 저장하고 있다가 개인 데이터 온톨로지를 이용하여 회원가입 페이지(목표 페이지)에서 요구하는 사용자의 정보를 추론하고 자동으로 채워주는 시스템을 제안하였다. 추론의 과정에서 먼저 목표 페이지를 분석하여 요구하는 필드명을 추출하고, 유사어 온톨로지를 이용하여 요구 필드명을 표준 필드명으로 변환한다. 표준 필드명으로 변환된 요구 필드는 온톨로지 매치 메이킹을 이용하여 개인 데이터 온톨로지 상의 적절한 레벨을 찾아서 최종적인 필드값을 생성한다. 본 시스템은 목표 페이지와 유사한 필드를 가져올 뿐만 아니라 온톨로지 계층 상에 해당되는 필드를 추론하여 정확한 필드값을 가져오게 된다. 몇 개의 회원 가입 페이지를 대상으로 실험한 결과 본 시스템이 기존의 시스템에 비해 정확도에서 우수함을 보였다. 본 시스템은 이력서 양식 등 반복적으로 동일한 정보를 채우는 경우에도 쉽게 적용 가능하다.

Keywords

References

  1. 마이크로스프트 패스포트, http://www.passport.net
  2. 알프레드, http://www.alfred.to/
  3. eCARD 솔루션, http://www.cyber-card.co.kr
  4. Claire Cardie, 'Empirical Methods in Information Extraction,' - AI Magazine, Vol.18, No.4, 1997
  5. 엄재홍, '은닉 마르코프 모델을 이용한 정보추출', 제5회 한국 과학기술 정보인프라 워크샵 학술발표 논문집, pp. 132-146, 2000
  6. 김재훈, '정보추출의 기술 현황', 정보과학회지, 제 22권 제 4호, pp. 35-46, 2004
  7. T. Berners-Lee, J. Hendler, and O. Lassila, 'The Semantic Web', Scientific American, 2001
  8. D. Fensel, F. van Hamelen, I. Horrocks, D. L. Mcguinness, and P. F. Patel-Schneider, 'An Ontology Infrastructure for the Semantic Web', 2001
  9. A. Sheth, C. Bertram, D. Avant, B. Hammond, K. Kochut, and Y. Warke, 'Managing Semantic Content for the Web', 2002
  10. 최중민, '시맨틱 웹의 개요와 연구동향', 정보과학회지, 제 21권, 제3호, pp.4-10, 2003
  11. M.A. Visciola, 'Search types and context of use in the semantic Web,' 2003
  12. Ning Zhang, Hong Chen, Yu Wang, Shi- Jun Cheng, and Ming-Feng Xiong, 'ODAIES: ontology-driven adaptive Web information extraction system', 2003
  13. C. Fellbaum, 'WordNet: An Electronic Lexical Database', MIT Press, 1998
  14. http://www.cogsci.princeton.edu/~wn
  15. H. Rodriguez, S. Climent, P. Vossen, L. Bloksma, W. Peters, A. Alonge, F. Bertagna, and A. Roventint, 'The top-down strategy for building EuroWordNet: Vocabulary coverage, base concepts and top ontology,' Comput. Humanities, vol. 32, pp. 117-159, 1998 https://doi.org/10.1023/A:1001169525131
  16. G. Leroy and H. Chen, 'Meeting medical terminology needs-the ontology-enhanced Medical Concept Mapper,' IEEE Transactions on Information Technology in Biomdeicine, vol. 5, Issue 4, pp. 261-270, 2001 https://doi.org/10.1109/4233.966101
  17. A. T. McCray, S. Srinivasan, and A. C. Browne, 'Lexical methods for managing variation in biomedical terminologies,' in Proc. Annual Comput. Applicat. Med. Care Syrnp., pp. 235-239, 1994