DOI QR코드

DOI QR Code

An Extraction of Property of Ontology Instance Using Stratification of Domain Knowledge

도메인지식의 계층화를 통한 온톨로지 인스턴스의 속성정보 추출

  • 장문수 (서경대학교 소프트웨어학과) ;
  • 강선미 (서경대학교 컴퓨터과학과)
  • Published : 2007.06.30

Abstract

The ontology has been used widely in recent years with its aim to accumulate knowledge that machine can comprehend. We believe that machine can manage and analyze information on its own using the ontology. In this paper, we propose an algorithm that allows us to extract properties of ontology instances from structured information already existing in web documents. In particular, by stratification of the domain knowledge that is composed of property information, we were able to make the algorithm better and improve the quality of extraction results. In our experiments with 20 thousands targeted documents, we were able to extract property information with 83% confidence.

최근에 여러 분야에서 구축되고 있는 온톨로지는 기계가 이해할 수 있는 지식을 축적하는 것을 목표로 하고 있다. 기계가 온톨로지를 이용하여 정보의 관리 및 해석을 스스로 하는 것이 가능할 것으로 본다. 본 논문에서는 온톨로지의 인스턴스를 구성하는 속성을 기존 웹 문서의 구조정보로부터 추출하는 알고리즘을 제안하였다. 특히, 속성 정보로 구성하는 도메인 지식을 계층화함으로써 속성 추출 알고리즘을 개선하고, 추출 결과의 품질을 향상시킨다. 2만 문서를 대상으로 제안된 알고리즘을 적용한 결과 약 83%의 신뢰도의 속성 정보를 추출할 수 있었다.

Keywords

References

  1. 김중태, 시맨틱 웹, 디지털미디어리서치, 2006
  2. 김재호, 신지애, 최기선, '국가 IT 온톨리지 구축', 한국정보과학회 가을 학술발표논문집, 제33권, 2(B) 호, pp. 16-19, 2006
  3. 구미숙, 황정희, 류근호, 홍장의, '데이터마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성', 정보처리학회논문지D, 제13권3호, pp. 299-308, 2006 https://doi.org/10.3745/KIPSTD.2006.13D.3.299
  4. 조이현, 박대원, 박동훈, 문홍구, 권혁칠, '비전문가 에 의한 상하위 관계 중심의 온톨로지 공동구축 방법', 한국지능정보시스템학회 2006년 추계학술대회 논문집, pp. 87-91, 2006
  5. 최정화, 박영택, '의미 중의성을 고려한 온톨로지 기반 메타데이터의 자동 생성', 정보과학회 논문지: 소프트웨어 및 응용, 제33권, 11호, pp. 986-998, 2006
  6. 강연수, 정한민, 이승우, 김평, 성원경, '국가과학기술 R&D 기반정보 온톨로지', 한국콘텐츠학회 2006 년 춘계종합학술대회 논문집, 제4권1호, pp. 231-234, 2006
  7. 최호섭, 임지희, 배경준, 최수일, 옥철영, '온톨로지 구축 방법과 사례', 정보과학회지, 제24권, 4호, pp 31-44, 2006
  8. 한성국, 이현실, '시소러스를 활용한 온톨로지 구축 방안 연구', 한국비블리아학회지, 제17권, 1호, pp. 285-303. 2006
  9. 최중민, '인터넷 정보 추출 에이전트', 한국정보과학회지, 제18권,5호, pp. 48-53, 2000
  10. 서희경, 양재영, 최종민, '준구조화된 정보소스에 대한 지식 기반의 Wrapper 학습에이전트', 정보과학회 논문지 . 소프트웨어 및 응용, 제29권, 1호pp. 42-52, 202
  11. 정창후, 이민호, 주원균, 맹성현, '웹페이지에서 레이블이 없는 텍스트 인식을 위한 확률 모델', 한국 정보과학회 2003년도 가을 학술발표논문집, 제30권, 2(1)호, pp. 163-165, 2003
  12. 정창후, 서정현, 류범종, 맹성현, '도메인 지식을 이용한 랩퍼에서 규칙 생성 정확도 향상', 한국정보과학회 2003년도 봄 학술발표논문집, 제30권, 1(A)호, pp. 662-664, 2003
  13. 뭉클, http://www.rr.uncle.com/
  14. 다나와, http://www.danawa.com/

Cited by

  1. Pattern and Instance Generation for Self-knowledge Learning in Korean vol.25, pp.1, 2015, https://doi.org/10.5391/JKIIS.2015.25.1.063