Automatic Ontology Generation from Natural Language Sentences Using Predicate Ontology

서술어 온톨로지를 이용한 자연어 문장으로부터의 온톨로지 자동 생성

  • 민영근 (단국대학교 대학원 컴퓨터학과) ;
  • 이복주 (단국대학교 컴퓨터학과)
  • Received : 2009.06.23
  • Accepted : 2010.06.07
  • Published : 2010.09.30

Abstract

Ontologies, the important implementation tools for semantic web, are widely used in various areas such as search, reasoning, and knowledge representation. Developing well-defined ontologies, however, requires a lot of resources in terms of time and materials. There have been efforts to construct ontologies automatically to overcome these problems. In this paper, ontologies are automatically constructed from the natural languages sentences directly. To do this, the analysis of morphemes and a sentence structure is performed at first. then, the program finds predicates inside the sentence and the predicates are transformed to the corresponding ontology predicates. For matching the corresponding ontology predicate from a predicate in the sentence, we develop the "predicate ontology". An experimental comparison between human ontology engineer and the program shows that the proposed system outperforms the human engineer in an accuracy.

시맨틱 웹 구현의 중요한 수단인 온톨로지는 검색, 추론, 지식표현 등 다양한 분야에서 사용되고 있다. 그러나 잘 구성된 온톨로지를 개발하는 것은 시간적, 물질적으로 많은 자원이 소모된다. 이러한 문제를 극복하기 위해 온톨로지를 자동으로 구축하는 시도가 있었다. 본 연구에서는 자연어 문장으로부터 직접 온톨로지를 자동적으로 생성하기 위해 형태소와 문장의 구조를 분석하고 자연어 문장의 서술어를 찾아 해당 온톨로지 서술어로 변환되게 하기 위하여 '서술어 온톨로지(predicate ontology)'를 두어서 분석된 자연어 문장의 서술어가 적절한 온톨로지 서술어로 변환될 수 있도록 한다. 인간 온톨로지 구축가와 제안한 방법을 비교한 실험 결과 정확도에서 나은 결과를 보였다.

Keywords

References

  1. T. Berners-Lee, J. Handler, and O. Lassila, "The Semantic Web," Scientific American, May 2001.
  2. 김수경, 안기홍, "시맨틱 웹 응용을 위한 웹 온톨로지 구축기법," 한국정보처fl학회 정보처리학회 논문지 D, 제15-D권, 제01호, pp.47-60, 2008. 2.
  3. S.J. Kang, and J.H. Lee, "Semi-Automatic Practical Ontology Construction by Using a Thesaurus," Workshop on Human Language Technology and Knowledge Management ACL2001, Toulouse France, July 2001.
  4. S.Y. Lim, S.O. Koo, M.H. Song, and S.J. Lee, "Hub word based on Ontology Construction for Document Retrieval," IC-AI'03, Las Vegas USA, June 2003.
  5. P. Clerkin, P. Cunningham, and C. Hayes, "Ontology Discovery for the Semantic Web Using Hierarchical Clustering," Trinity College Dublin Computer Science Dept., Technical Reports, 2001.
  6. A. Wrobel and O. Wurmli, "Data Mining for Ontology Building," Diploma Thesis-Dept. of Computer Science WS 2002/2003.
  7. M. Cannataro and C. Comito, "A Data Mining Ontology for Grid Programming," 1st Workshop on Semantic in Peer-to-Peer and Grid Computing at the Twelfth International World Wide Web Conference, May 2003.
  8. 임수연, 구상옥, 송무희, 이상조, "접미사 패턴을 이용한 온톨로지의 구축 방안," 한국정보과학회 2003년 추계학술대회, Vol.30, No.2-1, pp. 547-549, 2003. 10.
  9. J. Saias and P. Quaresma, "Using NLP Techniques to Create Legal Ontologies in Logic Programming Based Web Information Retrieval System," In Proceedings of the International Conference on Artificial Intelligence and Law, June 2003.
  10. 구미숙, 황정희, 류근호, 홍장의, "데이터마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성," 한국정보처리학회논문지 D, 제13-D권, 제3호, pp.299-308, 2006. 6.
  11. 김희수, 최익규, 김민구, "개념간 관계의 추출과 명명을 위한 통계적 접근 방법," 한국정보처리학회논문지 B, 제12-B권, 제4호, pp.479-486, 2005. 8.
  12. WordNet, http://wordnet.princeton.edu/
  13. 세종계획, http://www.sejong.or.kr.
  14. VerbNet, http://verbs.colorado.edu/-mpalmer/projects/verbnet.html.
  15. PropBank, http://verbs.colorado.edu/-mpalmer/projects/ace.html.
  16. NomBank, http://nlp.cs.nyu.edu/meyers/NomBank.html.
  17. FrameNet, http://framenet.icsi.berkeley.edu/.
  18. Cheoli, http://ids.snu.ac.kr/wiki/철이.
  19. Jena - A Semantic Web Framework for Java, http://jena.sourceforge.net/