웹 문서 정보추출과 자연어처리를 통한 온톨로지 자동구축에 관한 연구

A Study of Automatic Ontology Building by Web Information Extraction and Natural Language Processing

  • 김명관 (을지대학교 의료산업학부) ;
  • 이영우 (을지대학교 컴퓨터정보과)
  • 투고 : 2009.03.30
  • 발행 : 2009.06.30

초록

인터넷의 발달로 전자문서가 증가함에 따라, 정보검색기술의 중요성도 함께 증가하게 되었다. 본 연구는 비정형 텍스트 웹 문서로부터 사용자가 요구하는 핵심 의미 지식을 추출하기 위하여 LGG(Local Grammar Graph) 구축에 기반 하여 보다 효율적이고 정확한 지식구축을 가능하게 한다. 주가등락이라는 특정 분야의 패턴을 추출하여 만든 패턴 문법을 사용해서 OWL(Web Ontology Language) 기반의 온톨로지를 구축하였다. 특정 분야의 온톨로지를 구축함으로써 기존 검색에서 할 수 없었던 지식의 의미 검색이 가능하며 나아가 사용자가 원하는 질의에 대한 정보의 추론이 가능할 것이다.

The proliferation of the Internet grows, according to electronic documents, along with increasing importance of technology in information retrieval. This research is possible to build a more efficient and accurate knowledge-base with unstructured text documents from the Web using to extract knowledge of the core meaning of LGG (Local Grammar Graph). We have built a ontology based on OWL(Web Ontology Language) using the areas of particular stocks up/down patterns created by the extraction and grammar patterns. It is possible for the user can search for meaning and quality of information about the user wants.

키워드

참고문헌

  1. 남지순. 웹 문서 의미 지식 추출을 위한 LGG의 구축. 한국프랑스어문교육학회논문지, 25권, 한국프랑스어문교육학회, 2007년, pp. 105-128.
  2. T.R. Gruber, "A Translation Approach to Portable Ontologies", Knowledge Acquisition. 5(2). pp. 199-200, 1993. https://doi.org/10.1006/knac.1993.1008
  3. 최호섭, 옥철영 정보검색 시스템과 온토로지. 정보과학회지, 제22권, 제4호, 한국정보과학회, 2004년, pp. 62-71
  4. 남지순, 프랑스 언어 자원 구축을 위한 부분문법(Grammaire locale)방법론의 소개. 한국프랑스학회논문지, 제 49권, 한국프랑스학회, 2005년, pp. 67-94.
  5. 민경구, 선충녕, 서정연, 문맥과 위치정보를 사용한 정보추출. 2005 한국컴퓨터종합학술대회, 제32권, 제1호, 한국정보과학회, 2005년, pp. 490-492
  6. 임윤선 김 명. 온톨로지 기반 지식획득 방법에 대한 연구. 2006 한국컴퓨터종합학술대회, 제 33권, 제1호, 한국정보과학회, pp. 118-120
  7. 장명길, 김현진, 장문수, 최재훈, 오효정, 이충희, 허정. 의미기반 정보검색, 정보과학회지, 제19권, 제10호, 한국정보과학회, 2001년, pp. 7-18
  8. 신희영, 정동원, 김진형, 백두권. Jena2 기반의 효율적인 OWL Ontology 관리를 위한 저장모델. 2007 한국컴퓨터종합학술대회, 제 34권, 제 1호, 한국정보과학회, 2007년, pp. 144-148.
  9. 이승우, 정한민, 성원경. R-DBMS 기반 추론 서비스인 OntoThink-K에서의 SPARQL 질의지원, 한국정보과학회지, 제 33권, 제 2호, 한국정보과학회, 2006년, pp. 223-227.
  10. 민영근, 이복주, 온톨로지 자동 구축을 위한 서술어 온톨로지, 정보처리학회지, 제 15권, 제 1호, 2008년, pp. 28-31
  11. M. Gross, "The Construction of Local Grammars, in Finite-state Language Processing", the MIT Press. 1997.
  12. C. T. Meadow, "Text Information Retrieval Systems", Academic Press, Inc., pp. 201-211, 1992.
  13. T. Berners-Lee, J. Hendier, OraLassila, "The Semantic Web", Scientific American, 2001.
  14. 한용진, 박세영, 이영화, 김권양. Event 온톨로지 기반의 의미 정보 검색. 2007 한국컴퓨터종합학술대회, 제 34권, 제 1호, 한국정보과학회, 2007년, pp. 95-96