Semantic Relation Extraction using Pattern Pairs Sharing a Term

용어를 공유하는 패턴 쌍을 이용한 의미 관계 추출

  • 김세종 (포항공과대학교 컴퓨터공학과) ;
  • 이용훈 (포항공과대학교 컴퓨터공학과) ;
  • 이종혁 (포항공과대학교 컴퓨터공학과)
  • Published : 2009.03.15

Abstract

Constructing an ontology using a mass corpus begins with an automatic semantic relation extraction. A general method regards words appearing between terms as patterns which are used to extract semantic relations. However, previous approaches consider only one sentence to extract a pattern, so they cannot extract semantic relations for terms in different sentences. This paper proposes a semantic relation extraction method using pairs of patterns sharing a term, where each pattern is extracted using one of the seed term pair satisfying the target relation. In our experiments, we achieved the accuracy 83.75% improving previous methods by 7.5% in is-${\alpha}$ relation and the accuracy 83.75% improved by 5% in part-of relation. We also present a possibility of improving the recall by the relative recall.

대용량 코퍼스를 사용하여 온톨로지를 구축하는 것은 해당 코퍼스에서 등장하는 용어들과 이들 간의 의미관계를 보다 자동화된 방법으로 추출하는 것으로부터 시작한다. 이때 주로 사용하는 방법이 용어들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어들을 해당 패턴에 할당된 의미 관계로 설정하는 방법이다. 하지만 기존의 패턴 기반 의미 관계 추출 방법은 한 문장만을 대상으로 패턴을 추출 및 적용하기 때문에 서로 떨어진 용어에 대한 의미 관계를 추출할 수 없다는 단점을 가지고 있다. 본 논문은 이러한 한계점에 착안하여, 의미 관계를 대표하는 각각의 용어를 하나씩 포함하고 기타 용어를 공유하고 있는 서로 떨어진 패턴 쌍을 추출하여 확장된 패턴을 생성하고 이를 의미 관계 추출에 적용하였다. 본 방법론은 is-${\alpha}$ 관계의 경우 기존 방법론 보다 7.5% 향상된 83.75%의 정확률을, part-of 관계의 경우에는 5% 향상된 동일한 83.75%의 정확률을 보였으며 상대적 재현율을 통해 실제 재현율의 향상 가능성도 함께 제시하였다.

Keywords

References

  1. A. Maedche, S. Staab, “Measuring similarity bet-ween ontologies,” EKAW, LNAI 2473, pp. 251-263, 2002
  2. M. Kavalec, V. Svatek, “A Study on Automated Relation Labelling in Ontology Learning,” Ontology Learning and Population from Text: Methods, Evaluation and Applications, lOS Press, pp. 44-58, 2005
  3. P. Pantel, M. Pennacchiotti, “Espresso: Leveraging generic patterns for automatically harvesting semantic relations,” Proceedings of ACL, pp. 113-120, 2006 https://doi.org/10.3115/1220175.1220190
  4. M.A. Hearst, “Automatic acquisition of hyponyms from large text corpora,” Proceedings of the 14th conference on Computatonal linguistics, Vol.2, pp. 539-545, 1992 https://doi.org/10.3115/992133.992154
  5. M. Berland, E. Charniak, “Finding parts in very large corpora,” Proceedings of ACL, pp. 57-64, 1999 https://doi.org/10.3115/1034678.1034697
  6. R. Girju, et al., “Learning semantic constraints for the automatic discovery of part-whole relations,” Proceedings of HLT/NAACL, pp. 1-8, 2003 https://doi.org/10.3115/1073445.1073456
  7. D. Ravichandran, E. Hovy, “Learning surface text patterns for a question answering system,” Pro-ceedings of ACL, pp. 41-47, 2002 https://doi.org/10.3115/1073083.1073092
  8. 김혜민, 최익규, 김민구, "일반화된 패턴을 이용한 관계 추출 시스템", 한국컴퓨터종합학술대회논문집, Vol.32, No.1(B), pp. 658-660, 2005
  9. X. Yang, J. Su, “Coreference resolution using semantic relatedness information from automatically discovered patterns,” Proceedings of ACL, pp. 528- 535, 2007
  10. P. Pantel, D. Ravichandran, “Automatically labeling semantic classes,” Proceedings of HLT/NAACL, pp. 321-328, 2004
  11. Wikipedia, "http://www.wikipedia.org"
  12. Stanford tagger, "http://nlp.stanford.edu/software/tagger.shtml"
  13. WordNet 3.0, "http://wordnet.princeton.edu"