DOI QR코드

DOI QR Code

Korean Parsing Model using Various Features of a Syntactic Object

문장성분의 다양한 자질을 이용한 한국어 구문분석 모델

  • 박소영 (고려대학교 대학원 컴퓨터학과) ;
  • 김수홍 (상명대학교 컴퓨터정보통신공학부) ;
  • 임해창 (고려대학교 컴퓨터학과)
  • Published : 2004.10.01

Abstract

In this paper, we propose a probabilistic Korean parsing model using a syntactic feature, a functional feature, a content feature, and a site feature of a syntactic object for effective syntactic disambiguation. It restricts grammar rules to binary-oriented form to deal with Korean properties such as variable word order and constituent ellipsis. In experiments, we analyze the parsing performance of each feature combination. Experimental results show that the combination of different features is preferred to the combination of similar features. Besides, it is remarkable that the function feature is more useful than the combination of the content feature and the size feature.

본 논문에서는 효과적인 구문 중의성 해결을 위해 문장성분의 구문자질, 기능자질, 내용자질, 크기자질을 활용하는 확률적 한국어 구문분석 모델을 제안한다. 그리고, 제안하는 구문분석 모델은 한국어의 부분자유어순과 생략현상을 잘 처리할 수 있도록 문법규칙을 이진형식으로 제한한다. 실험을 통해 제안하는 구문분석 모델의 성능을 각 자질조합별로 분석한다. 분석결과는 서로 다른 특징을 갖는 자질의 조합이 서로 유사한 특징을 갖는 자질의 조합보다 구문중의성 해결에 더 유용하다는 것을 보여준다. 또한, 단일자질인 기능자질이 내용자질과 크기자질의 조합보다 성능이 더 우수함을 알 수 있다.

Keywords

References

  1. 강호관, 이종혁, 이근배, '새로운 어절 해석에 기반한 한국어 의존관계 파서', 제9회 한글 및 한국어 정보처리 학술발표논문집, pp. 327-331, 1997
  2. 김학수, 서정연, '어휘 의존 정보에 기반한 한국어 통계적 구문 분석기', 한국정보과학회 인공지능 연구회 봄 학술발표논문집, pp. 61-65, 1997
  3. 나동렬, 한국어 파싱에 대한 고찰 정보과학지, 제12권 제8호, pp. 33-46, 1994
  4. 박성숙, 한성국, '자질 집합 표현에 의한 자연언어 문법 규칙기술', 제6회 한글 및 한국어 정보처리 학술발표논문집, pp. 419-425, 1994
  5. 이공주, 김길창, 'TAG을 기반으로 한 한국어 구문분석기에서 트리 변형 규칙', 제1회 지능기술 공동학술회의, pp. 100-105, 1995
  6. 이공주, 김재훈, 김길창, '제한된 형태의 구구조 문법에 기반한 한국어 구문분석', 정보과학회논문지(B), 제25권 제4호, pp. 722-732, 1998
  7. 정윤철, 문법 제약규칙을 이용한 중심어 주도의 한국어 구문분석기, 서강대학교 석사학위논문, 2002
  8. 조형준, 박종철, 한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법 한국정보과학회지 논문지, 제27호 제4호, pp. 448-462, 2000
  9. 최기선, KAIST 언어 자원 2001년도판, 과학기술부 핵심 소프트웨어 과제 결과물, 2001, http://kibs.kaist.ac.kr
  10. Black, Ezra, Fred Jelinek, John Lafferty, David M. Magerman, Robert Mercer and Salim Roukos. 'Towards History-based Grammars: Using Richer Models for Probabilistic Parsing,' In Proceedings of the Annual Meeting of the Association for Computational Linguistics, pp.31-37, 1993 https://doi.org/10.3115/981574.981579
  11. Cancedda, Nicola and Christer Samuelsson, Experiments with Corpus-based LFG Specialization. In proceedings of the Sixth Applied Natural Language Processing Conference. pp.204-209, 2000 https://doi.org/10.3115/974147.974175
  12. Cha. Jeongwon, Geunbae Lee and Jong-Hyeok Lee, 'Korean Combinatory Categorial Grammar and Statistical Parsing,' Computers and the Humanities, Vol.36, No.4, pp.431 -453, 2002 https://doi.org/10.1023/A:1020260012525
  13. Charniak, Eugene, Statistical Techniques for Natural Language Parsing AI magazine, Vol.18, No.4, pp.33-43, 1997
  14. Charniak, Eugene, 'Immediate-Head Parsing for Language Models,' In Proceedings of the Annual Meeting of the Association for Computational Linguistics, pp.116-123. 2001 https://doi.org/10.3115/1073012.1073029
  15. Chung, Euisok, Soojong Lim, JiHyun Wang, Myung-Eun Lim and Bo-Hyun Yun, Korean Syntactic Analyzer with Tree-based Grammar, In Proceedings of the International Conference on Computer Processing of Oriental Languages, pp.132-137, 2001
  16. Collins, Michael, Head-Driven Statistical Models for natural Language Parsing, Ph. K. Thesis, University of Pennsylvania, 1999
  17. Goodman, Joshua. 'Parsing Algorithms and Metrics,' In Proceedings of the Annual Meeting of the Association for Computational Linguistics, pp.177 -183. 1996
  18. Goodman, Joshua. 'Probabilistic Feature Grammars,' In Proceedings of the International Workshop on Parsing Technologies, pp.89-100. 1997
  19. Klein, Dan and Christopher D. Manning. 'Accurate Unlexicalized Parsing,' In Proceedings of the Annual Meeting of the Association for Computational Linguistics, pp.423-430. 2003
  20. Kwak, Yong-Jae, Young-Sook Hwang, Hoo-Jung Chung, So-Young Park, Sang-Zoo Lee and Hae-Chang Rim, GLR Parser with Conditional Action Model(CAM), In Proceedings of the 6th Natural Language Proceesing Pacific Rim Symposium, pp.359-366, 2001
  21. Lee, Seungmi and Key-Sun Choi, Reestimation and Best-First Parsing Algorithm for Probabilistic Dependency Grammars, In Proceedings of the 5th Workshop on Very Large Corpora, pp.41-55, 1997
  22. Lee, Wonll, Geunbae Lee and Jong-Hyeok Lee, Chart-Driven Connectionist Cateforial Parsing of Spoken Korean Computer Processing of Oriental Language, Vol.10, No.2, pp, 147-159, 1996
  23. Magerman, David M., Statistical Decision-Tree Model for Parsing, In Proceedings of the Annual Meeting of the Association for Computational Linguistics, pp.176-183, 1995 https://doi.org/10.3115/981658.981695
  24. Malouf, Robert, John Carroll, Ann Copes take. Efficient Feature Structure operations without compilation. Natural Language Engineering, Vol.6, No.1, pp.29-46, March, 2000 https://doi.org/10.1017/S1351324900002382
  25. Manning, Chirstopher D. and Hinrich Schutze, Foundations of Statistical natural Language Processing, MIT Press, 1999
  26. Pollard, Carl and Ivan A. Sag, Head-Driven Phrase Structure Grammar, CSLI and University of Chicago Press, Stanford, Ca. and Chicago, III, 1994
  27. Yoon, Juntae, Chung-hye Han, Nari Kim and Mee-sook Kim, Customizing the XTAG system for efficient grammar development for Korean Proceedings of the International Workshop on Tree Adjoining Grammars and Related Formalisms, 2000

Cited by

  1. Korean Mobile Spam Filtering System Considering Characteristics of Text Messages vol.11, pp.7, 2010, https://doi.org/10.5762/KAIS.2010.11.7.2595