Combinatory Categorial Grammar for the Syntactic, Semantic, and Discourse Analyses of Coordinate Constructions in Korean

한국어 병렬문의 통사, 의미, 문맥 분석을 위한 결합범주문법

  • 조형준 (한국과학기술원 전산학과) ;
  • 박종철 (한국과학기술원 전산학과)
  • Published : 2000.04.15

Abstract

Coordinate constructions in natural language pose a number of difficulties to natural language processing units, due to the increased complexity of syntactic analysis, the syntactic ambiguity of the involved lexical items, and the apparent deletion of predicates in various places. In this paper, we address the syntactic characteristics of the coordinate constructions in Korean from the viewpoint of constructing a competence grammar, and present a version of combinatory categorial grammar for the analysis of coordinate constructions in Korean. We also show how to utilize a unified lexicon in the proposed grammar formalism in deriving the sentential semantics and associated information structures as well, in order to capture the discourse functions of coordinate constructions in Korean. The presented analysis conforms to the common wisdom that coordinate constructions are utilized in language not simply to reduce multiple sentences to a single sentence, but also to convey the information of contrast. Finally, we provide an analysis of sample corpora for the frequency of coordinate constructions in Korean and discuss some problematic cases.

자연언어처리에 있어서 병렬구문은 분석의 복잡성, 단어의 애매성, 서술어 생략 등에 따른 처리의 어려움을 내포하고 있다. 본 논문에서는 한국어에서 발생하는 병렬문의 통사적 특징을 능력문법 (competence grammar)의 입장에서 접근하고 분석된 결과를 기반으로 하여 한국어 병렬문 해석을 위한 결합범주문법 (Combinatory Categorial Grammar)을 제안한다. 제안된 결합범주문법을 사용해서 병렬문에 대한 각각 다른 수준의 통사적, 의미적, 문맥적 정보들이 사전에 어휘적으로 통합될 수 있고 통합된 정보를 이용하여 통사적, 의미적, 문맥적 분석들이 각각 다른 수준의 처리를 거치지 않고 동시에 점진적으로 유도될 수 있음을 보인다. 유도된 정보들을 통해 일반적으로 한국어 병렬문의 주된 기능이라고 생각되는 두 문장이 가지는 정보를 대조, 비교하는 기능이 표현될 수 있음을 보인다. 말뭉치를 분석하여 병렬문이 한국어 처리에서 차지하는 비중과 제시한 문법으로 처리할 수 없는 문형들에 대한 논의를 제공한다.

Keywords

References

  1. Mark Steedman, 'Gapping as constituent coordination,' Linguistics and Philosophy 13 pp. 207-263, 1990 https://doi.org/10.1007/BF00630734
  2. Mark Steedman, 'Surface structure and interpretation,' Linguistic Inquiry Monograph 30, 1997
  3. Scott Prevost, 'A semantics of contrast and information structure for specifying intonation in spoken language generation,' PhD thesis, University of Pennsylvania, 1995
  4. Berryl Hoffman, 'The computational analysis of the syntax and interpretation of free word order in Turkish,' PhD thesis, University of Pennsylvania, 1995
  5. Jong C. Park, 'Quantifier scope and constituency,' Proceedings of 33rd ACL, pp. 205-212, 1995 https://doi.org/10.3115/981658.981686
  6. Jong C. Park, 'A lexical theory of quantification in ambiguous query interpretation,' PhD thesis, University of Pennsylvania, 1996
  7. Jong C. Park, 'A unification-based semantic interpretation for coordinate constructs,' Proceedings of 30th ACL, pp. 209-215, 1992 https://doi.org/10.3115/981967.981994
  8. Cem Bozsahin, 'Deriving the predicate-argument structure for a free word order language,' Proceedings of 36th COLING-ACL, pp. 167-173, 1988 https://doi.org/10.3115/980451.980872
  9. Nobo N. Komagata, 'The computational analysis of information structure using parallel expository texts in English and Japanese,' PhD thesis, University of Pennsylvania, 1999
  10. Jeongwon Cha, WonIl Lee, Geunbae Lee, Jong-Hyeok Lee, 'Morpho-syntactic modeling of Korean with K-CCG,' Proceedings of 18th ICCPOL, pp. 67-73, 1999
  11. Sung-Kook Han, Chan-Gon Park, 'Combinatory categorial grammar for Korean,' 제 2회 한글 및 한국어정보처리 학술발표논문집, pp. 164-171, 1990
  12. WonIl Lee, Geunbae Lee, Jong-Hyeok Lee, 'Morpho-syntactic modeling of Korean with a categorial grammar,' Proceedings of NLPRS, pp. 545-548, 1997
  13. 이진복, 박종철, 'MCCG에 기반한 한국어 Quantifier Floating', 한국정보과학회 99년 봄 학술발표논문집 (B), 제26권, 1호, pp. 330-332, 1999
  14. 최재희, '국어 명사구 접속의 연구', 한글 제 188호, pp. 91-115, 1985
  15. 김진수, '국어 접속조사와 어미연구', 탑출판사, 1987
  16. 김영희, '와의 양상'. 국어국문학, 1974
  17. 이관규, '국어 대등구성 연구', pp. 53-136, 서광학술자료사, 1992
  18. 이관규, '대등구성의 요건과 유형', 한글 제 217호, pp. 65-81, 1992
  19. 김영희, '등위접속문의 통사특성', 한글 제 201호, pp. 83-117, 1988
  20. 서정수, '국어의 접속어미 연구(I)', 한글, 제 189호, pp. 51-86, 1985
  21. 서정수, '국어문법', pp. 1129-1178, 한양대학교 출판원, 1996
  22. 이희자, 이종희, '텍스트분석적 국어 조사의 연구', pp. 32-37. 한국문화사, 1998
  23. 홍사만, '국어특수조사론', pp. 113-147, 학문사, 1983
  24. Barbara J. Grosz, Aravind K. Joshi, and Scott Weinstein, 'Centering: A Framework for Modeling the Local Coherence of Discourse,' Computational Linguistics 21(2), pp. 203-225, 1995
  25. Mark Steedman, 'The Syntactic Process,' MIT Press, 1999
  26. 김재훈, '오류-보정 기법을 이용한 어휘 모호성 해소', 박사학위 논문, 한국과학기술원, 1996
  27. Jong C. Park, Hyun Ah Lee, Gil Chang Kim, 'Predicate-argument structure and lexical translation,' Manuscript, 1999