A Computational Model for the Word-Syntax

단어통사론을 위한 계산 모형

  • Kim, Dong-Joo (Computer Science & Engineering, Hanyang University) ;
  • Kim, Han-Woo (Computer Science & Engineering, Hanyang University)
  • 김동주 (漢陽大學敎 컴퓨터工學科) ;
  • 김한우 (漢陽大學敎 컴퓨터工學科)
  • Published : 2002.11.01

Abstract

Computational models up to now for Korean morphology have been linear in that it deal with only segmentation of morphemes rather than formation of the internal structure of a word. When integrating a linear computational model with syntax analysis, it requires an additional interface component between this model and the syntax to bind morphemes into sentence constituents. Furthermore the linear model is not semantically intuitive. In this paper, based on word-syntactical viewpoint, we propose an integrated computational model that deals with morpheme segmentation, formation of syntactic element (sentence constituent), and even internal structure of word. Formalism of two-level morphology is employed to cope with morpheme segmentation and alternation problems, and functional diacritics are proposed to incorporate categorial context into the two-level formalism. A modified GLR-based algorithm is also proposed to check syntactical constraint of morphemes.

한국어 형태론에 대한 기존의 전산모형은 선형적인 것들로 단어 내부구조 분석보다 형태소 분리 문제에만 관심을 두고 있다. 이러한 선형적 전산모형을 구문 분석 과정과 통합적으로 고려할 경우, 구문 단위 요소의 형성을 위해 형태소 분석 결과를 묶어야만 하는 추가적인 과정이 필요할 뿐만 아니라 의미적 직관성을 얻기도 어려웠다. 본 논문에서는 형태소 분리와 구문 요소 형성뿐만 아니라 단어의 구조 분석까지도 통합적으로 다룰 수 있는 단어통사론적 시각에 따른 전산 모형을 제안한다. 먼저 형태소 분리와 변형 문제를 다루기 위해 2단계형태론의 형식화를 도입하고, 품사 문맥을 반영하기 위해 기능성 구분문자를 제안한다. 그리고 형태소의 통사적 결합 검사를 위해 GLR에 기반한 변형 알고리즘을 제안한다.

Keywords

References

  1. Charles W. Morris, Foundations of the Theory of Signs, Chicago : Chicago University Press, 1938
  2. Elisabeth O. Selkirk, The Syntax of Words. MIT Press, 1982
  3. 안상철, 형태론, 민음사, 1998
  4. Morris Halle, 'Prolegmena to a theory of word formation,' Linguistic Inquiry, vol. 4, pages 3-16, 1973
  5. Noam Chomsky, 'Remarks on normalization,' In R. Jacobs and P. Rosenbaum (eds.) Readings in English Transformational Grammar, Waltham, MA: Blaisdell, pages 184-221, 1970
  6. S. R. Anderson, 'Where's morpholgy,' Linguistics Inquiry, vol. 13, pages 15-44, 1982
  7. N. Fabb, Syntactic Affixation, PhD Thesis, MIT, 1984
  8. M. Baker, 'The mirror principle and morphosyntatic explanation,' Linguistic Inquiry vol.16, pages 373-416, 1985
  9. M. Baker, Incorporation: a Theory of Grammatical Function Changing, Chicago : Chicago University Press, 1988
  10. Richard W. Sproat, On Deriving the Lexicon, PhD Thesis, MIT, 1985
  11. David J. Weber, H. Andrew Black, Stephen R. McConnel, AMPLE: A Tool for Exploring Morphology, Ocasional Publications in Academic Computing 15. Dallas, TX: Summer Institute of Linguistics, 1988
  12. Graeme D. Ritchie, Graham J. Russell, Alan W. Black, Stephen G. Pulman, Computational Morphology : Practical Mechanisms for the English Lexicon, Cambridge, MA: MIT Press, 1992
  13. Richard W. Sproat, Morphology and Computation, Cambridge, MA: MIT Press, 1992
  14. Evan L. Antworth, User's Guide to PC-KIMMO Version 2, Dallas, TX: Summer Institute of Linguistics, 1995
  15. 강진목, 현대국어의 단어 형성연구, 박사학위논문, 전남대학교, 1994
  16. 서정곤, 국어의 단어형성 원리 - 수정판, 한국문화사, 1998
  17. H. Borer, 'On the morphological parallelism between compounds and constructs,' Yearbook of Morphology, vol. 1, pages 45-66, 1988
  18. John Andrew Carroll, Practical Unification-based Parsing of Natural Language, PhD Thesis, University of Cambridge, 1993
  19. E. Williams, 'On the notions 'lexically related' and 'head of a word',' Linguistic Inquiry, vol. 12, pages 245-274, 1981
  20. 최기선, 남영준, 김진규, 한영균, 박석문, 김진수, 이춘택, 김덕봉, 김재훈, 최병진, '한국어정보베이스를 위한 형태 통사 태그 표준에 관한 연구', 인지과학, 제7권, 4호 43-61, 1996
  21. 안동언, 기계번역을 위한 한국어 해석에서 형태소로부터 구문요소의 형성에 관한 연구, 석사학위논문, 한국과학기술원, 1986
  22. 차준경, 강범모, '형태소 분석 말뭉치의 파생명사 처리', 제12회 한글 및 한국어 정보처리 학술발표논문집, 2000
  23. 전상범, 형태론, 한신문화사, 1995
  24. Andrew Spencer, Morphological Theory: an Introduction to Morphology in Generative Grammar, Oxford: Blackwell, 1991
  25. R. Lees, The Grammar of English Nominalizations, The Hague: Mouton, 1960
  26. M. Aronoff, Word Formation in Generative Grammar, Cambridge, MA : MIT Press, 1976
  27. S. Scalise, Generative Morphology, Dordrecht: Foris, 1984
  28. Masaru Tomita, Efficient Parsing for Natural Language, Boston, MA: Kluwer, 1986
  29. Masaru Tomita, Generalize LR Parsing, Kluwer, 1987
  30. K. Koskenniemi, 'Two-level model for morphological analysis,' In Proceedings of the 8th International Joint Conference on Artificial Intelligence, pages 683-685, Karlsruhe, 1983
  31. 김성용, Tabular parsing 방법과 접속 정보를 이용한 한국어 형태소 분석기, 석사학위논문, 한국과학기술원, 1986
  32. 이은철, CYK법에 기반한 한국어 형태소 분석에서의 개선기법, 석사학위논문, 포항공과대학, 1992
  33. K. Koskenniemi, 'Compilation of automata from morphological two-level rules,' In Proceedings of the 5th Scandinavian Conference of Computational Linguistics, University of Helsinki, pages 143-149, 1986
  34. Alfred V. Aho, Jeffrey D. Ullman, The Theory of Parsing, Translation and Compiling, Volumn 1: Parsing, Prentice-Hall, Englewood Cliffs, N. J., 1972