DOI QR코드

DOI QR Code

Word Spacing Consistency Check using Syllable and Morpheme Information

음절 및 형태소 정보를 이용한 띄어쓰기 일관성 검사

  • 이재성 (충북대학교 사범대학 컴퓨터교육과)
  • Received : 2010.01.26
  • Accepted : 2010.05.10
  • Published : 2010.05.28

Abstract

Korean word spacing rules have exceptional cases which permit both spacing and no-spacing between words. The exceptional cases, however, do not mean that inconsistent spacing between words or word-phrases is legitimate in a document proof reading. This paper proposes a word spacing consistency check method using syllable and morpheme information, and evaluated it through experiment.

한국어 띄어쓰기 규칙은 경우에 따라 예외 조항이 있어 띄어 쓰거나 붙여 쓰는 것을 모두 허용하는 경우가 있다. 이러한 이중적 규칙에도 불구하고 같은 문서 내의 같은 어절이나 어구들은 일관성 있게 띄어쓰거나 붙여 쓰는 것이 문서 교정상 올바르다. 본 논문에서는 음절 정보 및 형태소 정보를 이용하여 비일관적으로 쓰인 띄어쓰기를 효과적으로 검사하는 방법을 제안하고 실험하여 평가하였다.

Keywords

References

  1. 국립국어원, 한국 어문 규정집, (주)계문사, 2007.
  2. 국립국어원, 문교부고시 88-1 한글 맞춤법 해설, 국어연구소 간행, 1988.
  3. P. F. Brown, S. A. Della Pietra, V. J. Della Pietra, and R. L. Mercer, "The mathematics of statistical machine translation: parameter estimation," Computational Linguistics, Vol.19, No.2, pp.263-311, 1993.
  4. 신중호, 한국어/영어 병렬 코퍼스에 대한 단어단위 및 구단위 정렬 모델, 한국과학기술원 석사학위 논문, 1996.
  5. G. Salton, Automatic text processing, Addison-Wesley, 1988.
  6. 박영찬, 정보검색을 위한 단어지식의 통계적 구축, 한국과학기술원 박사학위 논문, 1997.
  7. 심광섭, “음절간 상호정보를 이용한 한국어 자동띄어쓰기”, 정보과학회 논문지(B), 제23권, 제9호, pp.991-1000, 1996.
  8. 신중호, 박혁로, “음절단위 bigram정보를 이용한 한국어 단어인식모델”, 한글 및 한국어 정보처리학술발표 논문집, pp.255-260, 1997.
  9. 최재혁, “양방향 최장일치법을 이용한 한국어 띄어쓰기 자동 교정 시스템”, 한글 및 한국어 정보처리 학술발표 논문집, pp.145-151, 1997.
  10. 강승식, “한글 문장의 자동 띄어쓰기를 위한 어절 블록 양방향 알고리즘”, 정보과학회 논문지, 소프트웨어 및 응용, 제7권, 제4호, pp.441-447, 2000.
  11. 이도길, 이상주, 임희석, 임해창, “한글 문장의 자동 띄어쓰기를 위한 두 가지 통계적 모델”, 정보과학회 논문지, 소프트웨어 및 응용, 제30권, 제4호, pp.358-371, 2003.
  12. 조진현, 김일환, 이현희, 이영제, 강범모, “형태분석 말뭉치 구축을 위한 합성어의 처리 방법 - 띄어쓰기를 고려하여 -”, 한글 및 한국어 정보처리 학술발표 논문집, pp.9-13, 2002.
  13. 국립국어원, “한국어 학습 자료,” 국립국어원 홈페이지 공개자료실 http://www.korean.go.kr, 2003.
  14. 국립국어원, 세종계획 연구교육용 균형말뭉치, 2004.
  15. http://nlp.kookmin.ac.kr/.
  16. C. Manning and H. Schutze, “Foundations of Statistical Natural Language Processing,”pp.268-269, The MIT Press, 1999.