A Study of Development for Korean Phonotactic Probability Calculator

한국어 음소결합확률 계산기 개발연구

  • 이찬종 (강원대학교 인문과학연구소) ;
  • 이현복 (서울대학교 언어학과) ;
  • 최훈영 (강원대학교 컴퓨터과학과)
  • Published : 2009.04.30

Abstract

This paper is to develop the Korean Phonotactic Probability Calculator (KPPC) that anticipates the phonotactic probability in Korean. KPPC calculates the positional segment frequecncy, position-specific biphone frequency and position-specific triphone frequency. And KPPC also calculates the Neighborhood Density that is the number of words that sound similar to a target word. The Phonotactic Calculator that was developed in University of Kansas can be analyzed by the computer-readable phonemic transcription. This can calculate positional frequency and position-specific biphone frequency that were derived from 20,000 dictionary words. But KPPC calculates positional frequency, positional biphone frequency, positional triphone frequency and neighborhood density. KPPC can calculate by korean alphabet or computer-readable phonemic transcription. This KPPC can anticipate high phonotactic probability, low phonotactic probability, high neighborhood density and low neighborhood density.

본 연구는 현대 한국어 단어의 말소리가 결합하는 음소결합확률 (Phonotactic Probability)을 예측하는 계산기 엔진 개발에 관한 연구이다. 한국어 음소결합확률계산기 (이하, KPPC)는 첫째로, 한국어의 주어진 단어에서의 음소와 그 음소의 음소결합의 빈도를 예측하여 말소리가 단어내의 특정위치에서 특정 분절음이 나타나는 빈도 값, 두 음소간의 결합의 빈도값, 그리고 세 음소간의 결합의 빈도 출현률을 예측하여 계산한다. 둘째로 한국어의 주어진 단어에서 말소리 하나만 다르면서 실제로 존재할 수 있는 근접밀도 (neighborhood density)의 값을 계산한다. University of Kansas에서 개발된 음소결합계산기는 영어 20,000단어의 D/B를 대상으로 위치별 분절음빈도와 두 음소간의 음소결합률 빈도를 컴퓨터가 읽을 수 있는 발음기호를 통해서만 가능하다. 본 연구에서는 분절음빈도와 두 음소간의 빈도뿐만 아니라 세 음소간의 결합률 빈도와 근접밀도율을 예측할 수 있고 입력할 때 발음기호뿐만 아니라 단어를 입력하면 확률값을 얻을 수 있다. 이 엔진은 67,284단어의 한국어 표준발음을 D/B로 구축하여 고빈도 음소결합확률, 저빈도 음소결합확률, 고빈도 근접밀도, 저빈도 근접밀도의 값을 예측할 수 있다.

Keywords

References

  1. M. S. Vitevitch and P. A. Luce, "A Web-based interface to calculate phonotactic probability for words and nonwords in English," Behavior Research Method, Instruments, and Com-puters, vol. 36, no. 3, pp. 481-487, 2004 https://doi.org/10.3758/BF03195594
  2. http://www.bncdnet.ku.edu/cgi-bin/DEEC/post_ppc.vi
  3. 이현복. 한국어 표준발음사전, 서울대학교출판부. 서울, 2003
  4. H. L. Storkel, “Learning new words: Phonotactic probability in language development”, Journal of Speech, Language, and Hearing Research, vol. 44, no. 6, pp. 1321-1337, 2001 https://doi.org/10.1044/1092-4388(2001/103)
  5. H. L. Storkel, Learning New Words II: Phonotactic Probability in Verb Learning, Journal of Speech, Language and Hearing Research, vol. 46, no. 6, pp. 1312-1323, 2003 https://doi.org/10.1044/1092-4388(2003/102)
  6. H. L. Storkel, J. Armbruster and T. P. Hogan, Differentiating Phonotactic Probablity and Neighborhood Density in Adult Word Learing, Journal of Speech, Language, and Hearing Research, vol. 49, no. 6, pp. 1175-1192, 2006 https://doi.org/10.1044/1092-4388(2006/085)
  7. M. S. Vitevitch and P. A. Luce, Increases in phonotactic probability facilitate spoken nonword repetition, Journal of Memory & Language, vol. 52, pp. 193-204, 2005 https://doi.org/10.1016/j.jml.2004.10.003