DOI QR코드

DOI QR Code

A minimal pair searching tool based on dictionary

사전 기반 최소대립쌍 검색 도구

  • Kim, Tae-Hoon (Dept. of Computer Science, Seokyeong University) ;
  • Lee, Jae-Ho (Dept. of Korean Language and Literature, Korea University) ;
  • Chang, Moon-Soo (Dept. of Computer Science, Seokyeong University)
  • 김태훈 (서경대학교 컴퓨터과학과) ;
  • 이재호 (고려대학교 국어국문학과) ;
  • 장문수 (서경대학교 컴퓨터과학과)
  • Received : 2013.09.01
  • Accepted : 2014.04.01
  • Published : 2014.04.25

Abstract

The minimal pairs mean the pairs that have same phonotactics except just one sound in the sequences cause different lexical items. This paper proposes the searching tool of minimal pairs for efficiency of phonological researches with minimal pairs. We suggest a guide to develop Korean minimal pair searching programs by comparing to other programs. Proposing tool has user-friendly interface, minimizing key inputs, for linguistics who are not fluent in computer programs. And it serves the function which classifies the words in dictionary for the detailed researches. And for efficiency, it increases speed of dictionary loading by separating syllables through Unicode analysis, and optimizes dictionary structure for searching efficiency. The searching algorithm gains in speed by hashing algorithm using syllable counts. In our tool, the speed is improved more than earlier version about 5 times at converting dictionary and about 3 times at searching.

최소대립쌍이란 한 음소의 차이만으로 다른 의미를 갖는 단어의 쌍을 말한다. 본 논문은 최소대립쌍을 이용한 국어음운학 연구의 효율성을 위해 최소대립쌍 검색도구를 제안한다. 검색 도구 개발에 앞서 기존 프로그램과 몇 가지 비교 분석을 통해, 개발해야할 한국어 최소대립쌍 검색 도구의 방향을 제시한다. 제안하는 검색도구는 컴퓨터 사용에 익숙하지 않은 국어학자를 위해 키보드 입력을 최소화한 사용자 친화적인 인터페이스를 제시한다. 효율적인 최소대립쌍 연구를 위해 분류 검색 기능을 제공함으로써 더욱 면밀한 최소대립쌍 연구가 가능하도록 한다. 그리고 성능 향상을 위해 유니코드 분석으로 음소를 분리하여 사전 로딩 속도를 향상시키고, 검색의 효율성을 위해 사전 구조를 최적화한다. 검색 알고리즘은 음절 개수를 이용한 해시 탐색으로 검색 속도를 높인다. 제안하는 도구는 초기 버전에 비해 사전 변환 속도는 5배, 검색 속도는 3배 향상되었다.

Keywords

References

  1. Ho-Sung, Jung, "Statistical analysis of Standard Korean Dictionary," New Korean Linguistic Life, Vol. 10 No. 1, pp. 55-72, 2000.
  2. Ji-Young Shin, Speech Sound of Korean, 2011. p79-83.
  3. Bruce Hayes, "Small utility programs for phonology," Available: http://www.linguistics.ucla.edu/people/hayes/UtilityPrograms/, 2011, [Accessed: December 10, 2013]
  4. Tae-Jin Kang, "How should we revise new Hangul code?; The standard Hangul code should be Johab code," Korean Linguistic life, Vol. 21, No. 2, pp. 116-123, 1990.
  5. Jong-Hoon Kim, Operation principles of computer, 2004. p33.
  6. Soon-Bum Lim, Wu-Jin Sim, Yong-Je Lee, Dong-Sun Nam, Hyun-Young Kim, and Yong-Ho Lim, "Requirements for Hangul Text Layout and Typography," Available: http://www.w3.org/TR/klreq/korean/#hangulcodes, 2013, [Accessed: December 10, 2013]

Cited by

  1. Comparison Between Optimal Features of Korean and Chinese for Text Classification vol.25, pp.4, 2015, https://doi.org/10.5391/JKIIS.2015.25.4.386