DOI QR코드

DOI QR Code

입말 표기를 이용한 영어 단어 검색

Retrieving English Words with a Spoken Work Transliteration

  • 김지승 (숭실대학교 정보과학대학 컴퓨터학과) ;
  • 김광현 (숭실대학교 정보과학대학 컴퓨터학과) ;
  • 이준호 (숭실대학교 정보과학대학 컴퓨터학과)
  • 발행 : 2005.09.01

초록

영어 사전 검색 서비스 이용자들은 원하는 영어 단어의 철자를 정확하게 기억하지 못하고, 발음만을 기억하는 경우가 있다. 이러한 이용자들에게 도움을 주기 위해 본 연구에서는 입말 표기, 즉 영어 단어 발음의 한글 표기를 이용하여 영어 단어를 효과적으로 검색할 수 있는 방법을 제안한다. 이를 위하여 코닉스(KONIX) 코드를 개발하며, 입말 표기와 영어 단어를 코닉스 코드들로 변환한다. 그리고 변환된 코닉스 코드들 사이의 음성적 유사도를 편집 거리 방법과 2-그램 방법을 이용하여 계산한다. 또한 제안한 방법이 입말 표기에 의한 영어 단어 검색에 매우 효과적임을 실험을 통하여 입증한다.

Users of searching Internet English dictionary sometimes do not know the correct spelling of the word in mind, but remember only its pronunciation. In order to help these users, we propose a method to retrieve English words effectively with a spoken word transliteration that is a Korean transliteration of English word pronunciation. We develop KONIX codes and transform a spoken word transliteration and English words into them. We then calculate the phonetic similarity between KONIX codes using edit distance and 2-gram methods. Experimental results show that the proposed method is very effective for retrieving English words with a spoken word transliteration.

키워드

참고문헌

  1. 강병주, 최기선. 1990. 외국어 음차 표기의 음성적 유사도 비교 알고리즘. '정보과학회 논문지(B)', 26(10): 1237-1246
  2. Damerau, F. 1964. 'A technique for com- puter detection and correction of spel- ling errors.' Communications of the ACM, 7: 171-176
  3. Fox, E. and Shaw, J. 1993. 'Combination of Multiple searches.' In Harman, D., editor, Proc TREC, pages 35-44, Washington. National Institute of Standards and Technology Special Publication, 500-215
  4. Gadd, T.. 1988. ''Fisching fore werds'. Pho- netic retrieval of written text in infor- mation retrieval systems.' Program, 22(3): 222-237 https://doi.org/10.1108/eb046999
  5. Gadd, T. 1990. 'PHONIX: The algorithm.' Program, 22(4): 363-366
  6. Hall, P. and Dowling, G. 1980. 'Approximate string matching.' Computing Surveys, 12(4): 381-402 https://doi.org/10.1145/356827.356830
  7. Lee, J. 1995. 'Combining Multiple Evidence from Different Properties of Weighting Schemes,' ACM SIGIR Conference on Research and Development in Information Retrieval, Seattle, USA, 180-188
  8. Lee, J., Cho, h. and Park, H. 1999. 'N-Gram- Based Indexing for Korean Text Retrieval,' Information Processing & Management, 35(4): 427-441 https://doi.org/10.1016/S0306-4573(98)00050-8
  9. Pfeifer, U., Poersch, T., and Fuhr, N. 1996. 'Retrieval effectiveness of proper name search methods.' Information Processing & Management, 32(6): 667-679 https://doi.org/10.1016/S0306-4573(96)00042-8
  10. Pollock, J., and Zamora, A.. 1984. 'Automatic spelling correction in scientific and scholarly text.' Communications of the ACM, 27(4): 358-368 https://doi.org/10.1145/358027.358048
  11. Ukkonen, E. 1992. 'Approximate string- matching with q-grams and maximal matches.' Theoretical Computer Sci- ence, 191-211
  12. Voorhees, Ellen M. and Tice, D. 2000. 'The TREC-8 Question Answering Track Evaluation.' In Text Retrieval Con- ference TREC-8
  13. Zamora, E., Pollock, J., and Zamora, A. 1981. 'The use of trigram analysis for spelling error detection.' Information Processing and Management, 17(6): 305-316 https://doi.org/10.1016/0306-4573(81)90044-3
  14. Zobel, J., and Dart, P. 1995. 'Finding Ap- proximate Matche in Large Lexicons.' Software-Practice and Experience, 25(3): 331-345 https://doi.org/10.1002/spe.4380250307
  15. Zobel, J., and Dart, P. 1996. 'Phonetic string matching: Lessons from information retrieval.' In Proceedings of ACM SIGIR Conference on Information Retrieval, Zurich, Switzerland, 166-172

피인용 문헌

  1. Transliteration Correction Method using Korean Alphabet Viable Prefix vol.18B, pp.2, 2011, https://doi.org/10.3745/KIPSTB.2011.18B.2.087