A Hangul Script Matching Algorithm for PDA

PDA상에서의 한글 필기체 매칭 알고리즘

  • 조미경 (동명정보대학교 정보공학부) ;
  • 조환규 (부산대학교 전기전자정보컴퓨터공학부)
  • Published : 2002.10.01

Abstract

Electronic Ink is a stored data in the form of the handwritten text or the script without converting it into ASCII by handwritten recognition on the pen-based computers and Personal Digital Assistants(PDAs) for supporting natural and convenient data input. One of the most Important issue is to search the electronic ink in order to use it. We proposed and implemented a script matching algorithm for the electronic ink. Proposed matching algorithm separated the input stroke into a set of primitive stroke using the curvature of the stroke curve. After determining the type of separated strokes, it produced a stroke feature vector. And then it calculated the distance between the stroke feature vector of input strokes and one of strokes in the database using the dynamic programming technique. We did various experiments and our algorithm showed high matching rate over 97.7% for only the Korean script and 94% for the data mixed Korean with the Chinese character.

전자 잉크 데이터는 펜 기반 컴퓨터나 PDA(Personal Digital Assistants)등에서 자연스럽고 편리한 데이터 입력을 제공하기 위해 펜으로 입력한 데이터를 온라인 문자 인식기를 이용하여 아스키 문자로 변환하지 않고 스크립트 형태로 저장하는 데이터를 말한다. 전자 잉크 데이터를 사용하기 위해 가장 중요한 것 중 하나는 전자 잉크 데이터의 검색 문제이다. 본 연구에서는 전자 잉크 데이터를 획 특징 벡터 형태로 저장하고, 이를 이용해서 잉크 데이터를 검색하는 매칭 알고리즘을 제안하고 구현하였다. 제안된 매칭 알고리즘은 입력된 데이터를 곡률(curvature)을 이용하여 기본획(primitive stroke)으로 분리하고 기본획의 종류를 결정한 다음 획 특징 벡터를 생성한다. 그리고 동적 프로그래밍 기법에 의해 획 특징 벡터의 거리값을 계산한다. 제안된 매칭 알고리즘을 이용하여 다양한 실험을 하였으며 한글 스크립트로 구성된 경우 97.7%이상의 매칭률을 보여 주었고 한글 및 한자 흔합 스크립트에서는 94%이상의 매칭률을 보여 주였다.

Keywords

References

  1. W. Aref, D. Barbara, D. Lopresti, and A. Tomkins, 'Ink as a first-class datatype in mulitmedia databases,' Multimedia Database, Springer-Verlag, 1995
  2. Walid G. Aref, Ibrahim Kamel, and Daniel P. Lopresti, 'On Handing Electronic Ink,' ACM Computing Surveys, Vol. 27, No. 4, pp. 564-567, 1995 https://doi.org/10.1145/234782.234791
  3. Lopresti, D. Snd Tomkins, A., 'On the searchability of electronic ink,' In Proceedings of the International Workshop Front. in Handwriting Recognition, pp. 156-165, 1994
  4. D.P. Lopresti and A. Tomkins, 'Approximate matching of hand-drawn pictogram,' In Proceeding of the Third International Workshop on Frontiers in Handwriting Recogntion, pp. 102-111, 1993
  5. Walid Aref and Daniel Barbara, 'Supporting Electronic Ink Database,' Information Systems, Vol. 24, No. 4, pp. 303-326, 1999 https://doi.org/10.1016/S0306-4379(99)00020-4
  6. Ibrahim Kamel and Damjel Barara, 'Retrieving Electronic Ink by Content,' IEEE Proceedings of International Workshop on Multimedia Database Management Systems, pp. 54-61, 1996 https://doi.org/10.1109/MMDBMS.1996.541854
  7. 마이크로소프트웨어 매거진 2001년 4월호
  8. 권오성, 권영빈, '스트링 정합 방법에 기반한 온라인 자소 인식,' 한국정보과학회 논문지 제21권 제5호, pp.750-755, 1994
  9. 신봉기, 김진형, '은닉 마르코프 모델 네트워크에 의한 온라인 흘림 필기 한글 인식,' 한국정보과학회 논문지 제21권 제9호, pp.1737-1745, 1994
  10. Hang Joon Kim, Pyeoung Kee Kim, 'On-line recognition of cursive Korean characters using set of extended primitive strokes and fuzzy functions,' Pattern Recognition Letters, Vol. 17, pp.19-28, 1995 https://doi.org/10.1016/0167-8655(95)00087-9
  11. Sara Baase, 'Computer Algorithm, pp.232-247, Addison-Wesley Publishing Company, 1989