A Study on Effectively Detecting and Correcting POS-Tagged Errors

효율적인 품사부착 오류 검출 및 수정에 관한 연구

  • 최명길 (한국해양대학교, 자연언어처리연구실) ;
  • 서형원 (한국해양대학교, 자연언어처리연구실) ;
  • 남유림 (한국해양대학교, 자연언어처리연구실) ;
  • 권홍석 (한국해양대학교, 자연언어처리연구실) ;
  • 김재훈 (한국해양대학교, 자연언어처리연구실)
  • Published : 2012.10.06

Abstract

본 논문에서는 세종형태분석 말뭉치에 포함되어 있는 오류를 효율적으로 수정하기 위하여 오류 수정도구를 개발하였다. 세종형태분석 말뭉치에서 오류를 검출하기 위하여 형태소 생성과 자동 띄어쓰기 방법을 이용하였다. 검출된 오류를 수정하기 위하여 철자 오류 수정, 형태소 삭제 수정, 형태소 삽입 수정, 어절 재분석 방법을 사용하였다. 또한 최대한 반복적인 작업은 수행하지 않도록 설계하였다. 구현된 오류 수정 도구를 통하여 세종형태분석 말뭉치를 수정하였을 경우 텍스트 파일 형태의 말뭉치에서 오류를 수정하는 것보다 최소 9배 이상 빠른 작업이 가능하였으며, 사용자가 오류 수정 작업을 진행할수록 수정 속도가 빨라짐을 실험을 통해서 알 수 있었다.

Keywords