DOI QR코드

DOI QR Code

형태소 분석기의 어휘적 중의성 해결에 관한 연구

A Study on Lexical Ambiguity Resolution of Korean Morphological Analyzer

  • 박용욱 (울산과학대학교 컴퓨터정보학부)
  • 투고 : 2012.06.22
  • 심사 : 2012.08.09
  • 발행 : 2012.08.31

초록

한 어절을 중심으로 검사가 이루어지는 맞춤법 검사는 문맥상 어울리지 않는 단어로 인하여 생기는 오류는 찾기 어렵다. 맞춤법 검사기는 현재 어절 단위로 오류 여부를 판단하는 것이기 때문에 어휘적 중의성을 고려하지 않아도 된다. 그러나 문법 검사기는 문장 분석을 해야 하므로 어휘적 중의성을 제거하지 않고는 정확한 검사가 어렵다. 본 논문에서는 어휘적 중의성을 해결하기 위하여 몇 가지 규칙을 만들고 이를 활용하여 문장에 존재하는 어휘적 중의성을 해결할 수 있는 방법을 보인다. 또한 실험을 통하여 그 결과를 분석하였다.

It is not easy to find out syntactic error in a spelling checker systems of Korean, because the spelling checker is generally to correct each phrase and it cannot check the errors of contextual ill-matched words. Spelling checker system tests errors based on a words. Disambiguation of lexical ambiguities is important in natural language processing. Its outputs is used in syntactic analysis. For accurate analysis of a sentence, syntactic analysis system must find out the ambiguity of morphemes in a word. In this paper, we suggest several rules to resolve the ambiguities of morphemes in a word. Using these methods, we can reduce many lexical ambiguities in Korean.

키워드

참고문헌

  1. 남기심, 고영근, "표준 국어 문법론", (주)탑출판사, 2009.
  2. 강승식, 김영택, "사전 정보에 기반한 효율적인 한국어 형태소 분석기의 설계 및 구현", 한국정보과학회 봄학술발표논문집, 18권, 1호, pp. 529-532, 1991.
  3. 김영택, 권혁철, 옥철영, 서영훈, 이호석, 이근배, 윤덕호, 문유진, 강승식, 이하규, 심광섭, 윤성희, 서병략, 이재원, 장병탁, 양재형, 양승현, 김성동, 김유섭, 이종우, 오장민, 박성배, 장정호, 황규백, 신형주 공저, "자연언어처리", 생능출판사, 2001.
  4. 조재현, 양황규 "컬러 정보 및 형태학적 특징과 신경망을 이용한 차량번호판 인식", 한국전자통신학회논문지, 5권, 3호, pp. 304-308, 2010.
  5. 한길, "우리말의 융합 형태소와 형태소 중복현상", 강원대학교 인문과학연구소, 인문과학연구, 15집 pp. 55-84, 2006.
  6. 심광섭, "MADE : 형태소 분석기 개발환경", 한국인터넷정보학회, 인터넷정보학회논문지, 8권, 4호 pp. 159-171, 2007.
  7. 조재현, "자동번호판 이진화를 위한 개선된 퍼지 이진화 방법", 한국전자통신학회논문지, 6권 2호, pp. 231-235, 2011.
  8. 박용욱, "의존문법 기반의 구간 분할법을 황용한 한국어 구문분석기", 한국해양정보통신확회 논문지, 13권, 8호, pp. 1705-1711, 2009.
  9. 김분희, "메뉴와 쇼셜 네트워크 공동구매 정보 도시제공 P2P 시스템", 한국전자통신학회논문지, 6권, 3호, pp. 445-449, 2011.