의학용 영어 품사 태거 구현

Implementation of an English POS Tagger for Medical

  • 이현구 (강원대학교 컴퓨터정보통신공학과) ;
  • 안혁주 (강원대학교 컴퓨터정보통신공학과) ;
  • 김학수 (강원대학교 컴퓨터정보통신공학과)
  • Lee, Hyeon-Gu (Kangwon National University Computer and Communication Engineering) ;
  • Ahn, HyeokJu (Kangwon National University Computer and Communication Engineering) ;
  • Kim, HarkSoo (Kangwon National University Computer and Communication Engineering)
  • 발행 : 2015.10.17

초록

자연어처리의 여러 분야에서 기본요소로 사용되는 영어 품사 태거를 UMLS의 의학용어 어휘정보와 OANC(Open American National Corpus) 말뭉치를 이용해 의학용 문서도 분석 가능한 의학용 영어 품사 태거를 제안한다. TRIE구조를 이용한 단어 묶음 모델로 여러 어절의 의학용어를 하나로 묶고 HMM(Hiden Markov Model)을 이용한 품사 태거로 해당하는 품사를 부착한다.

키워드