Recognition Of Chinese Named-Entity Using Support Vector Machine

SVM을 이용한 중국어 개체명 식별

  • Jin, Feng (Dept. of Graduate School for Information Technology, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Na, Seung-Hoon (Dept. of Computer Science& Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Kang, In-Su (Dept. of Computer Science& Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Li, Jin-Ji (Dept. of Computer Science& Engineering, POSTECH, Advanced Information Technology Research Center(AITrc)) ;
  • Kim, Dong-Il (Language Engineering Institute, YUST, Advanced Information Technology Research Center(AITrc)) ;
  • Lee, Jong-Hyeok (Dept. of Computer Science& Engineering, POSTECH. Advanced Information Technology Research Center(AITrc))
  • 김풍 (포항공대 정보통신대학원 정보처리학과 첨단정보기술 연구센터) ;
  • 나승훈 (포항공대 컴퓨터공학과 첨단정보기술 연구센터) ;
  • 강인수 (포항공대 컴퓨터공학과 첨단정보기술 연구센터) ;
  • 리금희 (포항공대 컴퓨터공학과 첨단정보기술 연구센터) ;
  • 김동일 (중국연변과학기술대학 언어공학연구소 첨단정보기술 연구센터) ;
  • 이종혁 (포항공대 컴퓨터공학과 첨단정보기술 연구센터)
  • Published : 2004.04.01

Abstract

본문에서는 최근 들어 각광을 받고 있는 패턴인식 방법론인 Support Vector Machine을 이용하여 중국어 개체명을 식별하는 방법을 제안하고자 한다. SVM(support vector machine)은 입력 자질이 많을 경우에도 안정적인 성능을 나타내고 보편적으로 적용할 수 있는 모델을 개발할 수 있는 장점이 있다. 실험에서 어휘. 품사, 의미부류 등 많은 수의 자질을 이용하였다. 실험결과는 본문에서 제안한 방법이 튜닝을 거치지 않아도 좋은 성능을 나타낼 수 있고, 수행 속도도 만족스럽다는 것을 보여주었다.

Keywords