Unregistered Human Names Recognition and Sex Distinction

미등록 이름 명사 인식 밑 성별 구분

  • 강유환 (충북대학교 컴퓨터공학과) ;
  • 고병일 (충북대학교 컴퓨터공학) ;
  • 서영훈 (충북대학교 컴퓨터공학과)
  • Published : 2004.04.01

Abstract

본 논문은 사람 이름의 특성을 이용한 이름 인식과 이름의 성별 구분 방법에 대해 제안한다 사랑 이름을 묻는 질의문은 질의-응답 시스템에서 자주 나타난다. 모든 사람 이름을 사전에 등록하는 것은 어렵다. 경우에 따라서는 남녀 이름을 구분할 필요가 있다. 한국 사람 이름의 특성은 주로 3음절로 이루어져 있고. 성씨로 사용되는 음절의 수가 제한적이라는 것이다. 또한 이름에는 한자 독음이 많이 쓰이고, 남자 이름으로 자주 쓰이는 음절과 절자 이름으로 자주 쓰이는 음절이 있다. 이러한 특성을 이용하여 사람 이름 인식과 성별 구분을 수행한다. 일반 웹 문서에서의 실험 결과, 이름 인식의 정확률은 94%를 보였고, 남녀 이름 구분의 정확률은 98%를 보였다.

Keywords