A Point-Of-Interest Allomorph Database Construction System

POI 이형태 데이타베이스 구축 시스템

  • 양승원 (우석대학교 게임콘텐츠학과) ;
  • 이현영 (전북대학교 컴퓨터학과) ;
  • 왕지현 (한국전자통신연구원 음성언어실)
  • Published : 2009.03.15

Abstract

People use various information for searching POI in the navigation system such as name, category, address, phone number. Most of users use name and category to search their POT. They don't know exact name in POI DB provided by Maker. They use abbreviated or generalized name as key word for searching POI. Because of these reasons, the hit ratio has been very low. In this paper, We suggest a extra DB_construction system for raising the hit ratio. It generates allomorphes DB link to the POI name in original DB. We classified the POI names in original DB into seven types of allomorph by analyzing the gathered patterns from the POI DB which has over 650,000 entries. For auto_generating the allomorphes, we made 577 rules based on the classified types. And we generated the allomorphes manually for the entries which are difficult to make the rule and has low frequency The generated allomorphes account for 35.8% of all original DB. The hit ratio is 89% under suggested system.

내비게이션 시스템에서 목적지를 찾기 위하여 목적지의 이름, 분류, 주소, 전화번호 등의 정보를 이용하게 되는데 대부분의 사용자들은 이들 중에서 목적지의 이름을 사용한다. 그런데 사용자들은 공급사에서 제공하는 POI DB에 등재된 이름을 정확히 알지 못할 뿐만 아니라 편의상 축약된 명칭이나 일반적으로 불리어지는 명칭 등으로 POI 검색을 시도하므로 검색이 실패하는 경우가 빈번하다. 본 논문에서는 내비게이션 시스템에서 이름으로 검색 할 때 검색 성공률을 제고할 수 있는 이형태 DB 구축 시스템을 제안한다. 이 시스템은 원 DB의 POI 명과 연결되는 이형태를 생성하여 DB화한다. 우리는 이형태의 생성을 위하여 약 650,000 개의 개체를 가지고 있는 원 DB의 POI 명으로부터 모은 패턴을 분석하여 이형태의 유형을 7 가지로 분류하였다 분류한 유형을 토대로 일정한 패턴이 존재하여 자동화가 가능한 유형들에 대하여 577개의 규칙을 만들어 자동으로 이형태를 구축하였다. 규칙으로 만들기가 어렵거나 빈도수가 적은 개체들에 대해서는 수동으로 이형태를 구축하였다. 생성된 비율은 전체 POI DB의 35.8%에 해당하며 구축한 이형태 DB를 사용한 검색 성공률은 89%이었다.

Keywords

References

  1. 박용진, 김흠, 한원희, 서세광, 송은하, 한성국, 정영식, '계층적 POI 정보 가시화를 위한 GVP 개발', 한국정보과학회, 2007 한국컴퓨터종합학술대회 논문집 제34 권 제1호(B), pp. 390-395, 2007. 6
  2. 김대식, 김형진, 손봉수, 유완, '생활지리정보 검색 및 안내를 위한 POI의 구축 및 활용', 한국콘텐츠학회/한국통신학회, 2003 추계 종합학술대회 논문집 제1권 제2호, pp. 423-430, 2003. 11
  3. 이정은, 신성현, 황현숙, 정신일, 김창수, '생활지리정보시스템의 PoI기반 정보등록 서비스 모델', 한국콘텐츠학회, 2007 춘계 종합학술대회 논문집 제5권 제1호, pp. 16-20, 2007. 6
  4. Yeo-Chan YOON,So-Young PARK, Young-In SONG, Hae-Chang RIM and Dae-Woong RHEE, 'Automatic Acronym Dictionary Construction based on Acronym Generation Types,' IEICE TRANS, INF & SYAT., 2007 https://doi.org/10.1093/ietisy/e91-d.5.1584
  5. Yan Qu, Gregory Grefenstette, 'Finding Ideographic Representation of Japanese Name Written in Latin Script via Language and Corpus Validation,' ACL 2004
  6. 아이스테이션 v43 Navi, http://www.i-station.co.kr/
  7. 아이나비, http://www.inavi.com/