Multilingual Product Retrieval Agent through Semantic Web and Semantic Networks

Semantic Web과 Semantic Network을 활용한 다국어 상품검색 에이전트

  • Moon Yoo-Jin (Dept. of MIS, Hankuk University of Foreign Studies University of Seoul)
  • 문유진 (한국외국어대학교 경영정보학과)
  • Published : 2004.11.01

Abstract

This paper presents a method for the multilingual product retrieval agent through XML and the semantic networks in e-commerce. Retrieval for products is an important process, since it represents interfaces of the customer contact to the e-commerce. Keyword-based retrieval is efficient as long as the product information is structured and organized. But when the product information is expressed across many online shopping malls, especially when it is expressed in different languages with cultural backgrounds, buyers' product retrieval needs language translation with ambiguities resolved in a specific context. This paper presents a RDF modeling case that resolves semantic problems in the representation of product information and across the boundaries of language domains. With adoption of UNSPSC code system, this paper designs and implements an architecture for the multilingual product retrieval agents. The architecture is based on the central repository model of product catalog management with distributed updating processes. It also includes the perspectives of buyers and suppliers. And the consistency and version management of product information are controlled by UNSPSC code system. The multilingual product names are resolved by semantic networks, thesaurus and ontology dictionary for product names.

상품검색은 고객들이 전자상거래의 접촉을 시작하는 인터페이스로서 매우 중요한 프로세스이다. 또한 전자상거래는 고객들에게 검색 시 쉽게 접근할 수 있는 프로세스를 제공하여야 한다. 특히 World Wide Web에서 상품정보는 광범위한 고객들이 신속하게 팽창하는 정보를 추적하기 위해서 통합과 표준화가 이뤄져야 한다. 상품 카탈로그(catalogue)에 대한 국제 표준화가 다양한 분야와 업종에서 구축되어져 왔는데, 요즈음은 UNSPSC((Universal Standard Products and Services Classification) 코드로의 수렴에 대한 논의가 활발해지고 있다. 이 표준을 채택하여 이 논문은 다국어상품검색 에이전트의 아키텍쳐(architecture)를 설계한다. 이 아키텍쳐는 중앙등록기 모델의 상품 카탈로그 관리를 기반으로 하여 분산처리의 update프로세스를 채택한다. 또한 이 아키텍쳐는 구매자 관점과 공급자 관점을 모두 고려한다. 상품정보의 일관성과 버전 관리는 UNSPSC코드 시스템에 의하여 제어된다. 고객이 사용하기 편리하도록 표준화에 포함되어져 있지 않은 상품명과 다국어 상품명은 Semantic Network, 시소러스(thesaurus)와 Semantic Web의 상품명 온톨로지 등을 활용하여 해결한다. 이를 위한 알고리즘들을 설계하고 또한 구현한다.

Keywords