DOI QR코드

DOI QR Code

Automatic Product Attribute Extraction from Reviews Using Web Search Engine

상품평 데이터와 웹 검색엔진을 이용한 상품별 평가항목 자동 추출

  • Lee, Woo-Chul (School of Computer & Software Engineering, Kumoh National Institute of Technology) ;
  • Lee, Hyun-Ah (School of Computer & Software Engineering, Kumoh National Institute of Technology)
  • 이우철 (금오공과대학교 컴퓨터공학부) ;
  • 이현아 (금오공과대학교 컴퓨터공학부)
  • Published : 2008.05.16

Abstract

상품평은 인터넷 쇼핑 이용자들의 최종 구매결정에 큰 영향을 미치는 것으로 알려져 있다. 많은 쇼핑몰에서 상품평 활성화를 위해 노력하고 있지만, 상품평을 모으는 것에만 주력할 뿐 기존에 수집된 상품평을 제공하는 방법에 있어서는 원시적인 수준에 그치고 있다. 상품평을 좀 더 효율적으로 제공하려면 사용자들이 상품평에서 찾게 될 평가항목들을 미리 예측하여 그 항목에 따라 상품평을 분류/요약해서 제공하는 방법을 생각할 수 있다. 본 논문에서는 상품평과 웹 검색엔진을 이용하여 각 상품별 평가항목들을 자동으로 추출하는 방법을 제안한다. 상품평 데이터의 특성상 노이즈가 많기 때문에 먼저 데이터를 정제하고, 정제된 상품평 데이터를 형태소 분석하여 후보명사들을 선택한다. 선택된 후보명사를 웹 검색엔진에 질의하여 반환된 결과 값으로 상품 카테고리와 후보명사 간 연관도를 계산하여 평가항목을 추출한다. 실험은 5개 상품 카테고리의 170,294개 실제 상품평을 대상으로 각 카테고리별 평가항목을 추출하였다.

Keywords