Agent-based Investigation of Business Information from Internet Shopping Malls

에이전트 기반의 인터넷쇼핑몰 사업자신원정보 조사

  • 성낙현 (용인대학교 컴퓨터정보학부)
  • Published : 2004.06.30

Abstract

In Korea, The Consumer Protection Law in Electronic Commerce, which came into effect in July 2002, forced internet shopping malls to provide a minimum of 7 forms of business information, including the name of the business, the name of the representative, geographical address, telephone number, fax number, e-mail address, and business license number, so that consumers could easily identify them. To investigate the shopping malls which do not provide their business information, can lead to confidence in the electronic commerce environment. To investigate the completeness of the business information with the internet shopping malls, this paper proposes the methods of gathering URLs of internet shopping malls, of extracting business information attributes, and an architecture of the agent system. Information extraction in our research is based on synonyms and indicator words of the attributes. With the experiment we showed that the accuracy of our agent system to find out the right business information is 89.3%.

국내에서는 2002년 7월부터 '전자상거래 등에서의 소비자보호에 관한 법률'에 의해, 인터넷쇼핑몰 운영자가 자신의 신원정보를 표시하는 것을 의무화하고 있다. 이러한 사업자신원정보의 속성(Attribute)에는 상호, 대표자 성명, 사업자등록번호, 사업장주소, 전화번호, 팩스번호, 전자메일주소 등이 있다. 신원정보를 밝히지 않는 사이트를 조사하여 기재를 권유하는 일은 전자상거래의 신뢰도를 높이는 데에 기여할 것이다. 본 연구에서는 인터넷쇼핑몰 사업자신원정보의 기재여부를 조사하기 위해, 조사대상으로서의 인터넷쇼핑몰의 URL을 수집하는 방법, 신원정보 속성을 추출하는 방법, 그리고 신원정보 조사에이전트시스템의 구조를 제시한다. 본 연구에서 정보의 추출은 속성명의 동의어와 속성값의 지시어를 이용한다. 연구의 유용성을 보이기 위해 신원정보 추출의 정확도가 89.3%인 조사에이전트의 실험결과를 제시한다.

Keywords

References

  1. 강성진, 'OECD 전자상거래 소비자보호 가이드라인의 내용과 과제', 한국소비자보호원, 1999. 12
  2. 공정거래위원회, '인터넷쇼핑몰 현황조사 및 부당한 광고행위에 대한 직권조사 실시결과.', 2000. 10
  3. 통계청, '2002년 11월 사이버쇼핑몰 통계조사 결과', 2003. 1
  4. 한국소비자보호원, '전자상거래 소비자피해 백서', 2002. 12
  5. 한국인터넷정보센터, '인터넷 이용자수 및 이용행태 조사', 2003. 1
  6. Ashish, N. and Knoblock, C. A., 'Semi-automatic Wrapper Generation for Internet Information Sources,' In Proceedings of the International Conference on Cooperative Information Systems(Coopis-97), Charleston, South Carolina, 1997
  7. Atzeni, P. and Mecca, G., 'Cut and Paste,' In Proceedings of the 17th ACM SIGACT-SIGMOD-SIGART symposium on principles of database systems(PODS-97), Tucson, Arizona, 1997, pp. 114-153
  8. Doorenbos, R. B., Etzioni, O. and Weld, D. S., 'A Scalable Comparison-Shopping Agent for the World-Wide Web,' In Proceedings of the First International Conference on Autonomous Agents, ACM Press, New York, NY, 1997, pp.39-48
  9. Douglis, F. and Ball, T., 'Tracking and Viewing Changes on the Web,' In Proceedings of the USENIX Technical Conference, San Diego, Jan. 1996, pp.165-176
  10. Hammer, J., Garcia-Molina, H., Cho, J., Aranha, R. and Crespo, A., 'Extracting Semistructured Information from the Web,' In Proceedings of the Workshop on Management of Semi-Structured Data, Tucson, Arizona, 1997
  11. Hsu, C. -N. and Dung, M. -T., 'Generating Finite-State Transducers for Semi-Structured Data Extraction from the Web,' Information Systems, Vol. 23, No. 8, 1998, pp.521-538 https://doi.org/10.1016/S0306-4379(98)00027-1
  12. Hsu, J. Y. -J. and Yih, W. -T., 'Template-based Information Mining from HTML Documents,' In Proceedings of the Fourteenth National Conference on Artificial Intelligence(AAAI-97), AAAI Press, Menlo Park, CA, 1997, pp.256-262
  13. Kushmerick, N., Wrapper Induction for Information Extraction, Ph.D. Thesis, Department of Computer Science and Engineering, University of Washington, Seatle, WA, 1997
  14. Muslea, I., Minton, S. and Knoblock, C. A., 'STALKER: Learning Extraction Rules for Semistructured, Web-based Information Sources,' In Proceedings of AAAI-98 Workshop on AI and Information Integration, Technical Report WS-98-01, AAAI Press, Menlo Park, CA, 1998
  15. Smith, D. and Lopez, M., 'Information Extracting for Semistructured Document,' In Proceedings of the Workshop on Management of Semi-Structured Data, Tucson, AZ, 1997