DOI QR코드

DOI QR Code

An Ontology-based Analysis of Wikipedia Usage Data for Measuring degree-of-interest in Country

국가별 관심도 측정을 위한 온톨로지 기반 위키피디아 사용 데이터 분석

  • Kim, Hyon Hee (Dept. of Information and Statistics, Dongduk Women's University) ;
  • Jo, Jinnam (Dept. of Information and Statistics, Dongduk Women's University) ;
  • Kim, Donggeon (Dept. of Information and Statistics, Dongduk Women's University)
  • 김현희 (동덕여자대학교 정보통계학과) ;
  • 조진남 (동덕여자대학교 정보통계학과) ;
  • 김동건 (동덕여자대학교 정보통계학과)
  • Received : 2014.03.07
  • Accepted : 2014.03.27
  • Published : 2014.04.30

Abstract

In this paper, we propose an ontology-based approach to measuring degree-of-interest in country by analyzing wikipedia usage data. First, we developed the degree-of-interest ontology called DOI ontology by extracting concept hierarchies from wikipedia categories. Second, we map the title of frequently edited articles into DOI ontology, and we measure degree-of-interest based on DOI ontology by analyzing wikipedia page views. Finally, we perform chi-square test of independence to figure out if interesting fields are independent or not by country. This approach shows interesting fields are closely related to each country, and provides degree of interests by country timely and flexibly as compared with conventional questionnaire survey analysis.

본 논문에서는 위키피디아 사용 데이터를 분석하여 국가별 관심도를 측정하는 기법을 제시하였다. 먼저 해당 국가에 대한 분야별 관심도를 측정하기 위해서 위키피디아 카테고리로부터 개념 계층 구조를 추출하여 관심도 온톨로지를 구축하였다. 관심도 온톨로지는 국가에 대한 관심 분야를 정치, 경제, 사회, 그리고 문화로 분류하고 각 대분류에 대해 다시 세부 분야으로 분류하였다. 다음으로, 특정 국가의 페이지에서 자주 편집된 기사들의 제목을 관심도 온톨로지에 매핑하여 분야별 페이지 뷰를 분석하였다. 마지막으로 한국, 중국, 그리고 일본에 대한 국가별 관심도를 측정하고 국가별로 위키피디아 사용자들의 관심 분야가 다른지 판별하기 위해서 카이 제곱 독립성 검정을 실시하였다. 실험 결과는 위키피디아 사용자들의 관심 분야가 각 국가와 연관성이 있음을 보여준다. 본 연구는 기존의 설문조사 방식으로 국가 이미지를 측정하는 경우보다 적시에 그리고 유연하게 분야별 관심도를 측정할 수 있는 방안을 제시하며, 위키피디아 사용 데이터 분석 결과를 국가 이미지 개선을 위해 분야별로 재고할 방향을 제시한다.

Keywords

References

  1. R. Pappu, P. Quester, and G. R. W. Cooksey, "Country Image and Consumer-Based Brand Equity: Relationships and Implications for International Marketing." Journal of International Business Studies, Vol. 38, No. 5, pp. 726-745, June, 2007. https://doi.org/10.1057/palgrave.jibs.8400293
  2. S. Anholt, "Anholt Nation Brands Index: How Does the World See America?" Journal of Advertising Research, Vol. 45, No. 3, pp. 296-304, sept. 2005.
  3. M. Ghiassi, J. Skinner and D. Zimbra, "Twitter Brand Sentiment Analysis: A Hybrid System Using n-gram Analysis and Dynamic Artificial Neural Network", Expert Systems with Applications, Vol. 40, pp. 6266-2686, Nov. 2013. https://doi.org/10.1016/j.eswa.2013.05.057
  4. M. M. Mostafa, "More than Words: Social Networks' Text Mining for Consumer Brand Sentiments", Expert Systems with Applications, Vol. 40, pp. 4241-4251, Aug. 2013. https://doi.org/10.1016/j.eswa.2013.01.019
  5. Wikipedia, http://en.wikipedia.org/
  6. D. A. Aacker, "Managing Brand Equity", The Free Press: New York, Sept. 1991.
  7. T. R. Gruber, "A Translation Approach to Portable Ontology Specifications", Knowledge Acquisition, Vol. 5, No. 2, pp. 199-220, June, 1993. https://doi.org/10.1006/knac.1993.1008
  8. H. H. Kim, "A Tag-based Music Recommendation Using UniTag Ontology", Journal of the Korea Society of Computer and Information, Vol. 17, No. 11, pp. 133-140, Nov. 2012. https://doi.org/10.9708/jksci/2012.17.11.133
  9. W. Wong, W. Liu and M. Bennamoun, "Ontology Learning from Text: A Look Back and into the Future", ACM Computing Surveys, Vol. 44, pp.1-35, Aug. 2012.
  10. F. M. Suchanek, G. Kasneci and G. Weikum, "YAGO: A Core of Semantic Knowledge Unifying WordNet and Wikipedia", In Proc. of World Wide Web Conference, pp. 697-706, Alberta, Canada, May, 2007.
  11. M. Morsey et al., "DBpedia and the Live Extraction of Structured Data fromWikipedia", Electronic Library and Information Systems, Vol. 46, No. 2, pp. 157-181, June, 2012. https://doi.org/10.1108/00330331211221828
  12. S. P. Ponzetto and M. Strube, "Knowledge Derived From Wikipedia For Computing Semantic Relatedness", Journal of Artificial Intelligence Research, Vol. 30, pp. 181-212, Oct. 2007.
  13. H. S. Moat et al., "Quantifying Wikipedia Usage Patterns Before Stock Market Moves", Scientific Reports, Vol. 3, No. 1801, pp. 1-5, May, 2013.
  14. P. Kotler and D. Getner, "Country as brand, product, and beyond: A Place Marketing and Brand Management Perspective", Journal of Brand Management, Vol. 9, No. 4, pp. 249-261, Jan. 2002. https://doi.org/10.1057/palgrave.bm.2540076
  15. Condor, http://www.ickn.org/condor.html