A Framework for Web Log Analysis Using Process Mining Techniques

프로세스 마이닝을 이용한 웹 로그 분석 프레임워크

  • Ahn, Yunha (Department of Industrial and Management Systems Engineering, Kyung Hee University) ;
  • Oh, Kyuhyup (Department of Industrial and Management Systems Engineering, Kyung Hee University) ;
  • Kim, Sang-Kuk (Department of Industrial and Management Systems Engineering, Kyung Hee University) ;
  • Jung, Jae-Yoon (Department of Industrial and Management Systems Engineering, Kyung Hee University)
  • 안윤하 (경희대학교 산업경영공학과) ;
  • 오규협 (경희대학교 산업경영공학과) ;
  • 김상국 (경희대학교 산업경영공학과) ;
  • 정재윤 (경희대학교 산업경영공학과)
  • Received : 2014.02.07
  • Accepted : 2014.02.21
  • 발행 : 2014.03.30

초록

Web mining techniques are often used to discover useful patterns from data log generated by Web servers for the purpose of web usage analysis. Yet traditional Web mining techniques do not reflect sufficiently sequential properties of Web log data. To address such weakness, we introduce a framework for analyzing Web access log data by using process mining techniques. To illustrate the proposed framework, we show the analysis of Web access log in a campus information system based on the framework and discuss the implication of the analysis result.

웹 마이닝은 사용자의 웹 이용 분석을 위해 웹에서 발생한 데이터를 대상으로 유용한 패턴을 찾아내는 기법이다. 하지만 기존의 웹 마이닝은 웹 로그의 연속적인 특성을 충분히 반영하여 분석하지 못하였다. 이를 보완하기 위하여 본 연구에서는 프로세스 마이닝을 활용하여 프로세스 모델에 의한 순차적인 관계에 따른 웹 접속 로그를 분석하는 프레임워크를 제시한다. 프로세스 모델에 기반한 웹 로그 분석은 웹 페이지들을 이동한 사용자들의 행위를 이해하고 문제점과 개선방안을 도출하는 데 유용하게 사용될 수 있다. 본 연구에서는 제안한 방법론을 이용하여 대학정보시스템의 웹 로그를 분석하여 적용 가능성과 그 분석 결과를 제시하였다.

키워드

과제정보

연구 과제 주관 기관 : 한국연구재단

참고문헌

  1. 윤석호, 이우기, "차세대 웹 구도로서 X-internet 및 그에 기반한 지능형 단말시스템에 관한 연구", 정보기술아키텍처연구, Vol. 3, No. 2, pp. 87-95, 2006.
  2. 이우기, 임태수, "웹 아키텍처에 대한 그래프 기반 평가방법", 정보기술 아키텍처연구, Vol. 4, No. 1, pp. 61-69, 2007.
  3. 조경원, 우영운, "웹로그 분석을 통한 의약품 정보 검색 주제별 이용 패턴에 관한 연구", 한국콘텐츠학회, Vol. 3 No. 2, pp. 269-274, 2007.
  4. Cooley, R., Mobasher, B., and Srivastava, J., "Web mining: information and pattern discovery on the World Wide Web," 9th IEEE International Conference on Tools with Artificial Intelligence, Newport Beach, pp. 558-567, 1997.
  5. Disco, http://www.fluxicon.com/disco/
  6. Eirinaki, M. and Vazirgiannis, M., "Web mining for web personalization," ACM Transactions on Internet Technology, Vol. 3, No. 1, pp. 1-27, 2003. https://doi.org/10.1145/643477.643478
  7. Farrell, J. and Nezlek, G. S., "Rich Internet Applications The Next Stage of Application Development," 29th International Conference on Information Technology Interfaces, Cavtat, pp. 413-418, 2007.
  8. Gonçalves, B. and Ramasco, J., "Human dynamics revealed through Web analytics," Physical Review E, Vol. 78, No. 2, pp. 1-7, 2008.
  9. Google web log analytics, http://google.com/analytics.
  10. Hernandez-Campos, F. and Jeffay, K., "Tracking the evolution of Web traffic: 1995-2003," 11th IEEE/ACM International Symposium on Modeling, Analysis and Simulation of Computer Telecommunication Systems, Orlando, pp. 16-25, 2003.
  11. ITU, Key ICT indicators for developed and developing countries and the world (totals and penetration rates), http://www.itu.int
  12. Kosala, R. and Blockeel, H., "Web mining research: a surbvey," ACM SIGKDD Explorations Newsletter, Vol. 2, No. 1, pp. 1-15, 2000.
  13. Nagwani, N. and Verma, S., "Predicting expert developers for newly reported bugs using frequent terms similarities of bug attributes," 9th International Conference on ICT and Knowledge Engineering, Bangkok, pp. 113-117, 2012.
  14. Sen, A., Dacin, P. A., and C. Pattichis, "Current trends in web data analysis," Communications of the ACM, Vol. 49, No. 11, pp. 1-7, 2006.
  15. Song, M. and van der Aalst, W. M. P., "Towards comprehensive support for organizational mining," Decision Support Systems, Vol. 46, No. 1, pp. 300-317, 2008. https://doi.org/10.1016/j.dss.2008.07.002
  16. Srivastava, J., Cooley, R., Deshpande, M. and Tan, P., "Web usage mining," ACM SIGKDD Explorations Newsletter, Vol. 1, No. 2, pp. 12-23, 2000. https://doi.org/10.1145/846183.846188
  17. van der Aalst, W. M. P., "Process Mining: Overview and Opportunities," ACM Transactions on Management Information Systems), Vol. 3, No. 2, Article 7, 2012.
  18. Weijters, A. and van der Aalst, W. M. P., "Process mining with the heuristics miner-algorithm," Department of Technology Management, Eindhoven University of Technology Eindhoven, pp. 1-34, 2006.