DOI QR코드

DOI QR Code

Web Search Behavior Analysis Based on the Self-bundling Query Method

웹검색 행태 연구 - 사용자가 스스로 쿼리를 뭉치는 방법으로 -

  • 이중식 (서울대학교 융합과학기술대학원 차세대융합기술연구원)
  • Received : 2011.04.15
  • Accepted : 2011.05.13
  • Published : 2011.05.30

Abstract

Web search behavior has evolved. People now search using many diverse information devices in various situations. To monitor these scattered and shifting search patterns, an improved way of learning and analysis are needed. Traditional web search studies relied on the server transaction logs and single query instance analysis. Since people use multiple smart devices and their searching occurs intermittently through a day, a bundled query research could look at the whole context as well as penetrating search needs. To observe and analyze bundled queries, we developed a proprietary research software set including a log catcher, query bundling tool, and bundle monitoring tool. In this system, users' daily search logs are sent to our analytic server, every night the users need to log on our bundling tool to package his/her queries, a built in web survey collects additional data, and our researcher performs deep interviews on a weekly basis. Out of 90 participants in the study, it was found that a normal user generates on average 4.75 query bundles a day, and each bundle contains 2.75 queries. Query bundles were categorized by; Query refinement vs. Topic refinement and 9 different sub-categories.

검색이 편재화 되고 있다. 사용자들은 PC를 너머 스마트폰과 스마트TV에서도 검색을 일상적으로 사용하고 있다. 따라서 사용자의 검색행태도 진화 중이다. 하지만 검색행태 연구는 서버의 트랜잭션 로그(transaction log)를 기반으로 하거나 사용자 로그(user log)를 관찰하는 경우에도 개별 쿼리(query instance)를 분석단위로 삼기에 여러 매체와 여러 시간을 가로지르는 검색 행태를 분석하기에 부족하다. 본 연구에서는 사용자가 직접 덩어리 지운 쿼리 뭉치(bundled query)를 살펴보아 시간과 매체를 가로지르며 궁금증을 해결해 나가는 사용자의 검색행동을 분석해 보았다. 연구를 위해 사용자 PC에 웹로그 캐처를 설치하고, 취합된 웹검색 기록을 사용자들이 직접 덩어리 지워 같은 궁금증을 가진 뭉치를 만들도록 하였다. 또한 각 뭉치에 대한 설문을 통해 검색의 동기, 계기, 만족도 및 검색 후 활동을 조사하였다. 사용자에 의해 만들어진 뭉치는 전화 인터뷰를 통해 검증하였고 맥락을 확인하였다. 뭉치를 통한 인터뷰는 검색 당시의 기억을 떠올리는 힌트로 작용하여 사용자의 검색 회상을 생생하게 하였다. 분석 결과 사용자들은 하루에 평균 4.75개의 검색 뭉치를 발생시키고, 각각의 검색 뭉치는 평균 2.75개의 쿼리로 구성되어 있음을 확인할 수 있었다. 또한 뭉치 내 쿼리의 발전을 '쿼리의 정교화'와 '주제의 정교화'라는 상위 범주 아래 9개의 패턴으로 확인하였다.

Keywords

References

  1. 김문성. 2011. 웹 검색행태 분석을 통한 사용자 유형 연구: 검색보조기술이 사용자 검색 행동에 미치는 영향. 석사학위논문, 서울대학교 융합과학기술대학원.
  2. 박소연, 이준호. 2001. 로그분석을 통한 인터넷 검색엔진 이용자의 웹 문서 검색 행태에 관한 연구. 한국문헌정보학회 학술논문발표집, 14: 61-73.
  3. Bates, M. J. 1989. "The design of browsing and berrypicking techniques for the online search interface." Online Information Review, 13(5): 407-431. https://doi.org/10.1108/eb024320
  4. Baxter, L., Montgomery, B., & Duck, S. 1994. Studying Interpersonal Interaction. New York: Guilford Press.
  5. Cha, M., Haddadi, H., Benevenuto, F., & Gummadi, K. 2010. "Measuring user influence in twitter: The million fallacy." Proceedings of International AAAI Conference on Weblogs and Social Media(ICWSM), May, 2010.
  6. Chang, S. J. 1993. "Browsing: A multidimensional framework." Annual Review of Informational Science, 28: 231-276.
  7. Choo, C., Detlor, B., & Turnbull, D. 1999. "Information seeking on the web: An integrated model of browsing and searching." Proceedings of the 62nd ASIS Annual Meeting, 36: 3-16. Oct. 31-Nov. 4, 1999. Washington, D.C.
  8. Jansen, B., et al. 2000. "Real life, real users, and real needs: A study and analysis of user queries on the web." Information Processing and Management, 36(2): 207-227. https://doi.org/10.1016/S0306-4573(99)00056-4
  9. Jansen, B., et al. 2002. "From e-sex to e-commerce: Web search changes, computers." IEEE Computer, 35(3): 107-109. https://doi.org/10.1109/2.989940
  10. Jansen, B., & Spink, A. 2003. "An analysis of web information seeking and use: Documents retrieved versus documents viewed." Proceedings of the 4th International Conference on Internet Computing, 65-69. June 23-26, 2003. Las Vegas, Nevada.
  11. Jansen, B., & Spink, A. 2006. "How are we searching the World Wide Web? A comparison of nine search engine transaction logs." Information Processing and Management, 42(1): 248-263. https://doi.org/10.1016/j.ipm.2004.10.007
  12. Jansen, B., et al. 2007. "Defining a session on web search engines." Journal of the American Society for Information Science and Technology, 58(6): 862-871. https://doi.org/10.1002/asi.20564
  13. Kellar, M., Watters, C., & Shepherd, M. 2007. "A field study characterizing web-based information-seeking tasks." Journal of the American Society for Information Science and Technology, 58(7): 999-1018. https://doi.org/10.1002/asi.20590
  14. Kuhlthau, C. 1991. "Inside the search process: Information seeking from the user's perspective." Journal of the American Society for Information Science, 42(5): 361-371. https://doi.org/10.1002/(SICI)1097-4571(199106)42:5<361::AID-ASI6>3.0.CO;2-#
  15. Kwak, H., Lee, C., Park, H., & Moon, S. 2010. "What is twitter, a social network or a news media?" 19th International World Wide Web Conference, 591-600. Apr. 26-30, 2010. Raleigh NC.
  16. Liu, B. 1998. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Berlin: Springer.
  17. Nielson, J. 2006. Prioritizing Web Usability. Indianapolis: New Riders.
  18. Rice, E. 1993. Accessing and Browsing Information and Communication. Cambridge: MIT Press.
  19. Rose, D., & Levinson, D. 2004. Understanding user goals in web search. New York: ACM.
  20. Silverstein, C., et al. 1999. Analysis of a Very Large Web Search Engine Query Log. New York: ACM.
  21. Shi, X. 2007. "Mining related queries from web search engine query logs using an improved association rule mining model." Journal of the American Society for Information, 58(12): 1871-1883. https://doi.org/10.1002/asi.20632
  22. Spink, A., Wolfram, D., Jansen, M. B. J., & Saracevic, T. 2001. "Searching the web: The public and their queries." Journal of the American Society for Information Science and Technology, 52(3): 226-234. https://doi.org/10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.0.CO;2-R
  23. Taylor, R. 1962. "The process of asking questions." American Documentation, 13(4): 391-396. https://doi.org/10.1002/asi.5090130405