DOI QR코드

DOI QR Code

검색 포털들의 검색어 추천 서비스 분석 평가: 네이버와 구글의 연관 검색어 서비스를 중심으로

Analysis and Evaluation of Term Suggestion Services of Korean Search Portals: The Case of Naver and Google Korea

  • 박소연 (덕성여자대학교 문헌정보학과)
  • 투고 : 2013.05.28
  • 심사 : 2013.06.13
  • 발행 : 2013.06.30

초록

본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.

This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did not produce terms. This study also analyzed types of terms in terms of the relationship between queries and terms, and investigated types and characteristics of harmful terms and terms with grammatical errors. Finally, Korean queries and English queries, and popular queries and academic queries were compared in terms of the amount and relevance of search terms provided. The results of this study show that the relevance and currency of Naver's related search terms are somewhat higher than those of Google. Both Naver and Google tend to add terms to or delete terms from original queries, and provide identical search terms or synonym terms rather than providing entirely new search terms. The results of this study can be implemented to the portal's effective development of term suggestion services.

키워드

참고문헌

  1. 김지혜, 장재영, 윤홍준, 김한준 (2010). 키워드 관련도를 이용한 뉴스기사의 연관 검색 기법. 한국정보과학회 학술발표논문집, 37(1C), 53-57.
  2. 문상준, 최재걸 (2004). 검색어의 연관법칙. 한국정보과학회 학술발표논문집, 31(2), 10-12.
  3. 박성주, 박하얀, 김용혁 (2008). 검색엔진의 검색 결과 분석을 통한 병렬처리 기반의 연관 검색어 추천 기법. 한국정보과학회 학술발표논문집, 35(2C), 214-217.
  4. 박소연 (2011). 웹 검색 행태의 추이 및 변화 분석. 한국문헌정보학회지, 45(1), 377-393. http://dx.doi.org/10.4275/KSLIS.2011.45.1.377
  5. 박소연, 이준호, 김지승 (2005). 클릭 로그에 근거한 네이버 검색 질의의 형태 및 주제 분석. 한국문헌정보학회지, 39(1), 265-278. https://doi.org/10.4275/KSLIS.2005.39.1.265
  6. 윤여생, 유진호 (2012). 불법유해정보 법.제도 동향 분석. 정보보호학회지, 22(3), 25-36.
  7. 이정훈, 전서현 (2009). 검색어 질의 확장을 위한 추천 질의 랭킹 시스템. 한국정보과학회 학술발표논문집, 36(2C), 210-214.
  8. 이준호, 박소연, 권혁성. (2003). 질의 로그 분석을 통한 네이버 이용자의 검색 행태 연구. 정보관리학회지, 20(2), 27-41. https://doi.org/10.3743/KOSIM.2003.20.2.027
  9. 주길홍, 이주일, 이원석 (2011). 효율적인 문서 검색을 위한 연관 키워드 추출 및 확산 클러스터링 방법. 한국정보기술학회 논문지, 9(6), 155-166.
  10. 최재봉 (2012). 인터넷 쇼핑몰 마케팅 비법. 서울: 앱북스.
  11. 한국인터넷자율정책기구(KISO) (2013). 연관검색어 및 자동완성검색어에 대한 정책결정 15호. Retrieved from http://www.kiso.or.kr/decision/decision_view.html.
  12. Arkin, H., & Colton, R. (1963). Tables for statisticians. New York: Barnes & Noble Inc.
  13. Bates, M. J. (1981). Search techniques. Annual Review of Information Science and Technology, 16, 139-169.
  14. Beeferman, D., & Berger, A. (2000). Agglomerative clustering of a search engine query log. Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 407-416. http://dx.doi.org/10.1145/347090.347176
  15. Chen, L. (2011). Term suggestion with similarity measure based on semantic analysis techniques in query logs. Online Information Review, 35(1), 9-33. https://doi.org/10.1108/14684521111113560
  16. Croft, W. B., Metzler, D., & Strohman, T. (2010). Search engines: Information retrieval in practice. Boston: Pearson Education. 임해창, 임희석, 한경수, 박소영 공역 (2012). 검색엔진: 최신정보검색론. 서울: 휴먼싸이언스.
  17. Huang, C., Chien, L., & Oyang, Y. (2003). Relevant term suggestion in interactive web search based on contextual information in query session logs. Journal of the American Society for Information Science and Technology, 54(7), 638-649. http://dx.doi.org/10.1002/asi.10256
  18. Liu, Y., Miao, J., Zhang, M., Ma, S., & Ru, L. (2011). How do users describe their information need: Query recommendation based on snippet click model. Expert systems with applications, 38, 13847-13856. http://dx.doi.org/10.1016/j.eswa.2011.04.188
  19. NHN. (2013). 연관검색어는 어떤 서비스인가요? Retrieved from http://help.naver.com/ops/faq/faqPrint.nhn?faqId=24796.
  20. Sanderson, M. (2008). Ambiguous queries: Test collections need more sense. Proceedings of the 31st Annual international ACM SIGIR conference on research and development in information retrieval, 499-506. http://dx.doi.org/10.1145/1390334.1390420
  21. Silverstein, C., Henzinger, M., Marais, H., & Moricz, M. (1999). Analysis of a very large web search engine query log. SIGIR Forum, 33(1), 6-12. https://doi.org/10.1145/331403.331405
  22. Spink, A., Wolfram, D., Jansen, B. J., & Saracevic, T. (2001). Searching the Web: The public and their queries. Journal of the American Society for Information Science and Technology, 52(3), 226-234. https://doi.org/10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.0.CO;2-R
  23. Xu, Z., Luo, X., Yu, J., & Xu, W. (2011). Mining Web search engines for query suggestion. Concurrency and Computation: Practice and Experience, 23, 1101-1113. http://dx.doi.org/10.1002/cpe.1689