DOI QR코드

DOI QR Code

Analyzing Coverage and Coverage Overlap of Korean Web Directories

국내 웹 디렉토리들의 커버리지 및 커버리지 중복성 분석

  • 배희진 (숭실대학교 컴퓨터학부 대학원) ;
  • 이진숙 (숭실대학교 컴퓨터학부 대학) ;
  • 이준호 (숭실대학교 컴퓨터학) ;
  • 박소연 (덕성여자대학교 문헌정보학과)
  • Published : 2004.03.01

Abstract

This study examines coverage and coverage overlap of the three major Korean web directories, Naver, Yahoo Korea, and Empas. This study also suggests a methodology for collecting and processing web sites provided by these web directories. A method for napping main categories was developed. Each directory provided registered web pages in a slightly different way. Reference links had a significant influence on the coverage of each web directory. The overlap of pages among three directories was quite low, It is expected that this study could contribute to the field of web research by providing insights to how directories provide web pages and suggesting a methodology for the analysis of directory coverage.

본 연구에서는 국내 주요 웹 검색 포탈인 네이버, 야후 코리아, 엠파스가 제공하는 웹 디렉토리들의 커버리지 및 커버리지 중복성을 분석하였다. 이를 위하여 본 연구는 웹 디렉토리에 등록된 사이트들의 수집 방법을 개발하고, 대분류 매핑, 중복 분류 및 참조 링크 고려와 같은 커버리지 및 커버리지중복성 분석에 필요한 방법론을 제시하였다. 조사 결과, 참조 링크의 허용 여부가 웹 디렉토리의 커버리지에 매우 큰 영향을 미치며, 국내 웹 디렉토리들 사이의 커버리지 중복성이 매우 낮은 것으로 나타났다. 본 연구는 국내 웹 디렉토리들에 대한 이해를 넓히고, 웹 디렉토리들의 커버리지 및 커버리지중복성 분석에 필요한 방법론을 제시함으로써, 웹 디렉토리에 관한 연구에 기여할 것으로 기대된다.

Keywords

References

  1. 곽철완. 2001. 인터넷 쇼핑몰의 상품 분류체계에 대한 연구. "정보관리학회지", 18(4) : 210-215.
  2. 김영보. 19974. "인터넷 탐색엔진의 분류체계에 관한 연구 : 컴퓨터, 인터넷 분야를 중심으로". 석사학위논문, 성균관대학교.
  3. 남영준. 1998. 웹 문서 분류체계의 분석 및 새로운 설계. "한국문헌정보학회지", 32(3): 207-230.
  4. 남영준, 최승순. 2002. 한국십진분류체계와 웹문서의 통합분류체계 개발. "국회도서관보", 39(1): 25-43.
  5. 신동민. 2001. 인터넷 검색엔진의 디렉토리 구성에 관한 연구. "정보관리학회지", 18(2): 143-163.
  6. 오동근, 황재영, 배영활. 2001. 군사학 분야 웹 문서 분류체계의 설계. "한국도서관 정보학회지", 32(2): 323-34.
  7. 이란주, 성기주, 양정하. 2001. 여성학분야 인터넷 자원의 분류체계에 관한 연구. "한국도서관 정보학회지", 32(3) : 397-417.
  8. 정연경. 2001. 인터넷 서점의 주제별 분류체계 설계에 관한 연구. "한국문헌정보학회지", 35(3): 17-34.
  9. 최재황. 1998. 인터넷 학술정보자원의 디렉토리 서비스 설계에 있어서 DDC분류 체계의 활용에 관한 연구. "정보관리학회지", 15(2): 47-67.
  10. 최윤희. 1998. 인터넷 정보서비스의 분류체계에 대한 비교연구 : 물리학을 중심으로. "정보관리학회지", 15(3): 45-57.
  11. 한상길. 2001. 산업분야 인터넷 자원의 분류체계에 관한 연구. "정보관리학회지", 18(3): 285-309.
  12. Dong, X, and Su, L. T. 1997. "Search engines on the world wide web and information retrieval from the internet: A review and evaluation." Online & CDROM Review, 21(2): 67-82. https://doi.org/10.1108/eb024608
  13. Heydon A., and Najork, M. 1999. "Mercator: a scalable, extensible web crawler." World Wide Web, 2(4): 219-229. https://doi.org/10.1023/A:1019213109274
  14. Lawrence, S., and Giles, C. L. 1999. "Accessibility of information on the web". Nature, 400: 107-109. https://doi.org/10.1038/21987
  15. Lawrence, S., and Giles, C. L. 1998. "Searching the World Wide Web," Science, 280: 98-100. https://doi.org/10.1126/science.280.5360.98
  16. Najork, M., and Heydon, A. 2001. "High-Performance Web Crawling," SRC Research Report, 173, Compaq Systems Research Center.
  17. Rolling, L. 1981. "Indexing consistency, quality and efficiency", lriformation Processing and Management, 17: 69-76. https://doi.org/10.1016/0306-4573(81)90028-5

Cited by

  1. Search Portals and Academic Libraries: An Analysis of the Book Services and Academic Information Services of Major Search Portals vol.43, pp.3, 2009, https://doi.org/10.4275/KSLIS.2009.43.3.181
  2. A Quantitative Analysis of Classification Classes and Classified Information Resources of Directory vol.37, pp.1, 2006, https://doi.org/10.1633/JIM.2006.37.1.083
  3. Comparative Evaluation of Directory Services Provided by Major Korean Search Portals: In the Field of Computer and Internet vol.43, pp.1, 2009, https://doi.org/10.4275/KSLIS.2009.43.1.215