• Title/Summary/Keyword: 웹 디렉토리 수집

Search Result 6, Processing Time 0.189 seconds

Analyzing Coverage and Coverage Overlap of Korean Web Directories (국내 웹 디렉토리들의 커버리지 및 커버리지 중복성 분석)

  • 배희진;이진숙;이준호;박소연
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.1
    • /
    • pp.173-186
    • /
    • 2004
  • This study examines coverage and coverage overlap of the three major Korean web directories, Naver, Yahoo Korea, and Empas. This study also suggests a methodology for collecting and processing web sites provided by these web directories. A method for napping main categories was developed. Each directory provided registered web pages in a slightly different way. Reference links had a significant influence on the coverage of each web directory. The overlap of pages among three directories was quite low, It is expected that this study could contribute to the field of web research by providing insights to how directories provide web pages and suggesting a methodology for the analysis of directory coverage.

Feature Selection and Extraction for Document Classifier for If documents based on SVM (SVM기반 정보기술 문서분류를 위한 특성 선택 및 추출 기법)

  • 강윤희
    • Proceedings of the KAIS Fall Conference
    • /
    • 2001.11a
    • /
    • pp.75-78
    • /
    • 2001
  • 본 논문에서는 웹 문서의 자동 분류를 위한 특성 선택 및 추출기법을 기술한다. 최근 인터넷의 급속한 성장과 보급으로 전자우편과 웹을 통해 제공되어지는 정보의 양이 기하급수적으로 증가함에 따라 효율적인 문서 분류의 필요성이 증가하고 있다. 본 논문에서는 웹 디렉토리 내의 문서로부터 추출된 용어 집합을 기반으로 SVM을 사용하여 학습한 후 문서 분류를 수행한다. 본 실험의 문서는 정보통신 분야 디렉토리 서비스 시스템인 itfind로부터 수집된 문서를 대상으로 하였으며 3가지 시나리오에 따라 실험을 수행하여 각 시나리오 별로 재현율/정확율 및 오분류율을 성능 요소로 계산하였다. 본 실험은 학습 벡터 구성과정에서 잡음에 의해 다른 클래스의 문서 분류에 미치는 영향을 평가하여 SVM을 기반으로 한 문서 분류 기법이 강건함을 보였다.

A Research on the OASIS, an Web Archive in Korea, Revisited (웹 아카이브 OASIS의 현황에 관한 연구)

  • Yoon, Cheong-Ok
    • Journal of Information Management
    • /
    • v.42 no.3
    • /
    • pp.95-116
    • /
    • 2011
  • The purpose of this research is to examine the characteristics and problems of the OASIS, an web archive, developed and operated by the National Library of Korea. An analysis of 55 websites collected in seven subject areas, including 'Philosophy', 'Religion', 'Literature', 'Social Sciences-Politics', and 'Technology-Technology' in the OASIS website shows the following problems: lack of balance in subject distribution, lack of authority or scholarly value of some contents, unclear application of selection criteria for personal creators/publishers, ambiguous definition of 'archiving', and inappropriate counting of collection and usage statistics. Some comprehensive and systematic efforts to improve the OASIS contents seem to be urgently needed.

A Study on the Structure and Content Analysis of Art Museum Websites in Korea (미술관 웹 사이트의 구조 및 콘텐츠 분석에 관한 연구)

  • Noh, Dong-Jo;Lee, Seung-Wook
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.54 no.1
    • /
    • pp.277-301
    • /
    • 2020
  • The purpose of this study is to analyze art museum websites and derive implications for future operation of art museum websites. To this end, this research collected basic information about art museums according to '2018 National General Report of Cultural Infrastructure' and investigate the websites of 30 art museums through multi-step sampling process. This study analyzed the structure and menu of the art museum websites as well as the current state of various contents provided by the websites and the search service for the collections offered by the websites. Following sentences are the results. First of all, the art museum websites offer 5.6 top menus on average. Secondly, contents related to art museum, exhibitions, news, education, general forum, and SNS are the basic contents that should be provided on the art museum websites. Third, for contents related to news, education, and events have problems with hierarchical structure and need to be adjusted. Fourth, in the content type, specialized information contents are relatively insufficient and thus need to be improved. Fifth, the art museum websites should give sufficient information about the collection and offer directory searching hat includes keyword searching as well as detail searching service. It is also required to reorganize the directory along with the download function for searched results and the sorting service.

Automatic Document Categorization by the Importance of Features (자질 중요도 계산 기법에 의한 자동문서 범주화)

  • 이경찬;강승식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.537-539
    • /
    • 2003
  • 문서 범주화를 위해 자질을 선별하는 기법으로는 자질의 출현 빈도에 따라 범주를 대표하는 자질들을 선별하는 것이 일반적이다. 출현 빈도에 의한 자질을 선별하는 통계적인 기법은 문서의 내용을 대표하는 용어들의 중요도를 간과하는 문제가 발생한다. 본 논문에서는 학습 문서 및 실험 문서에서 자질의 중요도에 의해 범주 대표어를 선별하는 문서 범주화 기법을 제안하였으며, 역범주 빈도 및 카이제곱 통계량에 의해 자질을 선별하는 방법과 비교-실험을 하였다. 문서 범주화 모델로는 나이브 베이지언 확률 모델을 이용하였으며, 성능 평가를 위해서 웹 디렉토리에서 수집된 데이터를 이용하여 실험하였다. 본 논문에서 제안한 자질 중요도에 의한 자질 선별 기법은 용어의 출현 빈도 및 카이제곱 통계량에 의해 자질을 선별한 방법보다 더 나은 성능을 보였다.

  • PDF

Design and Implementation of Meta Electronic Shopping Mall (메타 전자 쇼핑몰의 설계 및 구현)

  • Shin, Min-Hwa;Choi, Han-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.1095-1099
    • /
    • 2000
  • 최근 전자상거래의 상업성이 부각되면서 많은 기업들과 개인사업자들이 독자적인 웹서버를 구축하고 자사의 상품 또는 기업에 대한 광고 내용을 인터넷을 통해 서비스를 하고 있다. 그러나 소비자에게 홍보가 부족하고, 상품의 종류와 정보의 부족으로 외면을 당하고 있는 웹사이트들이 많이 있다. 본 논문에서는 이러한 기업들의 카탈로그를 수집하여 재구성한 후, 한 사이트에서 여러 기업의 상품을 검색할 수 있도록 하여 소비자의 접근과, 각 기업의 상거래 사이트를 활성화 할 수 있는 메타 전자 쇼핑몰 개발에 관해 기술한다. 본 시스템의 특징은 로봇이 자동으로 데이터 베이스를 구축하여 소비자가 쉽게 검색 할 수 있도록 주제어 검색과 디렉토리 검색 인터페이스를 구성을 가지고 있다는 점이다.

  • PDF