• Title/Summary/Keyword: 웹분류

Search Result 894, Processing Time 0.035 seconds

A Survey of Web Mining Focused on Web Structure Mining (웹 구조 마이닝에 초점을 둔 웹 마이닝의 조사)

  • Lee, Seok-Min;Park, Dae-Myeong;Yoo, Dae-Hun;Choi, Woong-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.334-338
    • /
    • 2010
  • 컴퓨터 기술의 발달 및 웹의 확산으로 인해 개인이 얻을 수 있는 정보의 양이 증가되었지만, 이로 인해 필요한 관련 정보를 탐색하는 것과 다량의 정보로부터 지식을 창출한다는 것이 어렵게 되었고, 고객 또는 사용자에 대한 학습 과정 및 정보의 개인화 등의 문제가 대두되게 되었다. 이러한 문제들을 해소하기 위해 웹으로부터 정보를 얻을 수 있는 자동화된 툴이 필요하게 되었고, 얻은 정보를 이용하여 웹 사용자들의 패턴을 식별할 수 있는 방법 또한 필요하게 되었다. 이러한 관심은 데이터 마이닝을 온라인에서 적용하고자 하는 노력으로 이어졌고, 현재 데이터 마이닝 기술을 온라인에 적용한 웹 마이닝 기술을 사용하고 있다. 웹 마이닝은 웹의 방대한 양의 자료 및 구조를 좀 더 유용하고, 효율적인 정보로 가공하여 사용자에게 제공할 수 있도록 도와주는 기술이다. 본 논문에서는 웹 마이닝의 전반적인 개념과 분류를 소개한다. 또한, 웹 마이닝의 분류 중 웹 구조 마이닝에 초점을 맞추어 개념 및 웹 구조 마이닝의 대표적인 알고리듬을 소개한다.

  • PDF

Study in Analyzing Method of Web Interface Design (웹 인터페이스디자인 분석방법 연구)

  • 이현주;이정현;방경락;류성현;신계옥;이은주
    • Archives of design research
    • /
    • v.14 no.2
    • /
    • pp.209-216
    • /
    • 2001
  • With rapid growth of internet uses and the new media, web has become a new medium of communicating and sharing of information. Therefore, the methodology of web interface design must be set to improve the efficiency of communicating and sharing information The study has researched on analyzing method of web interface design for effective uses of web. The study is a precedent research of methodology of web interface design based on the following structures-grouping web contents, information architecture, web page design, structural elements of interface design. Accordingly, the study provides the analyzing method of web interface design with the basis of its structural elements. The analyzing method of web interface design is divided into three steps-grouping of web sites, analyzing structural elements, and evaluation. As a result, grouping and embodying of interface design brings usability guideline for design development as well as collecting of data for examining further results through design processes.

  • PDF

A Study on the Data Model for the Block-chain Based Web Service (블록체인 기반 웹 서비스 데이터 모델 연구)

  • Kim, Ji-Won;Kim, Hyung-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.299-301
    • /
    • 2019
  • 블록체인 기술이 발전함에 따라 블록체인을 기반으로 하는 웹 서비스가 기획되고자 할 때, 데이터 저장에 대해서 무결성과 기밀성 유지, 데이터의 크기 등의 문제가 발생할 수 있다. 따라서 서비스에 내에서 사용되는 다양한 데이터의 각 특성에 따라 저장소를 선택하여야 한다. 블록체인 기반 웹 서비스의 유형을 분류하고, 서비스에서 사용되는 데이터를 분류할 수 있도록 데이터 분류 체계도와 그 과정에 대해 제안한다. 이를 통해 블록체인 기반 웹 서비스에서 블록체인과 외부 저장소 혼용의 효율 상승을 기대한다.

Empirical Sentiment Classification Using Psychological Emotions and Social Web Data (심리학적 감정과 소셜 웹 자료를 이용한 감성의 실증적 분류)

  • Chang, Moon-Soo
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.22 no.5
    • /
    • pp.563-569
    • /
    • 2012
  • The studies of opinion mining or sentiment analysis have been the focus with social web proliferation. Sentiment analysis requires sentiment resources to decide its polarity. In the existing sentiment analysis, they have been built resources designed with intensity of sentiment polarity and decided polarity of opinion using the ones. In this paper, I will present sentiment categories for not only polarity of opinion but also the basis of positive/negative opinion. I will define psychological emotions to primary sentiments for the reasonable classification. And I will extract the informations of sentiment from social web texts for the actual distribution of sentiments in social web. Re-classifying primary sentiments based on extracted sentiment information, I will organize sentiment categories for the social web. In this paper, I will present 23 categories of sentiment by using proposed method.

A Study on Classification Education Using WebDewey: Based on Learning Outcomes and Learner Satisfaction Survey by DDC Medium Type (웹듀이를 활용한 분류 교육에 대한 연구 - DDC 매체 유형별 학습성과와 학습자 만족도 조사를 바탕으로 -)

  • Baek, Ji-won;Choi, Yejin
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.32 no.3
    • /
    • pp.5-21
    • /
    • 2021
  • The study was carried out for the purpose of identifying implications that should be considered in educating DDC through online within Library and Information Science curriculum. Followed by operating a NCS-based educational course utilizing printed matter and web version of DDC, two tests and survey were conducted to analyze learning outcomes, satisfaction, and preferences by learning tools. The result showed that differences in educational medium do not correlate to educational performance significantly. However, during the learning process, the mainly used medium affects the usefulness, preference and future utilization of the medium. Based on the research results, when designing DDC education using WebDewey in the future, compared to the printed version, relative understanding for utilizing the structure and its items of DDC classification, built numbers and education for understanding Web Dewey interface and function are required.

A Qualitative Exploration of Folksonomy Users' Tagging Behaviors (폭소노미에 따른 웹 분류 연구 - 이용자 태깅 행위 분석을 중심으로 -)

  • Park, Hee-Jin
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.45 no.1
    • /
    • pp.189-210
    • /
    • 2011
  • This study aims to explore how users are tagging in order to utilize a folksonomy and whether they understand the social and interactive aspects of tagging in three different folksonomic systems, Connotea (www.connotea.org), Delicious(http://delicious.com), and CiteULike(www.citeulike.org). The study uses internet questionnaires, qualitative diary studies, and follow-up interviews to understand twelve participants' tagging activities associated with folksonomic interactions. The flow charts developed from the twelve participants showed that tagging was a quite complex process, in which each tagging activity was interconnected, and a variety of folksonomic system features were employed. Three main tagging activities involved in the tagging processes have been identified: item selection, tag assignment, and tag searching and discovery. During the tag assignment, participants would describe their tagging motivations related to various types of tags. Their perception of the usefulness of types of tags was different when their purpose was for social sharing rather than personal information management. While tagging, participants recognized the social potential of a folksonomic system and used interactive aspects of tagging via various features of the folksonomic system. It is hoped that this empirical study will provide insight into theoretical and practical issues regarding users' perceptions and use of folksonomy in accessing, sharing, and navigating internet resources.

An Automated Topic Specific Web Crawler Calculating Degree of Relevance (연관도를 계산하는 자동화된 주제 기반 웹 수집기)

  • Seo Hae-Sung;Choi Young-Soo;Choi Kyung-Hee;Jung Gi-Hyun;Noh Sang-Uk
    • Journal of Internet Computing and Services
    • /
    • v.7 no.3
    • /
    • pp.155-167
    • /
    • 2006
  • It is desirable if users surfing on the Internet could find Web pages related to their interests as closely as possible. Toward this ends, this paper presents a topic specific Web crawler computing the degree of relevance. collecting a cluster of pages given a specific topic, and refining the preliminary set of related web pages using term frequency/document frequency, entropy, and compiled rules. In the experiments, we tested our topic specific crawler in terms of the accuracy of its classification, crawling efficiency, and crawling consistency. First, the classification accuracy using the set of rules compiled by CN2 was the best, among those of C4.5 and back propagation learning algorithms. Second, we measured the classification efficiency to determine the best threshold value affecting the degree of relevance. In the third experiment, the consistency of our topic specific crawler was measured in terms of the number of the resulting URLs overlapped with different starting URLs. The experimental results imply that our topic specific crawler was fairly consistent, regardless of the starting URLs randomly chosen.

  • PDF

A Web Page Categorization Model Based on Document Structural Information (문서 구조 정보에 기반한 웹 페이지 범주화 모델)

  • Jung, Sung-Hwa;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.91-96
    • /
    • 1998
  • 본 논문에서는 주제범주 체계를 이용한 웹 검색이 가지는 장점을 이용 할 수 있도록 인터넷 웹 페이지들을 주제범주 체계에 따라 자동으로 분류하는 모델을 제시한다. 특히 웹 페이지 작성자들의 의도를 범주화에 반영할 수 있는 방법으로 HTML 태그를 이용한다. 즉 웹 페이지의 표현에 있어서 벡터 스페이스 모델에서의 색인어 빈도 가중치에 태그 가중치를 추가 하여 보다 좋은 성능을 얻도록 하였다. 그리고 주제범주를 표현하는데 사용되는 자질의 선정에는 기대상호정보, 상호정보 척도를, 문서간 유사도 비교에는 최근린법을 사용하였다. 전북대에서 정보탐정용으로 분류한 웹 페이지를 대상으로 실험하였으며, 기본 모델 대비 약 7%의 정확도 향상을 얻을 수 있었다.

  • PDF

Dynamic Web Documents Recommendation System Using User-Profile (사용자 관심도를 반영한 동적 웹 문서 추천 시스템)

  • 김병진;최현우;김용성
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.136-138
    • /
    • 2001
  • 인터넷 이용의 급속한 증가로 웹사이트의 증가뿐만 아니라 웹사이트 내의 웹 문서도 급속한 증가를 보이고 있다. 따라서 이를 효과적으로 사용자들에게 보여주기 위한 동적인 추천 시스템들이 많이 제안되고 있다. 그러나 이러한 추천 시스템들은 전체 사용자들의 브라우징 패턴이나 전체 웹 문서들의 연관성만을 고려하여 서비스를 제공함으로써 개인 사용자들의 관심도를 고려하지 않은 문제점이 있다. 이에 본 논문에서는 웹사이트에 남게되는 로그파일의 분석을 이용한 사용자별 브라우징 패턴과 웹 페이지의 액세스 타임의 측정을 통해, 사용자의 관심도를 측정한다. 그리고 이를 바탕으로 웹 문서들에 대해서 퍼지개념을 적용한 자동분류 알고리즘을 이용하여 사용자의 관심도가 반영된 선별된 웹 문서를 자동분류 및 선별하여 보여줄 수 있는 방안을 제시한다.

  • PDF

A Web Crawler using Hyperlink Structure and Hypertext Categorization Method (Hyperlink구조와 Hypertext 분류방법을 이용한 Web Crawler)

  • Lee, Dong-Won;Hyun, Soon-J.
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1337-1340
    • /
    • 2002
  • 웹 정보검색에서 웹 문서를 수집하고, 색인을 구축하는 작업에서 Web Crawler 의 역할은 매우 중요하다. 그러나, 웹 문서의 급속한 증가로 인하여 Web Crawler 가 모든 웹 문서를 수집하는 것은 불가능하며, 웹 정보검색의 정확성을 증가시키기 위한 방법으로 특정한 영역의 문서를 수집하는 focused web crawler에 대한 연구가 활발히 진행되어 왔다. 이와 함께, 웹 문서의 link구조를 이용하여 문서의 집합에서 중요한 문서를 찾는 연구들이 많이 진행되었다. 그러나, 기존의 연구에서는 문서의 link 구조에만 초점이 맞추어져 있으며, hypertext 전체의 연결 구조를 알아야 한다는 문제점이 있다. 본 연구에서는 hyperlink의 구조와 hypertext 분류방법을 이용하여 문서에 연결된 다른 문서 중 중요한 문서를 결정하는 방법을 제시하고 이를 이용한 web crawler 를 통하여 특정영역에서 정확한 문서를 수집함을 보였다.

  • PDF