• Title/Summary/Keyword: 웹분류

Search Result 894, Processing Time 0.028 seconds

A Machine Learning Approach to Web Image Classification (기계학습 기반의 웹 이미지 분류)

  • Cho, Soo-Sun;Lee, Dong-Woo;Han, Dong-Won;Hwang, Chi-Jung
    • The KIPS Transactions:PartB
    • /
    • v.9B no.6
    • /
    • pp.759-764
    • /
    • 2002
  • Although image occupies a large part of importance on the Web documents, there have not been many researches for analyzing and understanding it. Many Web images are used for carrying important information but others are not used for it. In this paper classify the Web images from presently served Web sites to erasable or non-erasable classes. based on machine learning methods. For this research, we have detected 16 special and rich features for Web images and experimented by using the Baysian and decision tree methods. As the results, F-measures of 87.09%, 82.72% were achived for each method and particularly, from the experiments to compare the effects of feature groups, it has proved that the added features on this study are very useful for Web image classification.

Library Management and Services for Software Component Reuse on the Web (Web 소프트웨어 컴포넌트 재사용을 위한 라이브러리 관리와 서비스)

  • Lee, Sung-Koo
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.1_2
    • /
    • pp.10-19
    • /
    • 2002
  • In searching and locating a collection of components on the Web, users require a Web browser. Since the Web libraries tend to grow rapidly, there needs to be an effective way to organize and manage such large libraries. Traditional Web-based library(retrieval) systems provide various classification scheme and retrieval services to store and retrieve components. However, these systems do not include invaluable services, for example, enabling users to grasp the overall contents of the library at the beginning of retrieval. This paper discusses a Web-based library system, which provides the efficient management of object-oriented components and a set of services beyond simple component store and retrieval. These services consist of component comprehension through a reverse engineering process, automated summary extraction, and comprehension-based retrieval. Also, The performance of an automated cluster-based classification scheme adopted on the system is evaluated and compared with the cluster-based classification scheme adopted on the system is evaluated and compared with the performance of two other systems using traditional classification scheme.

Web document prediction using forward reference path traversal patterns (전 방향 참조 경로 탐사 패턴을 이용한 웹 문서 예측)

  • 김양규;손기락
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.112-114
    • /
    • 2004
  • 오늘날 웹을 이용하는 사용자들의 웹 검색 형태를 저장한 웹 로그 데이터들은 데이터 마이닝을 위한 중요한 자료가 되고 있다. 이들 웹 로그들로부터 사용자의 현재 행동을 기반으로 사용자가 다음에 요청할 요구를 예측할 수 있는 예측 모델을 만들 수 있다. 하지만 이들 웹 로그들은 크기가 매우 크고 분석하기가 어렵다. 이런 문제를 해결하기 위해 이미 않은 방법이 제안되었다. 그 중에서 효과적으로 예측할 수 있도록 제안된 순차적 분류 기반에 연관법칙을 적용한 예측 기법이 있다. 본 논문에서는 전방향 참조 경로 탐사 패턴 알고리즘을 적용하여 연관규칙에 기반 한 웹 문서 예측 기법을 향상시키는 모델을 제안한다.

  • PDF

Technical Trends of Semantic Annotation for Semantic Web Services (시맨틱 웹서비스를 위한 시맨틱 어노테이션 기술 동향)

  • Moon, A.K.;Park, Y.M.;Kim, S.G.
    • Electronics and Telecommunications Trends
    • /
    • v.25 no.2
    • /
    • pp.121-131
    • /
    • 2010
  • 인터넷의 발전 과정에서 데이터 중심의 시맨틱 웹 기술과 서비스 중심의 웹서비스 기술은 시맨틱 웹서비스라는 융합기술로 발전하고 있다. 본 고에서는 시맨틱 웹서비스 실현의 핵심인 시맨틱 어노테이션(annotation) 기술을 소개하고, 접근 방식에 따라 톱다운 방식와 바텀업 방식으로 분류한 어노테이션 기술들을 비교 분석한다. 그리고 어노테이션 기술 중 WSMO 기반의 어노테이션을 이용하여 시맨틱 웹서비스를 모델링하는 사례를 보임으로써 시맨틱 웹서비스 실현의 가능성과 그 시기를 가늠해보고자 한다.

Adaptive Web Image Server for Sharing e-Catalog of e-Commerce (전자상거래용 이미지 공유를 위한 웹 이미지 서버)

  • 김명은;라인순;조동섭
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.31-33
    • /
    • 2002
  • 인터넷의 발달로 데스크탑 컴퓨터만이 아니라 냉장고, 달리는 차안, PDA, 핸드폰 등 생활 영역 곳곳에서 인터넷을 할 수 있다. 이런 다양한 기기에서 누릴 수 있는 서비스의 질은 분명 다르다. 여러 종류의 다양한 서비스를 보장하기 위해서 서비스 제공자는 같은 상품이라도 화질별로 이미지를 가지고 있어야 한다. 전자상거래용 이미지는 같은 상품에 대한 이미지라도 상황에 따라 보이는 크기가 다르다. 카달로그 목록에 있는 이미지는 작은 것을 사용하고 상품을 제시할 때는 확대된 그림을 사용해야 한다. 현재의 서버시스템은 이미지를 크기에 따라 개별적으로 저장한다 따라서 상품을 교체할 때마다 여러 개의 이미지를 동시에 바꿔야 하기 때문에 이러만 시스템은 비효율적이다. 본 논문에서는 이런 비효율성을 줄이기 위해 수준에 맞게 이미지를 자동으로 처리하여 같은 이미지를 여러 버전으로 보여주는 웹 이미지 서버를 제안한다. 제안된 웹 서버는 사용자를 분류하고 그 분류에 따라 대용량, 고화질 이미지에서 저용량, 저화질로 이미지를 자동으로 처리하여 효과적이고 더 빠른 서비스를 제공할 수 있다. 따라서 하나의 웹 이미지로도 다양한 수준의 이미지를 가질 수 있기 때문에 서비스 종류 별로 웹 페이지를 만들지 않아도 되고, 저장공간도 효율적으로 사용할 수 있다.

  • PDF

Effective User Clustering Algorithm for Collaborative Filtering System (협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘)

  • Go, Su-Jeong;Im, Gi-Uk;Lee, Jeong-Hyeon
    • The KIPS Transactions:PartB
    • /
    • v.8B no.2
    • /
    • pp.144-154
    • /
    • 2001
  • 협력적 여과 시스템은 사용자가 검색하고 읽었던 웹문서를 기반으로 사용자 군집을 생성하여 웹문서의 정확한 추천을 가능하게 한다. 이러한 목적으로 설계된 다양한 알고리즘이 있으나 속도가 느리거나 정확도가 낮다는 등의 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘인 CUG알고리즘은 사용자 군집을 생성하기 위해 Apriori 알고리즘, Native Bayes 알고리즘을 이용한다. Apriori 알고리즘은 연관 단어 지식 베이스를 구축하고, Native Bayes 알고리즘은 구축된 연관 단어 지식 베이스에 가중치를 추가하며, 사용자가 검색하여 읽은 웹문서를 클래스별로 분류한다. CUG 알고리즘은 분류된 웹문서를 기반으로 하여 사용자 군집을 만든다. 이러한 방법으로 설계된 CUG 알고리즘은 사용자들이 사용할 문서를 미리 검색하여 저장함에 의해 정보검색의 효율성을 향상시키는데 사용될 수 있다. 본 논문에서 설계한 CUG 알고리즘의 선능을 평가하기 위하여 기존의 K-means 방법과 Gibbs샘플링 방법에 의한 군집과 비교한다.

  • PDF

Tag Information Search based on Ontoloty (온톨로지 기반의 태그 정보 검색)

  • Ki-Dong Han;Chang-Hun Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.757-759
    • /
    • 2008
  • 기존의 웹 서비스가 수동적이고, 단방향 통신을 축으로 뒀다면 현재의 웹 서비스는 점차 능동적이고 변화되었으며, 양방향 통신 환경을 지향하게 되었다. 이러한 웹 서비스 변화의 흐름을 일컬어 웹 2.0이라 한다. 웹 2.0 세대를 살아가는 사용자들은 기존과 다른 다양한 정보의 홍수에 노출되게 되었다. 이들은 일방적이고, 제한적인 정보를 얻는 기존 환경에서 탈피, 스스로 가치 있는 정보를 생산해 내기 시작했고, 이렇게 생산된 정보는 인터넷을 통해 다른 사용자와 교류하며 더욱 가치 있는 정보를 창출해 나가고 있다. 이런 발전 과정에서 지속적으로 더욱 더 커져가는 정보를 더 빠르고 정확하게 공유하는 기술이 필요하게 되었고, 현재 이런 필요성을 충족시키는데 유용한 기술의 한 갈래로 나온 것이 태그와 시맨틱 웹으로 대표되는 온톨로지 이다. 태그는 정보의 주제나 표제를 나타내는 단어를 해당 컨텐츠 정보를 제공하는 사이트에서 정보 분류 단위로 사용, 이를 통한 더 빠른 정보 공유를 할 수 있게 되었다. 시맨틱 웹은 현재의 인터넷과 같은 다양한 리소스에 대한 정보와 자원 사이의 관계-의미 정보를 기계(컴퓨터)가 처리할 수 있는 온톨로지 형태로 표현하고, 이를 자동화된 기계(컴퓨터)가 처리하도록 하는 기술이다. 이 논문에서는 웹 2.0의 대표기술이라 할 수 있는 온톨로지 기법을 이용, 기존 태그의 정보 분류 효율을 높이기 위한 태그와 태그의 의미관계 형성을 제안하였다.

A Study on the information architecture and menu design in the type of web sites (웹사이트의 유형 분류에 따른 정보 설계 및 메뉴디자인의 특성 연구)

  • 배윤선;이현주
    • Archives of design research
    • /
    • v.16 no.1
    • /
    • pp.241-250
    • /
    • 2003
  • With the increasing number and variety of internet users as well as the development of internet technology, web contents have been taking a more comprehensive, integrated, and practical form. This change has brought to our attention the importance of the information architecture and menu design, both of which are required for the users to navigate vast amount of data promptly, correctly and easily for effective communication in the web sites. In this study, web sites were categorized by the service levels provided to the users, and sampling was performed accordingly. Then, information architecture, the layout and the presentation of the menu design were analyzed. The result of the analysis show that there are distinguishable characteristics in how the menus were expressed and designed, and that these characteristics reflect the users' characteristics in the web interface menu design. With the result of this study, we present a guideline for information architecture and web interface menu design, which reflects user characteristics thereby strengthening usability. Using this guideline, we expect the development of web interface design which should support more efficient communication on the web.

  • PDF

Performance Analysis of Automatic Music Genre Classification with Different Genre Data (음악 장르 분류법에 따른 자동판별 성능분석)

  • Song, Min-Kyun;Moon, Chang-Bae;Kim, Hyun-Soo;Kim, Byeong-Man
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.288-291
    • /
    • 2011
  • 기존 음악 장르 분류의 경우 음악의 특징 추출 또는 기계학습을 중점적으로 연구되어왔다. 하지만 자동 분류에 필요한 장르 데이터는 음악을 제공하는 웹 사이트마다 다르고, 각 웹 사이트의 장르 분류는 해당 음악이 아닌 앨범의 장르를 표시한다. 보다 나은 자동 분류를 위해서는 일관된 장르 데이터의 제공이 필요한데, 본 논문에서는 이러한 연구의 일환으로 여러 웹사이트에서 수집한 장르 데이터에 따른 판별 성능을 분석하였다. 분석 결과 장르 분류 방법에 따라 신경망 학습 및 판별성능이 큰 차이가 발생하였다.

Web Document Clustering for Specific Subject Information Using WordNet and HTML Tags (WordNet과 HTML 태그를 활용한 특정영역 정보의 웹 문서 분류)

  • 조은휘;변영태
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.28-32
    • /
    • 2002
  • 웹 상의 많은 정보들 속에서 사용자가 원하는 정보를 찾아내는 일은 쉽지 않다. 사용자가 의도하는 양질의 정보 제공을 위해 특정 영역과 관련한 정보 제공 시스템이 .개발되고 있다. 이전 시스템은 특정 영역 관련 지식베이스를 토대로 하여 웹 문서를 수집해 놓고, 사용자에게 정보를 제공한다. 본 논문에서는 전문 사이트 내에 문서간의 유사성을 토대로 하여 동물 영역에 대한 효과적인 문서 클러스타링(clustering)에 관해 실험하였다. 기존의 방법에서는 문서의 분류나 질의어와 관련한 문서 선택이나 순위 결정이 주로 텀(term)을 바탕으로 하고 있다. 본 논문에서는 각 문서 내의 텀 뿐만 아니라 HTML 태그(tag), 지식베이스에 WordNet의 계층구조를 적용한 data를 활용하고, SVD(Singular Value Decomposition)를 사용하여 문서간의 관계를 밝혀내어 문서 분류 및 수집에 이용하였다. 특정 영역의 전문 문서를 많이 제공하는 사이트에 적용하여 좋은 결과를 볼 수 있었다.

  • PDF