• 제목/요약/키워드: Web contents mining

검색결과 71건 처리시간 0.024초

웹2.0에서 의견정보의 실시간 모니터링을 위한 웹 콘텐츠 마이닝 시스템 (Web Contents Mining System for Real-Time Monitoring of Opinion Information based on Web 2.0)

  • 김영춘;주해종;최혜길;조문택;김영백;이상용
    • 한국지능시스템학회논문지
    • /
    • 제21권1호
    • /
    • pp.68-79
    • /
    • 2011
  • 본 연구에서 제안하는 시스템은 인터넷 상에 존재하는 여러 웹사이트들에 흩어져 있는 웹 콘텐츠에서 사용자 의견 정보들을 자동 추출 및 분석함으로써, 긍정/부정 의견별로 검색 및 통계를 확인할 수 있는 의견 검색 서비스를 제공한다. 그 결과 의견 검색 사용자들은 특정 키워드에 대하여 다른 사용자들의 의견을 손쉽게 한눈에 검색 및 모니터링하는 시스템을 용이하게 사용할 수 있으며, 웹 콘텐츠에서의 의견 추출 및 분석하는 기능을 제공받는다. 제안한 기법들은 다른 기법들과의 비교 실험을 수행하여 실제 성능이 우수함을 증명하였다. 성능 평가는 긍정/부정 의견 정보를 추출하는 기능의 성능 평가, 다국어 정보 검색을 위한 동적 윈도우 기법과 토크나이저 기법을 적용한 성능 평가, 그리고 정확한 다국어 음차표기를 추출 기법에 성능 평가를 실시하였다. 그 적용 사례로 대표적인 영화 리뷰 문장과 위키디피아 실험 데이터를 대상으로 실험하고 그 결과를 분석하였다.

효율적인 클러스터링을 이용한 관심 정보 추출을 위한 웹 마이닝 (Web Mining for Discovering Interesting Information using Effective Clustering)

  • 김성학;안병태
    • 디지털콘텐츠학회 논문지
    • /
    • 제9권2호
    • /
    • pp.251-260
    • /
    • 2008
  • 인터넷의 전자상거래에서 대규모 정보 저장소에 있는 원하는 정보를 신속하게 검색하기란 어렵다. 대부분의 전자상거래 사이트에 있어서 정보를 제공하는 방법으로는 통계적 분석이나 분류별 지향의 간단한 과정을 통해 생성된다. 그러나 이러한 것은 생성 정보들 사이의 다양한 상호관계를 표현할 수 없고 사용자의 정확한 구매 패턴을 반영하기 어렵다. 본 논문에서는 전자상거래에서 효과적인 클러스터링을 이용한 다양한 관심정보 추출을 위한 효율적인 웹 마이닝을 제안한다. 이러한 방법은 분류별 항목에서 순차 패턴과 상관 규칙을 이용하여 생성 정보들 사이의 보다 적합한 상관관계를 구성하고 제안된 방법을 통해 효율적인 실험 결과를 나타낸다. 그리고 효과적인 클러스터링을 이용하여 신속한 검색을 제안한다.

  • PDF

웹 사용 정보 마이닝 기반의 동적 사용자 프로파일 생성 (Generator of Dynamic User Profiles Based on Web Usage Mining)

  • 안계순;고세진;정준;이필규
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.389-390
    • /
    • 2002
  • 동적 웹 컨텐츠 제공에서 고객을 위한 추천서비스에 이르는 인터넷 기반의 전자상거래 애플리케이션에서는 고객이 어떤 성향을 가지고 있는가에 대한 정보를 획득하는 것이 중요하다. 웹 개인화의 대표적인 기술인 협력적 석과는 사용자의 정보를 정적인 프로파일 형태로 저장하여 사용자의 성향 변화를 빨리 획득할 수 없다. 또한 사용자의 명시적 평가 의존성, 확장성 부족, 다차원 공간 데이터에 대한 적용 어려움 둥의 문제점을 가지고 있다. 이와 같은 단점을 해결하기 위한 해결 방안으로 웹 사용 정보 마이닝(web usage mining)이 쓰이고 있다. 웹 사용 정보 마이닝은 서버에 축적된 웹 사용 데이터(web usage data)를 이용하여 패턴을 발견하는 기술이다. 특히 연관 규칙 생성 알고리즘으로 웹 사용 패턴(web usage pattern)을 찾고 패턴을 클러스터링하는 기술이 사용되고 있다. 그러나 연관 규칙 생성 알고리즘은 많은 수의 패턴들을 찾고 또 유용하지 못한 패턴을 발견하는 단점이 있다. 본 논문에서는 검증된 웹 사용 패턴을 이용한 동적 사용자 프로파일 생성 방법을 제안한다. 먼저 패턴 발견을 위해 연관 규칙 생성 알고리즘인 Apriori를 이용하고 사용자 프로파일을 위한 클러스터를 생성하기 위해 ARHP를 채택하였다. 클러스터를 생성하기 전에 Dempster-Shafer 이론을 이용하여 유용하지 못한 패턴을 제거하는 패턴 검증 과정을 수행한다. 검증된 패턴을 이용하여 클러스터를 생성하고 사용자의 현재 활성화된 세션에 따라 동적으로 사용자 프로파일이 생성된다

다중 구조적응 자기구성지도의 퍼지결합을 이용한 웹 마이닝 (Web Mining Using Fuzzy Integration of Multiple Structure Adaptive Self-Organizing Maps)

  • 김경중;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.61-70
    • /
    • 2004
  • 폭발적으로 성장하고 있는 웹은 수백만 개의 웹 문서를 포함하고 있기 때문에, 적절한 웹사이트를 찾기 어렵다. 사용자 프로파일을 사용하여 적절한 웹사이트를 추천함으로써 웹의 탐색을 개인화 할 수도 있지만 웹 컨텐츠에 대한 사용자의 평가는 사용자의 성격에 관한 다양한 측면을 표현하므로 사용자의 선호도를 예측하기 위해서는 보다 효과적인 방법이 필요하다. 사용자 프로파일은 비선형적인 특성을 가지고 있으므로 분류기를 사용하여 예측하여야 하며 다양한 특성을 예측하기 위해 분류기의 결합이 필요하다. 패턴분류와 시각화에 유용한 구조적응 자기구성지도(SASOM)는 개선된 SOM 모델로서 웹 마이닝에 적절하다. 퍼지 적분은 주관적으로 정의된 분류기의 중요도를 이용하여 결합하는 방법이다. 본 논문에서는 독립적으로 학습된 SASOM의 퍼지적분(fuzzy integral)기반 결합을 이용하여 사용자의 프로파일을 예측하고 UCI 벤치마크 데이타인 Syskill & Webert 데이타를 사용하여 그 성능을 평가한다. 실험결과 제안한 방법이 기존의 naive Bayes 분류기뿐만 아니라 SASOM의 투표결합보다 우수한 성능을 보였다.

A Technical Approach for Suggesting Research Directions in Telecommunications Policy

  • Oh, Junseok;Lee, Bong Gyou
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권12호
    • /
    • pp.4467-4488
    • /
    • 2014
  • The bibliometric analysis is widely used for understanding research domains, trends, and knowledge structures in a particular field. The analysis has majorly been used in the field of information science, and it is currently applied to other academic fields. This paper describes the analysis of academic literatures for classifying research domains and for suggesting empty research areas in the telecommunications policy. The application software is developed for retrieving Thomson Reuters' Web of Knowledge (WoK) data via web services. It also used for conducting text mining analysis from contents and citations of publications. We used three text mining techniques: the Keyword Extraction Algorithm (KEA) analysis, the co-occurrence analysis, and the citation analysis. Also, R software is used for visualizing the term frequencies and the co-occurrence network among publications. We found that policies related to social communication services, the distribution of telecommunications infrastructures, and more practical and data-driven analysis researches are conducted in a recent decade. The citation analysis results presented that the publications are generally received citations, but most of them did not receive high citations in the telecommunications policy. However, although recent publications did not receive high citations, the productivity of papers in terms of citations was increased in recent ten years compared to the researches before 2004. Also, the distribution methods of infrastructures, and the inequity and gap appeared as topics in important references. We proposed the necessity of new research domains since the analysis results implies that the decrease of political approaches for technical problems is an issue in past researches. Also, insufficient researches on policies for new technologies exist in the field of telecommunications. This research is significant in regard to the first bibliometric analysis with abstracts and citation data in telecommunications as well as the development of software which has functions of web services and text mining techniques. Further research will be conducted with Big Data techniques and more text mining techniques.

데이터마이닝 기법을 이용한 지능형 기자재 관리 시스템 설계 및 구현 (Design and Implementation of Intelligent Equipment Management System Using Data Mining)

  • 조영기;김상수;조주상;백성욱
    • 디지털콘텐츠학회 논문지
    • /
    • 제4권2호
    • /
    • pp.191-202
    • /
    • 2003
  • 본 논문에서는 디지털 콘텐츠 학과의 고가 장비들을 효율적으로 관리하기 위해 구축된 지능형 기자재 관리 시스템의 설계 및 구현사례를 제시한다. 시스템 운영을 지원 하기위해 사용자, 장비, 사용기록의 데이터를 기반으로 데이터마이닝을 수행했으며 데이터 마이닝 과정에서 나타난 여러 유용한 규칙들을 제시했다. 분석된 정보를 이용해 사용자 위주의 운영정책과 동적 인터페이스를 제공하기 위한 웹사이트의 개인화 계획을 제시하였다.

  • PDF

Novel Speech Web Architecture Based on Information Selection Agent

  • Kwon, Hyeong-Joon;Kinoshita, Tetsuo
    • International Journal of Advanced Culture Technology
    • /
    • 제1권1호
    • /
    • pp.11-14
    • /
    • 2013
  • In this paper, we propose a prototype of the SpeechWeb application using the information selection agent. We describe its design and implementation method and illustrated the processing results with the aid of some screenshots. Proposed SpeechWeb application presents the associated contents to the user by the aid of dynamic voice-anchors. These contents are presented using the apriori algorithm, which is one of data mining techniques. The application is better than the existing user-initiative structure from the viewpoint of making the user's interesting induction. Moreover, we believe that our proposed application is effective in information retrieval through wired and wireless telephone networks.

  • PDF

m-CRM을 위한 음악추천시스템: 웹 마이닝과 서열척도를 이용한 협업 필터링 (A Music Recommender System for m-CRM: Collaborative Filtering using Web Mining and Ordinal Scale)

  • 이석기
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.45-54
    • /
    • 2008
  • 모바일 웹 (Web)과 관련한 기술이 점점 발달함에 따라 모바일 전자상거래 시장, 그 중에서도 벨소리나 컬러링과 같은 음악 다운로드 시장의 크기는 괄목할 만한 성장을 거듭하고 있다. 하지만, 이러한 급성장에도 불구하고 소비자들은 여전히 자신이 원하는 음악을 찾는 과정에서 많은 불편함을 겪고 있다. 이는 소비자들의 음악에 대한 재구매율을 저하시키게 되고, 모바일 음악을 제공하는 서비스 업체 입장에서도 수익 정체의 원인으로 작용할 수 있다. 따라서 고객관계 관리 측면에서 모바일 고객의 불편을 최소화함으로써 결국 수익을 더욱 많이 창출하기 위한 새로운 방법이 절실한 상황이다. 이에 본 연구는 모바일 웹 환경 하에서 소비자들이 편리하게 자신이 원하는 음악을 검색할 수 있도록 하기 위하여, 모바일 웹 마이닝과 서열척도를 활용하는 협업 필터링 기반의 새로운 음악 추천 시스템을 제안한다. 또한 실험을 통해 우리가 제안하는 새로운 추천 시스템이 기존의 추천 시스템들에 비하여 우수한 성능을 나타냄을 입증하고자 한다.

  • PDF