• 제목/요약/키워드: 웹분류

검색결과 894건 처리시간 0.026초

웹 개인화를 통한 자동화된 뉴스레터 시스템 (Automatic Newsletter System with Web Personalization)

  • 김계숙;박우수;권오현;박규석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.389-392
    • /
    • 2001
  • 본 논문에서는 웹 데이터 마이닝을 통하여 웹 사이트를 방문한 사용자의 컨텐츠 유형에 따른 정보를 조사하고, 필터링 과정을 통해 분류화하고, 이러한 과정을 통해 얻은 정보를 이용하여 뉴스레터를 발송하며, 발송된 뉴스레터로부터의 컨텐츠 유형에 따른 CTR(Click Through Rate)과 사용자 반응을 추적하여 이러한 정보를 분석하고 사용자 프로파일 및 웹 사이트로부터 분류화된 정보, 그리고 추적된 정보와 함께 뉴스레터 컨텐츠를 재구성하는 개인화된 자동화 뉴스레터 시스템을 설계하고 구현한다.

  • PDF

패싯 분석을 이용한 웹 자원의 조직 (A Study on Organizing the Web Using Facet Analysis)

  • 유영준
    • 한국비블리아학회지
    • /
    • 제15권1호
    • /
    • pp.23-41
    • /
    • 2004
  • 웹 자원을 색인 및 조직하는 데에는 키워드 추출에 기반한 자동색인에 의한 방법과 기존의 분류 체계나 주제별 디렉토리를 이용하는 방법이 있다. 그러나 두 방법은 각각 표준적인 방식이 없거나 분류 구조상의 불합리성으로 인하여 이용자의 정보 요구에 제대로 대처하지 못하고 있다. 따라서 이 논문에서는 기존 분류 체계의 구조상의 한계와 특정성과 망라성과 같은 웹 자원의 특성과 관련된 문제를 지적함과 더불어 패싯 분석에 의한 웹 자원 조직의 타당성과 그 장단점을 기술하였다. 그리고 패싯 분석을 이용 한 구체적인 방법론 세 가지를 제시하였다. 첫째, 패싯 분석을 기반으로 한 색인 시스템, 둘째, 열거형 분류 체계를 패싯 분류 체계로 구조를 수정한 대안, 셋째, 국내 검색 엔진의 주제별 디렉토리의 패싯 모형 등이다. 이러한 방법론들을 검토한 결과, 패싯 분석에 의한 통제어휘 구축이 웹 자원을 조직하는 수단으로 활용될 수 있는 가능성을 제시하였다.

  • PDF

다중 구조적응 자기구성지도의 퍼지결합을 이용한 웹 마이닝 (Web Mining Using Fuzzy Integration of Multiple Structure Adaptive Self-Organizing Maps)

  • 김경중;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.61-70
    • /
    • 2004
  • 폭발적으로 성장하고 있는 웹은 수백만 개의 웹 문서를 포함하고 있기 때문에, 적절한 웹사이트를 찾기 어렵다. 사용자 프로파일을 사용하여 적절한 웹사이트를 추천함으로써 웹의 탐색을 개인화 할 수도 있지만 웹 컨텐츠에 대한 사용자의 평가는 사용자의 성격에 관한 다양한 측면을 표현하므로 사용자의 선호도를 예측하기 위해서는 보다 효과적인 방법이 필요하다. 사용자 프로파일은 비선형적인 특성을 가지고 있으므로 분류기를 사용하여 예측하여야 하며 다양한 특성을 예측하기 위해 분류기의 결합이 필요하다. 패턴분류와 시각화에 유용한 구조적응 자기구성지도(SASOM)는 개선된 SOM 모델로서 웹 마이닝에 적절하다. 퍼지 적분은 주관적으로 정의된 분류기의 중요도를 이용하여 결합하는 방법이다. 본 논문에서는 독립적으로 학습된 SASOM의 퍼지적분(fuzzy integral)기반 결합을 이용하여 사용자의 프로파일을 예측하고 UCI 벤치마크 데이타인 Syskill & Webert 데이타를 사용하여 그 성능을 평가한다. 실험결과 제안한 방법이 기존의 naive Bayes 분류기뿐만 아니라 SASOM의 투표결합보다 우수한 성능을 보였다.

군사학 분야 웹 문서 분류체계의 설계 (A Design of Classification System for Military Information Resources on the Internet)

  • 오동근;황재영;배영활
    • 한국도서관정보학회지
    • /
    • 제32권2호
    • /
    • pp.323-347
    • /
    • 2001
  • 이 연구는 군사학 분야의 인터넷 학술정보자원을 효율적으로 조직, 활용하기 위한 청문서 분류체계의 모형을 제시하기 위해 시도된 것이다. 이를 위해, 우선 일반문헌분류표 가운데 군사정보에 관한 항목을 상세하게 전개하고 있는 LCC의 Class U(Military Science)와 Class V(Naval Class)를 상세히 분석하고, 웹 문서 분류체계 중 체계적 분류방식을 도입하고 있는 Yahoo!의 분류항목(처음/정부/군사)을 비교 분석하였다. 아울러 웹 문서 분류체계의 새로운 설계를 위해 기존의 Yahoo! Korea와 심마니, Yahoo! US를 종합적으로 비교 분석하였다. 이와 같은 비교 분석의 결과를 바탕으로, 실제적인 분류체계의 모형을 제시하였다.

  • PDF

유전자알고리즘과 신경망을 이용한 웹 서비스 정보 클러스터링 (Web Service Information Clustering using Genetic Algorithm and Neural Network)

  • 김진성;정혜진;유춘식;김용성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.447-450
    • /
    • 2005
  • 오늘날 웹서비스에 대한 정보 검색 시스템들은 UDDI 레지스트리에 대한 전문적인 지식을 필요로 한다. 즉 웹서비스를 명세하기 위해 사용된 카테고리와 이에 대한 값, 이름 등을 사전에 알고 있어야만 검색이 가능하다. 그러나 일반 사용자들은 이러한 사전지식을 충분히 알고 있지 못하기 때문에 웹서비스에 대한 정보 검색이 쉽지가 않다. 그러므로 일반 사용자들을 위해 웹서비스에 대한 정보를 카테고리에 맞게 분류하면 웹서비스 검색을 보다 용이하게 할 수가 있다. 따라서 본 논문에서는 유전자 알고리즘과 신경망을 이용하여 보다 효율적으로 웹서비스 정보를 분류하는 클러스터링 기법을 제안한다.

  • PDF

퍼지 이론을 이용한 웹 에이전트의 정보 분류 평가에 관한 연구 (A Study on Information Classification Evaluation of Web Agent Using Fuzzy Theory)

  • 김두완;정구범;정환묵
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.361-364
    • /
    • 2004
  • 인터넷의 급격한 보급으로 다양하고 많은 종류의 유용한 정보를 이용할 수 있게 되었다. 이와 같은 정보의 바다에서 원하는 정보를 검색하고 이를 관리하고 사용하는 것은 매우 어렵다 이러한 문제를 해결하기 위해 검색엔진, 메타검색 엔진, 스파이더, 지능 에이전트 혹은 웹 에이전트와 같은 여러 종류의 시스템들이 개발되고 있다. 이와 같은 시스템들은 지능 에이전트로써 정보의 과부하를 피하기 위해 사용되어지고 있다. 소프트웨어 에이전트들을 효율적으로 개선하기 위해서는 검색된 데이터를 표현하고 분류하는 것이 필요하다. 또한, 분류기를 생성할 수 있는 지능 에이전트들의 성능을 개선하기 위해 퍼지 이론을 적용하여, 웹으로부터 다른 검색 정보와의 적합성을 평가하고, 사용자에게 가장 적합한 정보를 분류하기 위한 방법을 제안한다.

  • PDF

SVM을 활용한 악성 웹 페이지 분류 (Classification of Malicious Web Pages by Using SVM)

  • 황영섭;문재찬;조성제
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.77-83
    • /
    • 2012
  • 웹 페이지에서 다양한 서비스를 제공하면서 악성코드가 웹 페이지를 통해 배포되는 것도 늘어났다. 악성코드는 개인정보 유출, 시스템의 성능저하, 시스템의 좀비 피씨화 등의 피해를 입힌다. 이런 피해를 막으려면 악성코드가 있는 웹 페이지의 접근을 막아야 한다. 그런데 웹 페이지에 있는 악성코드는 난독화나 변형기법으로 위장하고 있어 기존 안티바이러스 소프트웨어가 사용하는 시그니처 방식의 접근법으로 찾아내기 어렵다. 이를 해결하기 위하여, 웹 페이지를 분석하여 악성 웹 페이지와 양성 웹 페이지를 구별하기 위한 특징을 추출하고, 기계 학습법으로 널리 사용되는 SVM을 통하여 악성 웹 페이지를 분류하는 방법을 제안한다. 제안하는 방법이 우수함을 실험을 통하여 보인다. 제안한 방법으로 악성 웹 페이지를 정확히 분류하면 웹 페이지를 통한악성코드의 배포를 막는데 이바지할 것이다.

복합 분류기를 이용한 웹 문서 범주화에 관한 실험적 연구 (An Experimental Study on Categorization of Web Documents Using an Ensemble Classifier)

  • 이혜원;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.73-82
    • /
    • 2003
  • 본 연구에서는 웹 문서를 분류하기 위해 문서로부터 다양한 자질을 추출하고, 두 가지의 분류기를 통해 여러 개의 분류 예측치를 구한 다음, 그것들을 하나의 결과물로 통합하는 복합분류기를 사용하였다. 먼저 다양한 자질 집합에 대해 일반적으로 많이 사용되는 kNN(k nearest neighbor) 분류기와 나이브 베이즈(Naive Bayes) 분류기를 사용한 범주화 실험을 수행하고, 실험을 통해 나온 범주 예측치를 통합하는 복합 분류기들의 성능을 비교하였다. 또한 단일 분류기들을 통해 나온 모든 범주 예측치를 통합하는 과정을 수행하여, 단일 분류기만을 사용할 경우와 복합 분류기를 사용할 경우를 비교해 더 좋은 성능을 나타내는 분류기를 밝히고자 한다.

  • PDF

웹 페이지 클러스터를 이용한 사용자 분류 기법 (User Classification Using Cluster of Web Pages)

  • 백옥현;서성보;이준욱;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.201-203
    • /
    • 2000
  • 변화하는 경쟁적 인터넷 환경에서 E-Business의 성공적인 운영은 웹 사이트를 이용하는 고객들의 행위를 얼마나 잘 이해하느냐에 달려있다. 폭발적으로 늘어나는 웹 사이트 중에서 많은 사용자들을 유치하고 유지하기 위해서는 고객 개개인의 특성을 분석해서 특성화된 특성화된 서비스를 제공하는 것이 중요하다. 이 논문에서는 웹 서버에 의해 수집되는 로그파일로부터 사용자들이 빈번하게 함께 접근하는 페이지들을 기반으로 웹 페이지에 대한 클러스터링을 수행하고 이러한 웹 페이지의 클러스터를 이용해서 유사한 행동패턴을 가진 사용자들을 분류함으로써 특성화된 서비스를 제공하기 위한 일련의 기법들을 제안한다. 특히 클러스터링을 수행하는 웹 로그에 시간적인 요소를 고려한 제약조건을 둠으로써 좀더 유용한 지식을 찾아낼 수 있는 방안을 제시한다.

  • PDF

기독교 분야 웹문서 분류체계 설계를 위한 비교 분석적 고찰 (A Comparative Study on the Design of Classification System for Christian Information Resources on the Internet)

  • 김명옥
    • 한국문헌정보학회지
    • /
    • 제41권3호
    • /
    • pp.127-144
    • /
    • 2007
  • 이 연구는 기독교 분야 인터넷 정보자원을 효율적으로 조직. 활용하기 위하여 기독교 분야 웹문서 분류체계의 모형을 제시하기 위한 것이다. 이를 위하여 (1) 문헌분류표인 KDC 4판, DDC 22판, LCC 2000년판의 기독교 분야의 강목을 비교 분석하고. (2) 국내 종합포털사이트 중 기독교 분야의 웹사이트 수가 많은 다음, 엠파스, 네이버의 기독교 분류항목을 비교 분석하며, (3) 기독교 종합포털사이트 중 가장 많이 이용되는 갓피플, 기독정보탐색 갓피아의 분류항목을 비교 분석하고, (4) KDC, DDC와 갓피플의 강목을 비교 분석한다. (5) 분석 결과를 토대로 웹문서를 위한 기독교 분야 분류체계(안)을 제시한다. 본 연구 결과, 1차구분은 10개 항목을 배정하고, 그 하위항목으로 2차 구분하여 세분한 2단계 계층구조를 설계하였다.