• 제목/요약/키워드: 북 마크 분류

검색결과 11건 처리시간 0.02초

BClassifier : 나이브 베이지안 학습법에 기초한 북마크 분류 에이전트 (BClassifier : A Bookmark-Classification Agent Based on Naive Bayesian Learning Method)

  • 최정민;김인철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.81-83
    • /
    • 2000
  • 최근 고성능 PC의 보급과 네트워크의 발달로 인하여 인터넷의 가용 정보가 폭발적으로 증가하고 있다. 이러한 추세에 따라 우리는 인터넷을 사용하여 많은 정보를 얻고 있다. 그러나 인터넷에 존재하는 정보는 수많은 웹 서버에 주소(URL)를 가지고 존재하게 되는데 사용자는 자신이 관심 있는 정보의 사이트를 재방문하기 위하여 웹 브라우저 북 마크 기능을 사용한다. 그러나, 북 마크를 효율적으로 사용하기 위해서는 북 마크 분류, 수정, 편집, 정렬등의 북 마크 관리가 필수적이지만 이와 같은 북 마크 관리 작업이 전반적으로 수작업으로 이루어져야 하는 단점이 있다. 이러한 문제점을 해결하기 위한 한가지 방법으로 웹 문서 분류를 위한 기계학습법을 적용하여 사용자의 북 마크를 카테고리별로 자동으로 분류, 재정렬해주는 북 마크 자동 분류 에이전트를 개발하고자 한다. 대표적인 분류 에이전트 시스템으로는 전자우편 분류 에이전트인 Maxims, 뉴스 기사 분류 에이전트인 NewT, 엔터테인먼트 선별 에이전트인 Ringo 등이 있으며, 이러한 시스템들은 분류 대상과 분류 방법, 기능 등에서 차이를 보이고 있다. 본 논문에서는 대표적인 교사학습 방법인 나이브 베이지안 학습법을 사용하여 북 마크를 자동으로 분류하는 북 마크 자동 분류 에이전트를 설계, 구현하였다.

  • PDF

나이브 베이지안 학습법에 기초한 북마크 분류 에이전트 (Bookmark Classification Agent Based on Naive Bayesian Learning Method)

  • 최정민;김인철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.405-408
    • /
    • 2000
  • 최근 인터넷의 발전으로 많은 정보와 지식을 우리는 인터넷에서 제공받을 수 있게되었다. 인터넷에 존재하는 정보는 수많은 웹서버에 산재되어 있으며, 정보의 위치는 주소(URL)를 가지고 존재하게 되는데 사용자는 자신이 관심있는 정보의 주소를 저장하기 위하여 웹브라우저 북마크(Bookmark)기능을 사용한다. 그러나 북마크 기능은 웹문서의 주소 저장에 일차적인 목적을 두고 있으며, 이후 북마크의 개수가 증가하면, 사용자는 북마크관리가 어렵게되므로 사용자 북마크 파일을 자동으로 분류하여 관리할수 있는 에이전트 기술을 사용하고자 한다. 대표적인 분류에이전트 시스템으로는 전자우편 분류 에이전트인 Maxims, 뉴스기사 분류 에이전트인 NewT, 엔터테인먼트(Entertainment) 선별 에이전트인 Ringo 등이 있다. 이러한 시스템들은 분류할 대상에 따라 조금씩 다른 모습의 에이전트 기능을 보이고 있으며, 본 논문은 기계학습 이론중 교사학습 알고리즘인 나이브 베이지안 학습방법(Naive Bayesian Learning method)을 사용하여 사용자가 분류하지 못한 북마크를 자동으로 분류하는 단일 에이전트 기반 북마크 분류기를 설계, 구현하고자한다.

  • PDF

북 마크 자동 분류를 위한 학습 에이전트 (A Learning Agent for Automatic Bookmark Classification)

  • 김인철;조수선
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.455-462
    • /
    • 2001
  • 웹은 이제 인터넷의 중요한 서비스중의 하나가 되었다. 웹 공간을 탐색할 때 사용자들은 항해하는 동한 만나는 흥미 있는 사이트들을 기록하기 위해 북 마크 기능을 이용한다. 북 마크 기능을 이용할때 겪는 문제중의 하나가 거듭된 새로운 북 마크의 추가로 인해 북 마크 리스트의 길이가 길어지면 북 마크 리스트가 일관성 있는 구성을 잃어버리게 되어 실제적인 도움을 주기 어렵다는 것이다. 사용자가 북 마크 파일을 효율적이고 체계적으로 유지하기 위해서는 북 마크 파일에 추가되는 새로운 북 마크들을 카테고리별로 분류하여 신규 폴더를 찾아 삽입해주어야 한다. 본 논문에서는 대응되는 웹 문서들을 다운 받아 내용을 분서함으로써 자동으로 북 마크를 분류하는 BClassifier라 불리는 학습에이전트를 소개한다. BClassifier 에이전트를 위한 훈련 예의 주된 공급원은 바로 사용자가 명시적으로 이미 주제에 따라 몇 개의 북 마크 폴더들로 분류해놓은 북 마크들이다. 여기에 주제 카테고리들을 확대하고 이들에 대한 훈련 문서들을 확보하기 위해 추가적으로 Yahoo 사이트의 최상휘 카테고리들로부터 웹 문서들을 수집하여 훈련 예에 포함시킨다. BClassifier 에이전트는 잘 알여진 확률기반의 분류 기술이나 나이브 베이지안 학습 방법을 채용하고 있다. 본 논문에서는 BClassifier 에이전트에 관한 몇 가지 실험 결과를 소개하고 평가한다. 나이브 베이지안 방법과 k-최근접 이웃 방법, TFIDF 등과 같은 서로 다른 학습 방법들과 비교 실험 결과도 제시한다.

  • PDF

사용자 편의를 위한 북 마크 에이전트 (A User-oriented Bookmark Agent)

  • 강상구;정현섭;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.244-246
    • /
    • 2001
  • 본 논문에서는 사용자가 관심 있는 문서를 카테고리별로 직접 분류해서 추가하던 작업을 자동으로 분류하고 추가할 수 있는 북 마크 에이전트를 제안한다. 북 마친 에이전트는 사용자가 브라우징 시 사용자 성향을 분석하여 관심 있는 문서를 얻을 수 있다. 문서 내에서 특징을 찾기 위해 TF.IBF를 사용하였으며 또한 단어의 가중치 부여와 유사도를 계산하기 위해 벡터 공간 모델을 사용하였다. 이 작업을 통해 부정적인 문서의 URL이 추가될 수 있으며 이러한 문제를 해결하기 위해서 사용자의 피드백을 이용하여 제거할 수 있도록 하였다.

  • PDF

소셜 북마킹 시스템에서의 북마크와 태그 정보를 활용한 웹 콘텐츠 랭킹 알고리즘 (A Web Contents Ranking Algorithm using Bookmarks and Tag Information on Social Bookmarking System)

  • 박수진;이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제13권8호
    • /
    • pp.1245-1255
    • /
    • 2010
  • 현재 웹 2.0 환경에서의 핵심 기술 중 하나는 사용자가 관심 있는 웹페이지를 태깅 및 북마킹 하는 소셜 북마킹 기술이다. 소셜 북마킹은 웹 콘텐츠에 태깅된 북마크 정보 및 태깅 결과를 기반으로 검색, 분류, 공유를 통해 효율적인 정보 제공을 주목적으로 하고 있다. 그러나 현재 소셜 북마킹 시스템들은 웹 콘텐츠의 사용자들의 관심 정도를 측정할 수 있는 북마크 수 및 검색과 분류를 목적으로 하는 태그 정보를 각각 독립적으로 검색에 활용하는 방식을 사용하고 있다. 이는 소셜 북마킹 시스템에서 중요한 특징을 가지는 북마크와 태깅 기술을 효율적으로 활용하지 못하는 결과가 된다. 이에 본 연구에서는 태그 클러스터링을 통한 연관 태그 추출에 관한 선행연구를 기반으로, 북마크 정보와 혼합하기 위한 웹 콘텐츠 랭킹 알고리즘을 제안하였다. 또한 제안 알고리즘의 효율성 분석을 위해 기존 검색 방법론들과의 비교평가를 시행하였으며, 그 결과 본 연구의 핵심적인 특징인 북마크와 태그 정보를 함께 활용한 소셜 북마크 시스템이 기존 시스템보다 효율적인 검색결과를 도출하였다.

브라우저 북마크 분류를 키워드로 사용하는 웹페이지 공유를 위한 협동적 URL 태깅 방식 (A Collaborative URL Tagging Scheme using Browser Bookmark Categories as Keyword Support for Webpage Sharing)

  • 니코 엔카나시온;양현호
    • 한국전자통신학회논문지
    • /
    • 제8권12호
    • /
    • pp.1911-1916
    • /
    • 2013
  • 소셜 태깅 시스템이 직면한 중요한 과제 중 하나는 급격하게 증가하는 태그의 양적 증가와 다양성에 대한 대처방안이다. 구조화된 주석 시스템과는 반대로 태그는 사용자에게 웹 콘텐츠에 주석을 달고 조직화하는 비구조적, 개방적 메커니즘을 제공한다. 본 논문에서는 사용자 정의 태그, URL 키워드, 그리고 분류 폴더 이름을 주요 구성 요소로 하는 폭소노미 기반의 URL 추천 방식을 제안한다. 이 방식은 더욱 개선되어 브라우저의 확장 기능으로 구성될 경우 사용자에게 특정 URL을 분류하는 최상의 방안을 제안할 수 있다.

연관 태그 및 유사 사용자 가중치를 이용한 웹 콘텐츠 랭킹 시스템 (A Web Contents Ranking System using Related Tag & Similar User Weight)

  • 박수진;이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제14권4호
    • /
    • pp.567-576
    • /
    • 2011
  • 웹 2.0의 발전에 따라 다양한 기술들이 제공되며 그 중 대두되는 기술로 사용자가 관심 있는 웹페이지를 태깅 및 북마킹하는 소셜 북마킹 기술이다. 그러나 현재 소셜 북마킹 시스템들은 웹 콘텐츠의 중요 정보인 다른 사용자들의 관심 정도를 측정할 수 있는 북마크 수 및 검색과 분류를 목적으로 하는 태그 정보를 각각 독립적으로 검색에 활용하며 또한, 다른 사용자들과의 유사도를 반영하지 못하여 소셜 북마킹 시스템의 특징을 반영하지 못한 검색결과를 도출하고 있는 실정이다. 이에 본 연구에서는 선행 연구를 기반으로 태그 클러스터링을 통한 연관 태그 추출 및 북마크 정보와 다른 사용자의 유사도를 혼합한 웹 콘텐츠 랭킹 알고리즘을 제안하였다. 또한 제안 알고리즘의 효율성 분석을 위해 기존 검색 방법론 및 선행 연구의 방법론과의 비교평가를 시행하였으며, 그 결과 본 연구의 핵심적인 특징인 태그 정보 및 북마크 수와 유사도를 활용한 방법이 기존 방법론보다 효율적인 결과를 도출하였다.

VD Special-당신의 성공과 마음의 休를 위한 그곳, 즐겨찾기

  • 벤처기업협회
    • 벤처다이제스트
    • /
    • 통권55호
    • /
    • pp.12-15
    • /
    • 2004
  • 쉽게 지치는 더운 여름, 몸도 마음도 쉽게 나른해지는 무기력증이 엄습한다. 일이 손에 잡히지 않고 입맛도 없고 모든 게 지루하게만 느껴지는 이때, 목 넘김이 좋은 맥주처럼 상쾌함을 제공해줄 즐거운 청량제를 찾아보는 건 어떨까. 그동안 틈틈이 북마크해둔 나만의 즐겨찾기 목록을 점검하고 직접 서핑에 나서보는 것. 그렇다면 나만의 폴더 관리를 위한 항목별 분류 작업부터 시작해보자.

  • PDF

개인 맞춤형 뉴스 추천 시스템의 설계 및 개발 (Design and Development of a Personalized News Recommendation System)

  • 유영서;이지민;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.599-602
    • /
    • 2016
  • 실시간으로 뉴스 기사를 제공하는 온라인 뉴스 시스템이 널리 사용되면서, 사람들은 매 순간 속보와 새로운 뉴스 등 대량의 뉴스 기사에 노출되어 있다. 하지만 방대한 뉴스들로부터 사용자가 원하는 뉴스를 찾는 것은 매우 어려운 일이다. 따라서 개인 관심사에 따라 뉴스를 추천해주는 개인 맞춤형 뉴스 추천 시스템의 필요성이 증가되고 있다. 본 논문에서는 사용자의 관심사를 분석하여, 사용자의 관심사에 따라 관련된 뉴스를 자동으로 추천해주는 뉴스 추천 시스템을 설계 및 개발한다. 제안 시스템은 각 사용자가 북마크한 뉴스 기사와 읽은 뉴스 기사를 클러스터링하여 사용자별 프로파일을 생성한다. 또한 전체 뉴스 기사들을 클러스터링하여 주제 별로 분류한다. 사용자에게 뉴스를 추천하기 위해, 제안 시스템은 해당 사용자 프로파일에 포함된 각 클러스터에 대해 전체 뉴스 기사에 대한 클러스터들 중 가장 가까운 클러스터를 찾아 해당 클러스터 내의 뉴스 기사들을 거리 순으로 추천한다. 실제 구현된 시스템을 통해, 제안한 뉴스 추천 시스템이 각 개인에게 뉴스를 효과적으로 추천함을 보인다.

소셜 복마킹 시스템의 스패머 탐지를 위한 기계학습 기술의 성능 비교 (Comparative Study of Machine learning Techniques for Spammer Detection in Social Bookmarking Systems)

  • 김찬주;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.345-349
    • /
    • 2009
  • 소결 북마킹(social bookmarking) 시스템은 사용자가 북마크를 저장하고 공유할 수 있는 플랫폼을 제공하는 웹 기반(web-based) 시스템으로 폭소노미(folksonomy)를 이용한 대표적인 웹2.0 서비스이다. 소셜 북마킹 시스템에서의 스패머(spammer)란 자신들의 이익을 위해서 시스템을 고의적으로 악용하는 사람을 말한다. 스패머는 많은 양의 잘못된 정보를 시스템에 포스팅(posting)하기 때문에 전체 소셜 북마킹 시스템의 리소스(resource)를 쓸모없게 만들어 버린다. 따라서, 스패머를 빠른 시간 안에 탐지하고 그들의 접근을 차단하는 것은 시스템의 붕괴를 방지하기 위해 중요하다. 본 논문에서는 사용자가 사용한 태그에 대한 데이터를 추출하여, 사용자가 스패머 인지 아닌지를 예측하는 모델을 기계학습의 다양한 방법을 적용하여 생성한 후 그 성능을 비교해 보았다. 구체적으로, 결정테이블 (decision table, DT), 결정트리(decision tree, ID3), 나이브 베이즈 분류기($na{\ddot{i}}ve$ Bayes classifier), TAN(tree-augmented $na{\ddot{i}}ve$ Bayes) 분류기, 인공신경망(artificial neural network)의 방법을 비교하였다. 그 결과 AUC(area under the ROC curve)와 모델 생성시간을 고려하였을 때 나이브 베이즈 분류기가 가장 만족할 만한 성능을 보였다. 나이브 베이즈 분류기의 분류 결과가 가장 좋았던 이유는 성능을 비교하는 데 사용된 AUC가 결정트리 계열의 방법(ID3 등)보다 나이브 베이즈 분류기에서 일반적으로 높게 나오는 경향이 있다는 것과, 스패머 탐지 문제가 선형으로 분리 가능한 경우(lineally separable)와 유사할 가능성이 높기 때문으로 여겨진다.