• 제목/요약/키워드: 하이퍼링크 학습

검색결과 22건 처리시간 0.028초

하이퍼링크 정보를 위한 정보여과 시스템에서의 사용자 프로파일 학습 (Learning User Profile in Information Filtering Systemby Using Hyperlink Information)

  • 박민규;김준태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.66-68
    • /
    • 1999
  • 본 논문에서는 정보여과 시스템에서 웹 페이지를 수집하고 여과하는 과정과 사용자 프로파일을 학습하는 과정에 하이퍼링크 정보를 이용하는 방법을 제안한다. 사용자가 원하는 웹 페이지를 추천하기 위해 사용자 프로파일을 하이퍼링크 정보를 이용해 만들고 사용자의 반응(feedback)에 따라 사용자 프로파일을 조정한다. 가중치 조정에 있어서 학습 효과를 높이기 위해 사용자가 반응을 보인 웹 페이지에서 출발해 링크로 연결된 모든 페이지에 대해 깊이에 따라 가중치를 조정하는 가중치 전파 알고리즘(Weight Propagation Algorithm)을 제안한다. 적은 사용자의 반응으로도 프로파일 내의 많은 페이지에 영향을 줄 수 있어 높은 학습 효과를 기대할 수 있다.

  • PDF

웹 상에서 사용자 브라우징 행위를 이용한 하이퍼텍스트 네트워크 재구성 (Hypertext Networks Restructure using User Browsing Behaviors on WWW)

  • 백영태;이세훈
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권11호
    • /
    • pp.1365-1372
    • /
    • 2001
  • 이 연구는 사용자의 브라우징 행위에 따라 자동적으로 하이퍼텍스트 네트워크를 재구성하는 세 가지 학습 규칙을 제안하고, 실험적 시스템을 구현하였다. 시스템은 링크 가중치를 하이퍼링크 네트워크에 부여하고 학습 규칙에 따라 가중치를 변경한다. 학습 규칙은 하이퍼링크가 얼마나 자주 이용되고 있는지에 따라 해당 하이퍼링크의 가중치만 변경되며, 다른 하이퍼링크에는 영향을 미치지 않는다. 네트워크 구조의 변경은 링크 가중치의 내림차순에 따라 동적으로 링크가 배열되어 사용자에게 제시된다. 이것은 협력 필터링 기술의 장점과 탐색 지원 접근 방식을 혼합한 것이다. 실험을 위해 임의적인 하이퍼텍스트 네트워크를 만들고 사용자의 브라우징 선호에 따라 네트워크 구조가 변화되는 과정을 관찰한다.

  • PDF

점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 방법 (A Hypertext Categorization Method using Incrementally Computable Class Link Information)

  • 오효정;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권7호
    • /
    • pp.498-509
    • /
    • 2002
  • 본 논문은 하이퍼텍스트가 갖는 중요한 특성인 링크 정보를 활용한 문서 분류 모델을 제안한다. 제안된 모델의 주안점은 대상 문서와 링크로 연결된 이웃한 문서의 내용 및 범주를 분석하여 대상 문서 벡터를 조정하고, 이를 근거로 대상 문서가 어느 범주에 해당하는지를 결정한다. 또한, 이웃 문서에 포함된 용어를 반영함으로써 대상 문서의 내용을 확장 해석하고, 이웃 문서의 가용 분류 정보가 있는 경우 이를 참조함으로써 정확도 향상을 기한다. 이러한 접근 방법은 일반 웹 환경에 적용할 수 있는데, 특히 하이퍼텍스트를 주제별로 분류하여 관리하는 검색 엔진의 경우 매일 쏟아져 나오는 새로운 문서와 기존 문서간의 링크를 활용함으로써 전체 시스템의 점진적인 분류에 매우 유용하다. 제안된 모델을 검증하기 위하여 Reuter-21578과 계몽사(ETRl-Kyemong) 자료를 대상으로 실험한 결과 최고 18.5%의 성능 향상을 얻었다.

링크구조분석을 이용한 스팸메일 분류 (A Spam Mail Classification Using Link Structure Analysis)

  • 이신영;길아라;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.30-39
    • /
    • 2007
  • 기존의 내용기반 스팸메일 분류는 전자메일이 이미지를 많이 가지고 있고 텍스트는 적게 가지고 있을 경우에는 내용을 분석하기 어려우므로 스팸메일을 분류하는 데 한계가 있다. 이와 같은 문제를 해결하기 위하여 본 논문에서는 전자메일의 구조를 분석하는 링크구조분석 스팸메일 분류 알고리즘을 제안한다. 이것은 전자메일 안의 하이퍼링크의 개수와 하이퍼링크가 가리키는 웹 문서들이 다른 웹 문서에 의해 링크된 수를 측정하여 전자메일의 중요도를 계산한 후 의사결정트리를 학습하여 스팸메일과 정상메일을 분류한다. 또한 위의 링크구조분석 알고리즘과 하이퍼링크의 서버 주소만을 이용한 변형된 링크구조 분석 알고리즘, 그리고 SVM(support vector machine)을 이용한 내용기반 방법을 다수결 원칙으로 결합한 통합 스팸메일 분류 시스템을 제안한다. 실험 결과, 제안한 링크구조분석 알고리즘은 기존의 내용기반 방법 보다 스팸메일 분류 정확도가 94.8%로 약간 향상되었으며 또한 통합 스팸메일 분류 시스템도 내용기반 방법과 비교하여 향상된 97.7%를 나타냈다.

웹 기반 프로그래밍 교육 시스템의 설계 및 구현 (Web based Programming Education System)

  • 김영지;염용철;김현철;이원규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.67-69
    • /
    • 2005
  • 웹을 기반으로 한 프로그래밍 교육 시스템에 관하여 많은 연구가 이루어져 왔으나 대부분의 연구는 강의 노트의 제공 방법, 또는 하이퍼링크 상에서의 효과적인 네비게이션 방법과 같은 원격 교육 시스템에 국한된 내용이었다. 그러나 프로그래밍 교육은 그 특성상 강의노트의 제공 방법이나 하이퍼링크 상에서의 효과적인 네비게이션 방법보다도 많은 양의 과제를 통한 연습 기회의 제공과 각 과제에서의 교수자와 학습자간의 친밀하고 개인적인 상호작용이 학습자의 학업성취도에 더욱 큰 영향을 미친다. 본 논문에서는 원격 교육 시스템의 관점에서 더 나아가 교수자가 학습자에게 많은 양의 과제를 통한 연습의 기회를 부여 할 수 있고 각 과제당 교수자와 학습자간의 상호작용을 극대화할 수 있는 웹 기반 프로그래밍 교육 시스템을 구현하였다. 웹 기반 프로그래밍 교육 시스템은 학습자에게 시간과 장소에 구애됨이 없이 웹 브라우저를 이용하여 프로그램을 코딩하거나 컴파일할 수 있고 SPLINT를 통한 분석결과를 통해 즉시 피드백을 받을 수 있는 환경을 제공한다. 또한 교수자에게 많은 수의 학생들의 과제를 관리하고 교수자의 평가 기준에 의해 한꺼번에 자동으로 평가할 수 있는 환경을 제공하여 준다. 이러한 웹 기반 프로그래밍 교육 시스템은 웹을 이용한 프로그래밍 교육을 면대면 학습에 더욱 가깝게 만들어준다. 현재 웹 기반 프로그래밍 교육시스템은 K대학교 컴퓨터교육과 1학년 재학생들을 대상으로 한 C 프로그래밍 강좌에 사용되고 있다.

  • PDF

하이퍼링크 기반의 원격교육 시스템 (Distance Learning System on Hyperlink)

  • 강민혜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.956-961
    • /
    • 2000
  • 지금까지의 웹에서의 학습(실습과목에 대한) 상황은 정지된 이미지를 보고 그에 대한 설명을 학습자가 읽기만 하고 진행되는 시스템이다. 이는 '웹 활용 학습(Web Based Instruction)' 측면에서 볼 때 너무나도 정적이고 학습자 주도적이지 못한 학습 진행 상황이다. 따라서, 학습자의 성취도 또한 낮았다. 이러한 배경을 토대로 인터넷상에서의 실습 과목에 대한 학습진행 상황을 실제 상황과 똑같이 진행될 수 있도록 설계하였다. 진행 상황 화면을 하나씩 캡춰하여 그 이미지에 대한 이벤트 처리를 HTML과 DHTML, JavaScript를 통하여 구현하였다. 이로써, 학습자가 자신의 시스템에 프로그램이 설치되어있지 않아도, 또한 장소를 가리지 않고 인터넷에 접속하여 자기 주도적이고 동적인 학습을 진행할 수 있도록 하였다.

  • PDF

강화학습을 이용한 웹 정보 검색 (Web Information Search Using Reinforcement Learning)

  • 정태진;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.94-96
    • /
    • 2001
  • 현재 인터넷상에서 제공되고 있는 대부분의 서치엔진들은 정보소스에 접근해서 이를 가져오는 웹 로봇(webbot)이라고 불리우는 에이전트를 이용한다. 그런데 이런 웹 로봇들이 웹 문서를 검색하는 방법은 극히 단순하다. 물론 많은 정보를 가지고 오는 것에 초점이 맞추어져 있어서 정확도를 중시하지 않는 것에도 한 원인이 있다. 범용 검색엔진과는 달리 검색하는 영역을 축소하여 특정 주제에 관련된 정보만을 더 정확히 찾아주는 검색엔진의 필요성이 증가하고 있다. 이에 본 논문에서는 강화 학습 방법을 이용하여 웹 상에 존재하는 정보 중에서 특정 주제의 웹 페이지를 보다 더 정확히 찾는 방법을 제시한다. 강화 학습은 웹 상의 하이퍼링크를 따라가는 문제에 있어서 미래에 이로움을 주는 행동의 효용성을 측정하는데 있어서 이점을 보인다. 강화 학습을 이용하여 제시된 방법을 통한 실험에서는 일반적인 방법보다 더 적은 링크를 따라가고도 더 정확한 결과를 보였다.

  • PDF

특징선택과 특징가중의 융합을 통한 웹문서분류 성능의 개선 (Performance Improvement of Web Document Classification through Incorporation of Feature Selection and Weighting)

  • 이아람;김한준;현만
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.141-148
    • /
    • 2013
  • 기계학습을 이용한 자동분류시스템은 학습과정을 통해 분류모델을 구축하고 이를 기반으로 미분류 데이터를 특정 카테고리로 분류한다. 기계학습 기반 자동분류 시스템의 성능은 분류모델의 구성 인자인 특징의 품질에 크게 의존한다. 문서 데이터의 경우 특징 집합을 생성하기 위해 문서내의 출현단어와 문서의 구조적 정보를 활용한다. 특히 웹문서로부터 특징을 추출하기 위해 단어뿐만 아니라 태그, 하이퍼링크 정보를 분석할 수 있다. 최근 웹문서의 분류 기법에 대한 연구는 기계학습 알고리즘보다 특징 생성 및 가공 기술에 초점을 맞추고 있다. 이에 본 논문은 웹문서의 분류모델을 개선하기 위해 단어, 태그, 하이퍼링크 정보로부터 고품질의 특징을 선별 추출하여 가중치를 자동으로 부여하는 기법을 제안한다. Web-KB 문서집합을 이용한 다양한 실험을 통해 제안 기법의 우수성을 보인다.

워드넷 기반 특징 추상화를 통한 웹문서 자동분류시스템의 성능향상 (Improving Hypertext Classification Systems through WordNet-based Feature Abstraction)

  • 노준호;김한준;장재영
    • 한국전자거래학회지
    • /
    • 제18권2호
    • /
    • pp.95-110
    • /
    • 2013
  • 본 논문은 기계학습 기법에 기반한 웹문서 자동분류 시스템의 성능을 높이기 위한 새로운 형태의 특징가공 기법을 제안한다. 제안 기법은 하이퍼텍스트 웹문서에 대한 자동분류를 효과적으로 수행하기 위해 하이퍼링크 관계를 활용하여 특징 집합을 확장시킨다. 웹문서는 하이퍼링크 관계를 통해 서로 연결된 구조를 가지며, 그 관계는 많은 경우 연관도가 높은 문서들 간에 존재한다. 이러한 링크 정보가 분류모델의 주요 인자가 되는 특징 집합의 질을 높이는 중요한 역할을 수행할 수 있다. 제안 기법의 기본 아이디어는 워드넷 온톨로지를 기반으로 분류 대상 문서와 인접 문서들에 포함된 단어(특징)들 간의 의미적 유사도를 평가함으로써 다수의 특징들로 구성된 추상화된 개념적 특징을 생성하는 것이다. 여기서 유사도 함수는 워드넷 안에서 특징들 간의 상/하위어 관계 정보를 정량적으로 계산하게 된다. 분류모델의 구축시 추상화된 개념 특징은 일반 특징과 동일하게 간주하여 보다 정확한 분류 모델을 구축하는데 기여한다. Web-KB 문서집합을 이용한 실험을 통해 제안 기법이 기존 기법 보다 우수함을 보였다.

웹문서 자동 분류를 위한 하이퍼링크 기반 특징 가중치 부여 기법 (A Hyperlink-based Feature Weighting Technique for Web Document Classification)

  • 이아람;김한준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.417-420
    • /
    • 2012
  • 기계학습을 이용하는 문서 자동분류 시스템은 분류모델의 구성을 위해서 단어를 특징으로 사용한다. 자동분류 시스템의 성능을 높이기 위해 보다 의미있는 특징을 선택하여 분류모델을 구성하기 위한 여러 연구가 진행되고 있다. 특히 인터넷상에서 사용되는 웹문서는 단어 외에도 태그정보, 링크정보를 가지고 있다. 본 논문에서는 이 두 가지 정보를 이용하여 웹문서 자동분류 시스템의 성능을 향상 시키는 방법 제안 한다. 태그 정보와 링크 정보를 이용하여 적절한 특징을 선택하고, 각 특징의 중요도를 계산하여 가중치를 구한다. 계산된 가중치를 각 특징에 부여하여 분류 모델을 구성하고 나이브 베이지안 분류기를 통하여 성능을 평가하였다