• 제목/요약/키워드: 사용자 문서

검색결과 1,729건 처리시간 0.024초

사용자 적합성 피드백과 구루 평가 점수를 고려한 블로그 검색 방법 (Blog Search Method using User Relevance Feedback and Guru Estimation)

  • 정경석;박혁로
    • 정보처리학회논문지B
    • /
    • 제15B권5호
    • /
    • pp.487-492
    • /
    • 2008
  • 대부분의 웹 검색엔진은 문서의 적합도와 중요도를 함께 고려하는 순위화 방법을 사용한다. 문서의 적합도는 문서가 사용자의 검색의도를 만족시키는 정도이고, 중요도는 인기 있거나 양질의 내용을 포함하는 등 문서의 품질을 표시하는 정도라고 할 수 있다. 지금까지 웹 문서의 중요도를 평가하는 방법으로 가장 성공적인 것은 하이퍼링크 구조를 사용한 방법이다. 하지만 블로그의 경우, 해당 블로그를 작성한 블로거와 그 블로거가 소유하는 다른 문서들을 알 수 있기 때문에 문서의 중요도를 평가하는 다른 방법을 생각할 수 있다. 본 논문에서 제안하는 방법은 사용자의 북마크와 클릭를 이용하여 문서의 중요도를 계산하고, 그러한 문서 점수를 바탕으로 블로거의 구루점수를 계산한다. 마지막으로 문서를 순위화할 때 해당 문서를 작성한 구루의 구루 점수를 반영한다. 이렇게 되면 구루점수가 높은 구루 블로거의 문서들이 상위에 검색됨에 따라서 전반적으로 검색 품질이 개선될 수 있다. 블로그 문서를 대상으로 한 실험결과 제안하는 방법이 기존의 전통적인 웹 검색 성능과 비교하여 정답집합과의 연관성이 높음을 알 수 있었다.

Suffix Tree를 이용한 웹 문서 클러스터의 제목 생성 방법 성능 비교 (Performance Comparison of Keyword Extraction Methods for Web Document Cluster using Suffix Tree Clustering)

  • 염기종;권영식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.328-335
    • /
    • 2002
  • 최근 들어 인터넷 기술의 발달로 웹 상에 많은 자료들이 산재해 있습니다. 사용자가 원하는 정보를 검색하기 위해서 키워드 검색을 이용하고 있는데 이러한 키워드 검색은 사용자들이 입력한 단편적인 정보에 바탕하여 검색하고 검색된 결과들을 자체적인 기준으로 순위를 매겨 나열식으로 제시하고 있다. 이러한 경우 사용자들의 생각과는 다르게 결과가 제시될 수 있다. 따라서 사용자들의 검색 시간을 줄이고 편리하게 검색하기 위한 환경의 필요성이 높아지고 있다. 본 논문에서는 Suffix Tree 알고리즘을 사용하여 관련있는 문서들을 분류하고 각각의 분류된 클러스터에 제목을 생성하기 위하여 문서 빈도수, 단어 빈도수와 역문서 빈도수, 카이 검정, 공통 정보, 엔트로피 방법을 비교 평가하여 제목을 생성하는데 어떠한 방법이 가장 효과적인지 알아보기 위해 비교 평가해본 결과 문서빈도수가 TF-IDF보다 약 10%정도 성능이 좋은 결과를 보여주었다.

  • PDF

엘리먼트 정보 기반의 플러그인 XSLT 편집기 (XSLT Plugin Editor Based on Element analysis)

  • 곽동규;조용윤;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.751-753
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서가 다른 어플리케이션에서 재 사용될 경우, 사용자에게 동일한 정보를 제공하는데 있다. 문서를 변환하기 위해서는 변환 규칙을 정의해야 한다. 변환 규칙을 생성하기 위해서는 엘리먼트의 정보를 분석하여야 하는데 한 가지 방법으로는 엘리먼트의 정보를 분석하기 어렵다. 그러므로 본 논문은 변환 규칙을 생성하기 위한 엘리먼트 분석으로 다수의 방법을 사용할 수 있는 XSLT 편집기를 제안한다. 본 시스템은 XML의 구조적 특성인 엘리먼트의 포함 관계와 플러그인 방식으로 유사 엘리먼트를 분석하여 사용자에게 제공하는 방법을 보인다. XML의 엘리먼트 구조는 엘리먼트가 표현하고 있는 정보간의 구조와 동일한 구조로 포함되어 있다. 또한, 플러그인 방식 포함할 수 있는 모듈로는 문법적 특성을 이용한 방법을 포함하거나. semantic web의 정보를 이용하는 방법을 추가할 수 있다 또한 기존의 XSLT 처리기를 내장하고 있어 XSLT 문서를 변환 XML에 적용하여 피 변환 XML 문서를 생성할 수 있다. 제안하는 시스템은 기존의 사용자가 사용 패턴을 분석하여 엘리먼트를 분석하고 변환 규칙을 기술하는 방법과 달리 유사한 엘리먼트에 대한 정보를 사용자에게 제공하는 장점이 있다.

  • PDF

Social Filtering 환경에서 사용자 관심사를 고려한 Annotation 디스플레이 설계 및 구현 (Design and Implementation of Annotation Display using User Interest in Social Filtering Environment)

  • 박민서;최윤철;임순범
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.157-159
    • /
    • 2002
  • 웹 Annotation은 개인 노트의 수단이며, 동료들 사이에서 의견 교환과 협업할 수 있도록 도와준다[l]. 또한, Annotation들은 데이터베이스, 문서, 그리고 분산된 환경에서 중요한 일이나 사건을 기록하는데 바람직하다[2]. 이런 Annotation들은 통신수단의 발달과 함께 증가한 인터넷 사용자들의 활발한 의견교환을 통해 빠르게 증가하고 있다. 때문에 사용자들은 많은 Annotation들 중 적절한 Annotation을 선택하기가 쉽지 않다. 현재, 웹 상에서의 Annotation에 관련된 연구들이 활발히 진행 중에 있다. 그러나 한 문서 또는 한 Anchor에 존재하는 많은 Annotation들을 효과적으로 제공하는 방법에 관한 연구는 미비한 실정이다. 기존의 대부분의 Annotation System들은 다수의 Annotation들을 관련성이나, 사용자 특성을 고려하지 않고, 입력된 무의미한 순서로 제공하며 생성된 anchor와 Annotation들을 모두 보여준다. 이로 인해, 한 문서에 너무 많은 Annotation이 생성되어 문서의 레이아웃을 손상시킬 수 있으며[3], anchor와 문서의 이해 시간을 가중시킨다[4]. 따라서 본 논문에서는 웹 문서에 생성된 다수의 Anchor들과 Annotation들을 좀 더 효율적으로 제공하기 위해 협업 환경에서 효과적인 Social Filtering[5]을 적용하여 적절한 Anchor와 Annotation만을 제공하는 사용자 관심사에 의한 Annotation 처리 기법을 제안한다. 더불어 한 Anchor에 생성된 Annotation들에 순위를 부여하여 보다 적절한 Annotation을 먼저 접근할 수 있는 Anchor에 대한 적절한 Annotation내에서의 순위부여 기법을 제안한다.

  • PDF

다중-사용자 시스템에서의 효과적인 동적 웹 문서 발생 방법에 관한 연구 (A Study on the Effective Method of Generating the Dynamic Web Documents in the Multi-user System)

  • 이현창;이종언
    • 한국통신학회논문지
    • /
    • 제31권5B호
    • /
    • pp.478-485
    • /
    • 2006
  • 본 논문에서는 한 서버에 여러 사용자가 존재하는 다중-사용자 시스템에서 동적 웹 문서를 발생시키는데 필요한 조건을 분석하고 이를 효과적으로 발생시키는 방법을 제시하였다. CGI를 이용한 많은 응용에서는 웹 문서 원본의 수정을 위해 CGI 프로그램 원본을 수정하고 새로 컴파일 한 후 브라우저에서 호출해야하는 복잡한 과정을 거치는 데 비해, PSSI 기법은 외부 파일의 형태로 되어있는 HTML 웹 문서 원본만을 수정하는 단순한 작업으로 간소화할 수 있다. 제시한 다중-사용자 PSSI 기법은 웹 문서 원본이 외부 파일 형태로 되어있고 CGI의 장점인 프로그래밍의 유연성과 SSI의 장점인 웹 문서 원본 수정의 용이함을 가진 특징에 의해 프로그램은 1개이면서도 각 사용자들은 자신의 디렉토리에서 사용자 고유의 웹 문서를 작성하고 수정할 수 있음을 실험을 통해 확인하였다. 또한, CGI 서비스가 필요한 경우마다 프로그램을 설치해 사용하는 경우에 비해 서버 관리와 용량 등의 측면에서 우수한 효과가 있음을 확인하였다.

전자문서의 XML 문서로의 변환 및 저장 시스템 (Rule Based Document Conversion and Information Extraction on the Word Document)

  • 주원균;양명석;김태현;이민호;최기석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.106-108
    • /
    • 2006
  • 본 논문은 HWP, DOC와 같은 전자 문서에서 사용자가 제공한 구조적인 규칙과 XML 기반 전자 문서 변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)전자문서의 원시 XML 문서로의 변환 방법 2)XML 기반 구조적인 규칙과 작성된 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 전자문서의 변환을 위해서 독립적으로 동작하는OCX 기반의 전자문서 변환 데몬(Daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 데이터 포멧으로 생성하거나 DB에 저장할 수 있다. 본 시스템은 전자 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리시스템과 성과정보시스템에 적용하여 그 성과를 입증하였다.

  • PDF

가상대학을 위한 XML문서관리시스템 설계 (Design and Development of XML Document Management System for Cyber University)

  • 공범용;황병곤;조세홍
    • 디지털콘텐츠학회 논문지
    • /
    • 제3권1호
    • /
    • pp.37-46
    • /
    • 2002
  • 본 연구에서는 교육환경 변화에 따른 대안적 교육체제 탄생으로 캠퍼스가 없는 대학이 출현함에 따라 행정적인 뒷받침을 할 수 있는 문서관리시스템을 설계하였다. 특히 가상대학에서 필요로 하는 멀티미디어 문서를 효율적으로 관리하고 프리젠테이션 할 수 있는 문서관리시스템을 3개의 계층구조로 구성하였다. 시스템의 전체 구성도는 XML을 기반으로 한 문서생성, 저장, 검색시스템으로 구성하였으며, 사용자측 구성에서는 문서의 등록 수정 삭제를 수행하는 문서작성과 검색을 주요 기능으로 하는 일반사용자로 구성하였다. 연구자가 제안한 본 논문의 문서관리시스템 구현 환경에서는 문서를 등록하고 결재 및 열람하는 사람도 사용자로 구현하였다. 따라서 본 논문에서는 가상대학 문서관리시스템 홈페이지 구성을 사용자등록 포탈시스템 로그인에서 각 시스템연결에 따른 포탈시스템(커뮤니티, 전자결재, 웹메일, 문서함관리. 원스톱, 포틀릿)으로 구성하였다. 또한 본 연구에서는 가상대학 문서관리 시스템이 효율적이고 신속한 업무향상을 위한 절차적 과정을 개발하는 측면에서 이루어졌다.

  • PDF

개념 속성 기반 정보 검색 (Concept and Attribute based Answer Retrieval)

  • 윤보현;서창호
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.1-10
    • /
    • 2005
  • 본 연구에서는 지식검색을 위해 개념 속성을 이용하여 사용자 질의에 가장 적합한 정답 문장들을 검색 할 수 있는 정답검색 시스템을 설계하고 평가한다. 이 시스템은 먼저 사용자 질의를 개념 속성에 대한 불리언 연산으로 분석한 다음, 정답 문서 색인 집합에서 해당 문서들을 검색한다. 사용자는 이 검색된 문서들로부터 자신이 요구한 정답 문장들을 검색할 수 있으며, 또한 특정한 문서를 선택함으로써 그 문서에 포함된 정답 문장들을 검색할 수 있다. 이를 위해서 개념어와 속성어의 색인 단위로 색인된 정답 문서들은 각각의 문장들로 분할되어 색인된다. 그래서 분할된 문장들은 개념어와 속성어 형태로 분석되어 문서 색인 단위와의 관련 정도를 평가함으로써 정답 문장들의 위치를 색인한다. 마지막으로, 100개의 사용자 질의에 대해 정답 검색 시스템의 성능을 다양한 방법으로 평가한다.

  • PDF

사용자 군집을 이용한 개인화 된 웹 페이지 추천 (The personalized web page using the Users clustering method)

  • 이은경;이기현;조근식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.241-243
    • /
    • 2002
  • 기존의 웹 로그를 이용한 추천 System에서의 추천 문서 집합은 웹 페이지의 연관성과 웹 문서 사이의 거리를 이용하여 사용자들에게 추천 문서 집합을 제공해 주는 방식을 사용하였다. 이 방법에 의하면 추천 폐이지로 제공되는 페이지는 사용자별 연관성이 고려되지 않으므로 모든 사용자들이 웹 페이지의 연관성안을 이용한 폐이지를 추천 받는다. 따라서 처음 웹사이트를 방문한 새로운 사용자들에게는 추천해주는 폐이지는 사용자가 보고 있는 웹 페이지의 연관성에 의한 웹 페이지만을 추천 받게 되므로 생각하지 못했던 폐이지나 비슷한 취향을 가진 사용자들이 방문을 했던 페이지에 대해서는 추천 받지 못한다는 문제점을 가지고 있다. 따라서 본 논문에서는 동일한 폐이지를 방문한 사용자별로 클러스터링 하여 같은 그룹에 속한 사용자들의 브라우징 패턴 정보를 발견, 분석화 하여 DB에 저장하였으며, 새로운 사용자에 대해서 웹 페이지 추천 집합을 제공하였다.

  • PDF

문서의 효율적인 검색을 위한 HTML 문서 변환 시스템 (HTML Document Conversion System for Effective Retrieval of Text Document)

  • 김수의;장대용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.184-186
    • /
    • 2000
  • 이 연구에서는 텍스트 문서를 웹에서 HTML 문서 형태로 효율적으로 검색할 수 있는 변환 시스템을 개발하였다. 웹상에 사용자가 원하는 부분만을 HTML 문서 형태로 제공하도록 문서의 논리적인 구조를 파악하며 그 구조에 대한 정보와 각 논리 단위에 해당하는 부분의 범위 정보를 저장할 수 있도록 관계형 데이터베이스 스키마를 개발하였다. 개발한 시스템은 문서의 목차 테이블을 자동으로 구축하고 목차 테이블의 각 항목에 하이퍼링크를 설정한다. 문서를 웹에서 검색하기 위한 첫 화면은 목차 테이블이며, 그 중 한 항목이 클릭되면 그 항목의 내용이 제공되고, 만약 그 하위에 속하는 항목들이 있다면 그들에 대한 링크를 역시 제공한다. 이러한 방법으로 한 문서의 전체를 그 논리 구조에 따라 사용자가 원하는 대로 검색할 수 있다. 이 시스템은 멀티미디어 타입의 문서를 하이퍼미디어 문서 형식으로 변환할 수 있도록 확장하여 보완 개발될 수 있고, 장래에 전자 출판과 전자 도서관에 응용될 수 있다.

  • PDF