• 제목/요약/키워드: Link-based Search Engines

검색결과 11건 처리시간 0.021초

웹 문서 중요도 평가를 위한 적합도 향상 HITS 알고리즘 설계 (Design of Advanced HITS Algorithm by Suitability for Importance-Evaluation of Web-Documents)

  • 김분희;한상용;김영찬
    • 한국전자거래학회지
    • /
    • 제8권2호
    • /
    • pp.23-31
    • /
    • 2003
  • 링크 기반 검색엔진은사용자의 질의어와 관련된 웹 문서들의 링크 정보를 이용하여 순위를 생성한다. 이러한 링크기반 웹 문서의 특성을 이용한 대표적인 순위 평가 알고리즘. HITS는 웹 페이지들 간의 상호 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하고, 순위 정보에 따른 결과를 제시한다. 이러한 HITS 알고리즘의 문제점은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적이라는 것이다. 본 논문에서는 링크기반 웹 검색 엔진들로부터 얻어진 문서 집합에 대해 질의와 검색결과 간의 적합도를 향상시킨 HITS 알고리즘을 수행하는 검색 에이전트를 설계하였다. 이로써 향상된 검객 성능과 결과의 지역성을 보완한다.

  • PDF

이용자정의형 적합성 기준을 토대로 한 웹검색엔진 인터페이스 평가 (Appraising the Interface Features of Web Search Engines Based on User-defined Relevance Criteria)

  • Kim, Yang-Woo
    • 한국비블리아학회지
    • /
    • 제22권1호
    • /
    • pp.247-262
    • /
    • 2011
  • 이용자 정의형 적합성 연구가 적합성의 유형 및 기준 식별에 큰 진전을 이룬 반면, 그 결과를 실제 시스템 디자인에 적용시키는데는 큰 발전이 없었다. 이러한 전제하에 본 연구는 식별된 적합성기준이 주요 웹검색엔진의 인터페이스 기능에 어느정도 접목되었는지를 조사하고 무엇이 더 이루어져야 하는지를 제안하였다. 시스템 기능에 접근하기전에 본 연구에서는 적합성연구와 정보학 및 HCI에서 이와 유사한 이용자중심 연구를 비교하여 제시하였다. 인터페이스기능을 지원하기위한 제안점은 (1) 인터페이스 디자인의 추가적인 개인화, (2) 웹 컨텐츠를 위한 저자제공 메타 태그, 그리고 (3) 링크구조에 입각한 비주제적 표현의 확장 등이다.

PageRank 변형 알고리즘들 간의 순위 품질 평가 (Ranking Quality Evaluation of PageRank Variations)

  • 팜민득;허준석;이정훈;황규영
    • 전자공학회논문지CI
    • /
    • 제46권5호
    • /
    • pp.14-28
    • /
    • 2009
  • PageRank 알고리즘은 구글(Google)등의 검색 엔진에서 웹 페이지의 순위(rank)를 정하는 중요한 요소이다. PageRank 알고리즘의 순위 품질(ranking quality)을 향상시키기 위해 많은 변형 알고리즘들이 제안되었지만 어떤 변형 알고리즘(혹은 변형 알고리즘들간의 조합)이 가장 좋은 순위 품질을 제공하는지가 명확하지 않다. 본 논문에서는 PageRank 알고리즘의 잘 알려진 변형 알고리즘들과 그들 간의 조합들에 대해 순위 품질을 평가한다. 이를 위해, 먼저 변형 알고리즘들을 웹의 링크(link) 구조를 이용하는 링크기반 방법(Link-based approaches)과 웹의 의미 정보를 이용하는 지식기반 방법(Knowledge-based approaches)으로 분류한다. 다음으로, 이 두 가지 방법에 속하는 알고리즘들을 조합한 알고리즘들을 제안하고, 변형 알고리즘들과 그들을 조합한 알고리즘들을 구현한다. 백만 개의 웹 페이지들로 구성된 실제 데이터에 대한 실험을 통해 PageRank의 변형 알고리즘들과 그들 간의 조합들로부터 가장 좋은 순위 품질을 제공하는 알고리즘을 찾는다.

OOPL을 이용한 정보 검색 최적화 시스템에 관한 연구 (A Study on Information Search Optimization System Using OOPL)

  • 김용호;오근탁;이윤배
    • 한국정보통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.1028-1034
    • /
    • 2004
  • 최근 멀티미디어 기반의 WWW(World Wide Web) 서비스를 중심으로 하는 인터넷의 사용이 일반화되면서 전 세계의 컴퓨터망에 존재하는 수많은 정보들을 취득할 수 있게 되었다. 인터넷의 사용이 일반화되고 있는 현대의 사회에서는 정확한 정보를 신속하게 취득하는 것이 중요한 문제로 대두되고 있다. 본 논문에서는 OOPL(Object-Oriented Programming Language)인 JAVA를 이용하여 검색엔진을 설계하고 최적화된 URL을 추출하여 이용자에게 제공함으로써 더욱 정확한 정보를 획득할 수 있음을 보였다. 또한 기존의 국내 제작 검색엔진들과 비교하여 제안한 시스템에서는 배드 링크율이 개선됨을 보였다.

Java를 이용한 정보 검색 최적화 알고리즘에 관한 연구 (A Study on Optimized Information Search Algorithm Using lava)

  • 김용호;정종근;이윤배
    • 한국정보통신학회논문지
    • /
    • 제6권6호
    • /
    • pp.797-804
    • /
    • 2002
  • 최근 멀티미디어 기반의 WWW(World Wide Web) 서비스를 중심으로 하는 인터넷의 사용이 일반화되면서 전 세계의 컴퓨터망에 존재하는 수많은 정보들을 취득할 수 있게 되었다. 따라서, 인터넷이 보편화되기 이전에는 정보의 습득이 중요한 문제가 되었지만 인터넷의 사용이 일반화되고 있는 현대의 사회에서는 정확한 정보를 신속하게 취득하는 것이 중요한 문제로 대두되고 있다. 본 논문에서는 객체 기반의 언어인 Java를 사용하여 인터넷 검색엔진을 설계하고 최적화된 URL을 추출함으로써 인터넷 검색엔진의 구조를 이해하고, 구현 기술을 확보하였다. 논문에서 제안한 검색엔진은 키워드 검색을 제공하며, 사용자인터페이스를 단순화함으로써 사용자의 편의성을 도모하였다. 그리고 기존의 국내 제작 검색엔진들과 비교서 검색된 정보사이트의 양이 적은 대신 검색결과의 배드 링크율은 개선됨을 보였다.

개인화 웹 검색 시스템 기반의 문서 요약 시스템 (A Document Summary System based on Personalized Web Search Systems)

  • 김동욱;강수용;김한준;이병정;장재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권3호
    • /
    • pp.357-365
    • /
    • 2010
  • 개인화 웹 검색 시스템은 사용자의 검색의도에 따라 질의어 확장, 검색 결과의 재순위화 등의 방법을 통하여 사용자에게 개인화된 검색 결과를 제공한다. 이를 위해 검색 시스템은 질의어와 사용자의 프로파일 정보를 활용하여 사용자의 검색 의도를 파악하고 분석하여, 검색 결과 페이지에 반영하여 보여주게 된다. 이때 검색 결과 페이지는 문서의 URL과 문서의 제목, 작은 텍스트 조각을 표시한다. 여기서 작은 텍스트 조각은 검색 질의어가 포함된 문서의 요약이며, 스니펫이라고 알려져 있다. 사용자는 이러한 문서의 요약을 통하여 웹 문서가 자신이 원하는 정보를 가진 문서인지를 판단하거나, 해당 URL에 직접 접속하지 않고도 원하는 정보를 얻을 수 있게 된다. 따라서 문서 요약은 사용자가 문서를 볼 것인지 아닌지에 대한 중요한 판단 기준이 되며, 만약 문서 요약 시스템이 개인화된 요약 결과를 제공한다면 사용자의 만족도는 더욱 증가할 것이다. 본 논문은 전체 웹 검색 시스템에서 검색 속도의 큰 하락없이 사용자의 만족도를 증가시킬 수 있는 개인화 문서 요약 시스템을 제안한다.

완전그래프를 이용한 문서요약 연구 (Document Summarization Method using Complete Graph)

  • 유준현;박순철
    • 한국산업정보학회논문지
    • /
    • 제10권2호
    • /
    • pp.26-31
    • /
    • 2005
  • 본 논문에서는 웹 검색엔진에서 일반적으로 사용하는 문서요약에 대한 연구로써 문서 내에 있는 문장들의 꼭짓점을 연결하는 완전그래프기법을 도입하여 요약내용을 좀 더 간결하고 함축하게 하는 통계요약기법을 제안했다. 이 요약기술을 지금까지 통계 문서요약기술에서 우수하다고 판단된 클러스터링 기법과 MMR 기법 등과 비교하였다. 특히, 요약 성능을 평가하기 위하여 인위적으로 요약된 요약문을 기준으로 한 각 요약기법들의 FScore값들과 비교하였다. 이 기술들 중에서 완전그래프기법이 약 $30\%$정도 성능향상을 보였다.

  • PDF

학술정보의 식별체계 현황 분석 및 연계 방안 연구 (A Study on the Analysis of Identification System and the Linkage Method of Academic-information)

  • 강주연;설재욱;황혜경
    • 한국도서관정보학회지
    • /
    • 제51권1호
    • /
    • pp.115-143
    • /
    • 2020
  • 4차 산업혁명 시대의 도래로 데이터 중심의 융합 연구가 증가하고 있다. 이러한 연구는 정보의 식별 및 연계의 중요성을 증가시키고 있어, 이를 지원하기 위한 학술정보의 효과적인 관리 및 유통을 위한 방안 모색이 필요하다. 이에 본 연구는 국내외 주요 학술정보서비스 12개의 식별체계 현황과 연계 가능한 정보를 분석하여 학술정보를 식별하고 연계할 수 있는 방안을 제안하고자 하였다. 현황 분석은 2차에 걸쳐 진행되었으며, 각 서비스가 제공하고 있는 학술정보의 유형과 검색 가능한 항목, 연계 정보 유형, 사용 중인 식별체계 등을 살펴보았다. 분석 결과, 국내외 주요 학술정보서비스들은 영구 식별자와 더불어 자체 식별자를 중심으로 평균 3~4개의 정보를 직·간접적으로 연계하고 있다. 또한, 기계학습 방법론을 기반으로 하여 동일 학술정보를 반자동으로 식별하고, 해당 데이터를 수집, 구축하고 있다. 상기 분석 결과를 바탕으로 실무적인 측면에서 영구 식별자 중심의 학술정보 연계 방안과 사회적인 측면에서 기관 협력 네트워크 기반의 연계 방안을 제안하였다.

페이지랭크 알고리즘 적용을 위한 구현 기술 (Implementation Techniques to Apply the PageRank Algorithm)

  • 김성진;이상호;방지환
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.745-754
    • /
    • 2002
  • 1998년에 등장한 구글 검색 사이트(http://www.google.com)에 처음 소개된 페이지랭크 알고리즘은 웹 문서들의 연결 구조에 기반하여 문서들간의 순위를 부여하는 방법이다. 페이지랭크 알고리즘은 상용 검색 엔진에서 구현되어 사용되고 있으나, 상업상의 이유들로 인하여 구현 기법에 관한 연구 결과는 거의 발표되지 않고 있다. [4,8]에서 소개된 페이지랭크 알고리즘의 구현 기법은 웹 문서들의 페이지랭크 값을 산출하기에 충분하지 않다. 본 논문은 페이지랭크 알고리즘의 구현 기법[4,8]을 설명하고, 이를 적용하는데 필요한 입/출력 자료 구조 및 4가지 주요 구현 기술을 제시한다. 본 논문은 실제 웹 문서의 페이지랭크 값을 산출하는 시스템을 예로 들어 페이지랭크 알고리즘을 적용하는 방법에 대한 이해를 돕도록 하였다.

스마트 TV 환경에서 정보 검색을 위한 사용자 프로파일 기반 필터링 방법 (A User Profile-based Filtering Method for Information Search in Smart TV Environment)

  • 신위살;오경진;조근식
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.97-117
    • /
    • 2012
  • 인터넷 사용자는 비디오를 보면서 소셜 네트워크 서비스를 이용하고 웹 검색을 하고, 비디오에 나타난 상품에 관심이 있을 경우 검색엔진을 통해 정보를 찾는다. 비디오와 사용자의 직접적인 상호작용을 위해 비디오 어노테이션에 대한 연구가 진행되었고, 스마트 TV 환경에서 어노테이션 된 비디오가 활용될 경우 사용자는 객체에 대한 링크를 통해 원하는 상품의 정보를 쉽게 확인할 수 있게 된다. 사용자가 상품에 대한 구매를 원할 경우 상품에 대한 정보검색 이외에 상품평이나 소셜 네트워크 친구의 의견을 통해 구매 결정을 한다. 소셜 네트워크로부터 발생되는 정보는 다른 정보에 비해 신뢰도가 높아 구매 결정에 큰 영향을 미친다. 하지만 현재 소셜 네트워크 서비스는 의견을 얻고자 할 경우 모든 소셜 네트워크 친구들에게 전달되고 많은 의견을 얻게 되어 이들로부터 유용한 정보를 파악하는 것은 쉽지 않다. 본 논문에서는 소셜 네트워크 사용자의 프로파일을 기반으로 상품에 대해 유용한 정보를 제공할 수 있는 친구를 규명하기 위한 필터링 방법을 제안한다. 사용자 프로파일은 페이스북의 사용자 정보와 페이스북 페이지의 'Like' 정보를 이용하여 구성된다. 프로파일의 상품 정보는 GoodRelations 온톨로지와 BestBuy 데이터를 이용하여 의미적으로 표현된다. 사용자가 비디오를 보면서 상품 정보를 얻고자 할 경우 어노테이션된 URI를 이용하여 정보가 전달된다. 시스템은 소셜 네트워크 친구들에 대한 사용자 프로파일과 BestBuy를 기반으로 어노테이션된 상품에 대한 의미적 유사도를 계산하고 유사도 값에 따라 순위가 결정한다. 결정된 순위는 유용한 정보를 제공할 수 있는 소셜 네트워크 상의 친구를 규명하는데 사용된다. 참가자의 동의하에 페이스북 정보를 활용하였고, 시스템에 의해 도출된 결과와 참가자 인터뷰를 통해 평가된 결과를 이용하여 타당성을 검증하였다. 비교 실험의 결과는 제안하는 시스템이 상품 구매결정을 하기 위해 유용한 정보를 획득할 수 있는 방법임을 증명한다.