• Title/Summary/Keyword: 링크기반검색엔진

Search Result 33, Processing Time 0.026 seconds

Personalization of Link-based Search Engine by Fuzzy Concept Network (퍼지 개념 네트워크를 이용한 링크기반 검색엔진의 개인화)

  • 김경중;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.316-318
    • /
    • 2001
  • 링크 기반 검색엔진은 사용자의 질의어와 관련된 웹문서들에 대해 링크 정보를 이용하여 순위를 생성한다. 링크 정보는 문서들간의 추천을 나타내므로 중요한 문서를 찾는데 이용할 수 있다. 링크 정보를 이용한 검색은 일반적인 텍스트 기반 검색엔진에 비해 좋은 결과를 낸다고 알려져 있다. 링크 정보를 이용한 검색엔진의 대표적인 예로는 Google과 Clever Search가 있다. 본 논문에서는 링크 정보를 이용한 검색엔진을 개발하고 퍼지 개념 네트워크를 이용하여 개인화를 수행한다. 퍼지 개념 네트워크는 퍼지 문서 추 2654; 시스템을 위한 지식베이스로 이용된다. 사용자 프로파일을 이용하여 사용자별로 퍼지 개념 네트워크를 생성하고 링크 기반 검색 결과를 개인화한다. 3명의 사용자에 대해 실험을 수행하여, 개인화가 주는 효과에 대해 평가한다. 검색결과는 중요한 웹 문서를 찾아 주었으며, 개인화 과정을 통해 사용자가 원하는 순서대로 정렬해 주는 것을 알 수 있었다.다.

  • PDF

Design of Advanced HITS Algorithm by Suitability for Importance-Evaluation of Web-Documents (웹 문서 중요도 평가를 위한 적합도 향상 HITS 알고리즘 설계)

  • 김분희;한상용;김영찬
    • The Journal of Society for e-Business Studies
    • /
    • v.8 no.2
    • /
    • pp.23-31
    • /
    • 2003
  • Link-based search engines generate the rank using linked information of related web-documents . HITS(Hypertext Internet Topic Search), representative ranking evaluation algorithm using a special feature of web-documents based on such link, evaluates the importance degree of related pages from linked information and presents by ranking information. Problem of such HITS algorithm only is considered the link frequency within documents and depends on the set of web documents as input value. In this paper, we design the search agent based on better HITS algorithm according to advanced suitability between query and search-result in the set of given documents from link-based web search engine. It then complements locality of advanced search performance and result.

  • PDF

Development of a Personalized Link-based Search Engine using Fuzzy Concept Network (퍼지 개념 네트워크를 이용한 개인화된 링크기반 검색엔진의 개발)

  • Kim, Gyeong-Jung;Jo, Seong-Bae
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.7 no.3
    • /
    • pp.211-219
    • /
    • 2001
  • 텍스트 정보만을 이용하는 일반적인 검색엔진들의 한계를 극복하여 향상된 결과를 내기 위하여 링크 구조를 이용해 검색을 수행하는 시스템이 새롭게 등장하고 있다. 링크 구조는 사용자의 질의에 대해 중요한 문서들을 가려준다. 본 논문에서는 한 걸음 더 나아가 링크 정보를 이용하여 검색된 웹 페이지들 중 사용자의 기호에 적절한 결과를 도출하는 방법을 제안한다. 사용자 프로파일에 기반한 퍼지 개념 네트워크로 구축된 퍼지 문서 추출 시스템은 사용자의 성향을 반영하여 링크 기반 검색결과를 개인화 한다. 5명의 사용자에 대한 실험결과, 개발한 시스템이 의미 있는 웹 페이지를 검색함은 물론이고 사용자의 성향을 잘 반영함을 알 수 있었다.

  • PDF

LinkBoy: A CORBA-based Link Information Search Engine (Linkly : CORBA 기반 링크 정보 검색 엔진)

  • 김재훈;손주영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.221-223
    • /
    • 1999
  • 전세계를 연결하는 인터넷은 웹의 출현으로 급속히 퍼져 나가 하나의 거대한 정보망으로 형성되었다. 이러한 정보망에서 필요한 정보를 찾기 위한 검색 엔진이 인터넷에서의 필수 요건이 되고 있다. 그러나 정보가 저장되어 있는 여러 서버들 간의 플렛폼의 이질성의 극복, 언어 독립적인 플렛폼의 필요성이 대두된다. 그 해결책으로 이질적 분산 환경의 통합 환경 제공을 위한 CORBA가 제시되고 있다. 이에 본 논문에서는 CORBA 기술을 이용하여 인터넷에서의 정보 제공 서버간의 투명한 상호작용과 정보 검색이 가능하게 하며, 특히 일반 검색 엔진과는 달리 웹의 링크를 통해 정보를 검색할 수 있게 하기 위한 서버 엔진과 클라이언트 사용자 인터페이스를 설계, 구현하였다.

  • PDF

A Design of Meta Search Engine that Uses Link and Click Frequencies (링크 빈도와 클릭 빈도를 이용하는 메타 검색엔진의 설계)

  • 유태명;김준태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.292-294
    • /
    • 2000
  • 대부분의 검색엔진들이 사용하는 내용 기반 검색 방법은 웹 페이지에 있는 단어의 빈도만을 이용하여 순위를 결정함으로써 비슷한 단어 빈도를 가지고 있는 방대한 양의 검색 결과로부터 참조할만한 가치가 있는 중요한 페이지를 찾아내기가 매우 어렵다. 중요한 페이지를 구분해 내는 한가지 방법은 얼마나 많은 웹 페이지들이 참조하고 있는가 또한 얼마나 많은 사용자들이 그 웹 페이지에 접속하는가를 보는 것이다. 본 논문에서는 링크 빈도와 클릭 빈도를 이용하여 웹 페이지의 중요도를 계산하는 메타 검색엔진의 프로토타입을 구현하였다. 링크 빈도는 검색엔진에 해당 웹 페이지의 URL을 질의로 던져 구하고 클릭 빈도는 servlet을 이용하여 사용자의 클릭 행위를 감시하여 얻어내도록 하였다. 메타 검색엔진은 이 두 값의 가중치 합으로 각 페이지의 중요도를 계산하고 중요도 순으로 검색 결과를 재배열하여 사용자에게 보여 준다.

  • PDF

Design and Implementation of an Image Portal Site for On-Line Album with Content-Based Retrieval (앨범 기능을 포함한 이미지 포탈 사이트의 설계 및 구현)

  • Kim, Gun-Hee;Shin, Dong-Kyoo;Shin, Dong-Il
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.165-170
    • /
    • 2000
  • 본 논문에서 소개할 온라인 앨범 사이트는 텍스트 기반의 이미지 검색과 색상 기반 검색이 가능한 검색 엔진을 갖추었다. 기존의 검색 엔진들은 매우 단순한 키워드 매칭만을 통하여 이미지를 검색하여 그 결과 이미지와 사용자가 찾고자 하는 이미지 사이의 유사성이 낮은 경우가 많았다. SUMMIT(Sejong University MultiMedia Information Technology)은 등록된 각 사용자에게 개별 공간을 할당하여 사용자가 스스로 원하는 이미지를 업로드하거나 다운로드하게 한다. 또한, 각 사용자는 자신이 구성한 앨범 내에서의 키워드 검색과 내용기반 검색을 수행할 수 있으며 다른 사용자가 공개한 이미지나 시스템 데이터베이스에 저장된 이미지까지 포함한 포괄적인 검색 결과도 획득할 수 있다. 본 시스템은 각 사용자별 페이지 내에서의 검색이 가능하므로 검색의 정확도와 활용도를 높일 수 있다. 사용자는 SUMMIT에 올린 이미지나 타인이 공개한 이미지를 자신 혹은 기타 홈페이지에 직접 하이퍼링크할 수 있으며 어느 페이지에서도 같은 이미지 링크 태그를 사용할 수 있다는 용이함도 취할 수 있다.

  • PDF

PageRank Algorithm Using Link Context (링크내역을 이용한 페이지점수법 알고리즘)

  • Lee, Woo-Key;Shin, Kwang-Sup;Kang, Suk-Ho
    • Journal of KIISE:Databases
    • /
    • v.33 no.7
    • /
    • pp.708-714
    • /
    • 2006
  • The World Wide Web has become an entrenched global medium for storing and searching information. Most people begin at a Web search engine to find information, but the user's pertinent search results are often greatly diluted by irrelevant data or sometimes appear on target but still mislead the user in an unwanted direction. One of the intentional, sometimes vicious manipulations of Web databases is Web spamming as Google bombing that is based on the PageRank algorithm, one of the most famous Web structuring techniques. In this paper, we regard the Web as a directed labeled graph that Web pages represent nodes and the corresponding hyperlinks edges. In the present work, we define the label of an edge as having a link context and a similarity measure between link context and the target page. With this similarity, we can modify the transition matrix of the PageRank algorithm. A motivating example is investigated in terms of the Singular Value Decomposition with which our algorithm can outperform to filter the Web spamming pages effectively.

The Meta Search Agent using Ranking Algorithm with Link Structure Analysis (링크 구조 기반의 순위 알고리즘을 이용한 메타 검색 에이전트)

  • 김형욱;김민구;최경희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.373-375
    • /
    • 2002
  • 하이퍼 텍스트 구조의 특성을 이용한 순위 평가 알고리즘 중의 하나인 HITS 알고리즘은 웹 페이지들의 상호간에 연결된 링크 정보로부터 웹 문서들의 중요도를 평가하여 순위에 따른 결과를 제시한다. 그러나 초기의 HITS 알고리즘은 문서 내의 링크 빈도 수만을 고려하고, 입력 값으로 주어지는 웹 문서 집합의 특성에 의존적인 단점을 가지고 있다. 본 논문에서는 여러 웹 검색 엔진들로부터 얻어진 문서 집합에 수정된 HITS 알고리즘을 수행하는 메타 검색 에이전트를 설계하여 보다 나은 검색 성능을 구하고, 결과의 지역성을 보완한다.

  • PDF

Improving Performance of Search Engine By Using WordNet-based Collaborative Evaluation and Hyperlink (워드넷 기반 협동적 평가와 하이퍼링크를 이용한 검색엔진의 성능 향상)

  • Kim, Hyun-Gil;Kim, Jun-Tae
    • The KIPS Transactions:PartB
    • /
    • v.11B no.3
    • /
    • pp.369-380
    • /
    • 2004
  • In this paper, we propose a web page weighting scheme based on WordNet-based collaborative evaluation and hyperlink to improve the precision of web search engine. Generally search engines use keyword matching to decide web page ranking. In the information retrieval from huge data such as the Web, simple word comparison cannot distinguish important documents because there exist too many documents with similar relevancy. In this paper, we implement a WordNet-based user interface that helps to distinguish different senses of query word, and constructed a search engine in which the implicit evaluations by multiple users are reflected in ranking by accumulating the number of clicks. In accumulating click counts, they are stored separately according to lenses, so that more accurate search is possible. Weighting of each web page by using collaborative evaluation and hyperlink is reflected in ranking. The experimental results with several keywords show that the precision of proposed system is improved compared to conventional search engines.

Performance Improvement of a Search Engine Using Semantic Category and Hyperlink (의미 카테고리와 하이퍼링크를 이용한 검색엔진의 성능 향상)

  • 김형일;김준태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.649-651
    • /
    • 2004
  • 현재, 웹의 정보는 사용자들이 원하는 모든 정보를 담고 있다고 할 수 있으나, 방대한 웹에서 사용자가 원하는 정보를 정확히 추출하기란 어려운 문제이다. 이러한 정보 추출의 어려움은 방대한 정보량과 정보추출 방식과 직결된다. 웹에서 정보를 정확히 추출하여도 일반적인 검색엔진들의 웹 페이지 순위 결정 방식을 따르게 되면, 사용자에게 중요한 페이지를 상위에 위치시키기란 쉬운 일이 아니다. 본 논문에서는 질의어의 모호성을 해결하기 위해 워드넷 기반 사용자 인터페이스를 설계하고, 웹 페이지의 가중치에 의미 카테고리 빈도 확률과 하이퍼링크 가중치를 이용한 웹 페이지의 가중치 결정 방식을 제안한다.

  • PDF