• Title/Summary/Keyword: 웹엔진

Search Result 577, Processing Time 0.027 seconds

Implementation of a Ranking System for the Web Search Engine based on Inverted Files (역파일에 기반한 웹 검색 엔진의 랭킹 시스템 구현)

  • Lim, Sung-Chae;Ahn, Joon-Seon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.35-40
    • /
    • 2007
  • 역파일을 사용한 색인 기법은 정보 검색 분야에서 널리 사용되었으며, 최근 대용량 검색 시스템으로 사용되고 있는 웹 검색 엔진에서도 적응되고 있다. 본 논문에서는 웹 검색 엔진의 특성에 완친 구현된 역파일 기법 기반의 웹 문서 색인 파일의 구조와 디스크에 저장된 대용량의 역파일 색인을 기반으로 웹 페이지의 검색 적합도를 계산하는 랭킹 시스템을 설명한다. 이를 통하여 상용 웹 검색 엔진의 랭킹 시스템과 디스크 자원 사용의 최소화 기법을 제시한다.

  • PDF

Design for RDF-based Semantic Web System (RDF 기반 시맨틱 웹 시스템 설계)

  • Lee, Jong-Won;Jang, Ki-Man;Kim, Kyng-Hwan;Yang, Xitong;Jung, Hoe-Kyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.10a
    • /
    • pp.684-686
    • /
    • 2014
  • It is difficult to effectively search and data management due to the increasing number of web is now. While Semantic Web technologies and the development of next-generation wepin this as a way to overcome them, and monopolize the domestic utilization is not overwhelming introduction to the Semantic Web technology is being used in existing search engines. This causes the development of the Semantic Web is becoming slower, and reluctant to use the Semantic Web users who use search engines as well. In this paper, compared to the currently used web and the next generation of the web, and why utilization is low compared to the search engine you are using an existing Web technology that uses the Semantic Web technology is a search engine, what research was that the inefficient because, as a RDF-based Semantic suggest how to improve the efficiency solved by designing the web.

  • PDF

A Web Page Reordering Agent System (웹문서 재배치 에이전트 시스템)

  • Jo, Yeong-Im;Gang, Sang-Gil;Kim, Yeong-Guk
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2007.04a
    • /
    • pp.91-94
    • /
    • 2007
  • 구글이나 야후와 같은 정보검색엔진은 사용자에게 편리성을 제공하나 사용자로 하여금 만족감을 제공하지는 못하고 있다. 이것은 사용자에 대한 검색목표가 사용자 프로파일마다 서로 다르기 때문이다. 따라서 검색엔진으로 검색된 결과를 사용자 프로파일에 따라서 재배치하는 것은 매우 필요하다. 이 논문에서는 키워드기반 검색엔진으로 검색된 결과를 사용자 프로파일에 따라 웹문서를 재배치하는 알고리즘을 제안한다. 각 키워드에 대한 가중치는 사용자가 웹문서에 대해서 수행한 행동 즉, 다운로드, 클릭, 아무행동 안함에 따라 차등 적용하여 업데이트하여 웹문서를 리스트하여 사용자에게 제공한다.

  • PDF

Efficient RDQL Query Processing based on RDQL2SQL (RDQL2SQL 기반의 효율적인 RDQL 질의 처리)

  • Kim, Hak-Soo;Son, Jin-Hyun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.43-45
    • /
    • 2005
  • 최근 시맨틱 웹에 대한 관심이 증가하면서 W3C표준으로 규정된 시맨틱 웹 온톨로지 언어(RDF, RDFS, OWL 등) 기반의 관련 기술에 대한 연구가 활발히 진행되고 일다. 그 중에서 시맨틱 웹 온톨로지 언어로 기술된 문서의 저장, 관리, 질의처리 기법에 대한 연구가 주목을 받고 있다. 이에 본 논문에서는 온톨로지 데이터에 대한 표준 질의 언어인 RDQL 을 기반으로 RDQL 질의를 효율적으로 처리하는 고성능 RDQL 질의 처리 엔진을 개발한다. 본 논문에서 제안하는 RDQL 질의 처리 엔진은 RDQL 질의를 대응하는 SQL 질의로 변환함으로써 기존의 관계형 데이터베이스 질의 처리 엔진(SQL 질의 처리 엔진)을 그대로 사용할 수 있다. 이 과정에서 메모리 사용량과 데이터베이스 접근을 최소화하는 고성능 RDQL 질의 처리 엔진을 개발한다. 궁극적으로 이러한 RDQL 질의 처리는 실시간 처리가 요구되는 로봇 환경뿐만 아니라 시맨틱 웹 애플리케이션에서 널리 활용될 수 있다.

  • PDF

Detecting Method for URL Redirection Spam (URL 리다이렉션 스팸 탐지 기법)

  • Baek, Jee-Hyun;Kim, Sung-Kwon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10d
    • /
    • pp.540-544
    • /
    • 2007
  • 인터넷의 급속한 성장은 사람들의 정보 습득 방식에 큰 변화를 주었다. 인터넷 이용자들은 과거와 비교도 할 수 없을 만큼의 많은 지식을 손쉽게 접할 수 있게 되었다. 하지만, 그로 인해 여러 가지 문제점들이 생겨나게 됐는데, 웹 스팸도 그 중 하나이다. 웹 스팸은 웹을 통한 불법적인 활동으로 이득을 보려는 활동을 통칭할 수 있다. 웹 스팸은 검색 엔진 결과 리스트의 순위를 올리기 위해 사용되는 것이 대부분이지만, 점점 검색 엔진 결과 리스트의 순위와 관련 없는 것들에서도 나타나 생겨나고 있다. 웹 스팸은 종류도 다양할뿐더러, 아직까지 모든 웹 스팸을 예방할 확실한 방법이 제시되지 못하고 있다. 이 논문에서는 여러 웹 스팸 중 페이지-하이딩 스팸에 속하는 URL 리다이렉션에 대해 다루고자 한다. 다른 웹 스팸과 마찬가지로, 현재까지 자동적으로 URL 리다이렉션을 탐지하는 방법이 제시되지 못하고 있는 실정이다. 이 논문에서는 검색 엔진 결과 리스트의 순위를 사용하여 URL 리다이렉션을 탐지 기법을 제안하고자 한다.

  • PDF

Expertise aquisition of special session in internet web (인터넷 웹에서의 특정 분야의 전문 지식 획득)

  • 김상경;박사준;김재호;김기태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.346-348
    • /
    • 2001
  • 전문가 검색 엔진은 전문가 시스템과 같은 목적에서 특정 전문 분야에 대한 특수한 정보를 수집 검색하기 위한 검색 엔진을 지칭한다. 특정 전문 분야를 위한 검색 엔진은 제작하기 위해서는 해당 분야만으로 구성된 웹 문서가 필요하다. 본 논문에서 제안한 전문가 검색 엔진은, 특정 분양의 웹 문서만 수집하기 위해서 개념 지식을 사용하여 웹 문서의 특정 분야 귀속 여부를 판단하였다. 개념 지식을 사용하여 웹 문서의 특정 분야 귀속 여부를 판단하기 위해서는, 개념 지식이 특정 분양에 대해 충분히 수집이 되어야 하며, 다른 분야와 충돌하지 않아야 한다. 이러한 개념 지식을 구축하는 것은 사람의 손으로 하는 것은 매우 어려운 일이므로, 본 논문에서는 학습을 토하여 개념 지식을 확장하고, 이를 전문가가 개입하여 학습 과정을 확인하였다. 본 논문은 개념 지식의 학습과 효용성에 대한 실험 및 결과에 대한 논문이다.

  • PDF

Design for the System of Web Document Classification (웹문서분류체계의 설계)

  • 남영준
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.183-188
    • /
    • 1998
  • 인터넷에 존재하는 웹 문서와 사이트들은 충분히 학술적 가치를 갖고 있기 때문에 중요한 정보원으로 간주된다. 도서관은 이 새로운 정보원을 대상으로 도서관 이용자를 위한 새로운 검색기법과 관리기법을 개발할 필요가 증대되었다. 왜냐하면 현재 웹 검색 엔진에서 제공하는 분류체계는 도서관학적 관점에서 개발되지도 않았으며 또한 웹 검색엔진간 분류체계의 설계원칙도 없기 때문이다. 본 논문에서는 이점에 착안하여 웹문서를 효율적으로 검색할 수 있는 실험적인 새로운 웹 문서분류체계를 설계하였다. 설계는 해당 분류항목과 연관된 웹 문서의 수와 접속비율에 근거하였으며, 설계의 수준은 1차적으로 류·강 항목까지 제한하였다.

  • PDF

Representing the Spatial Relations for Searching the Multimedia Data in Semantic Web (시맨틱 웹에서 멀티미디어 데이터 검색을 위한 공간관계 표현 연구)

  • Kong, Hyun-Jang;Jung, Kwan-Ho;Kim, Won-Pil;Bae, Yong-Geun;Kim, Pan-Koo
    • Annual Conference of KIPS
    • /
    • 2003.11b
    • /
    • pp.825-828
    • /
    • 2003
  • 웹에는 막대한 양의 멀티미디어 데이터가 있다. 최근에 이러한 멀티미디어 데이터의 효과적 검색을 위한 많은 시스템이 개발되고 있으며, 그 결과 내용기반 이미지 검색과 같은 이미지의 내용을 인식하고 검색하고자 하는 연구가 진행되고 있다. 그렇지만 지금까지의 연구는 웹 검색엔진에 멀티미디어의 검색을 위한 또 하나의 검색엔진이 필요하여 그 무게가 커지고 그 성능도 저하된다. 이에 본 논문에서는 차세대 웹인 시맨틱 웹에서의 의미적 검색에 초점을 맞추어 멀티미디어 데이터 각각에 의미적 정보를 추가하여 웹 문서를 작성한다면 그 검색에 또 다른 검색엔진의 사용없이 효과적 검색이 이루어 질 것을 목적으로 하고 있다. 먼저, 간단한 이미지내에서 객체간의 공간적 관계를 표현하기 위한 새로운 Axiom 을 정의하고, 이를 적용하여 시맨틱 웹에서의 의미적 이미지 검객을 꾀한다.

  • PDF

Web Information Search Using Reinforcement Learning (강화학습을 이용한 웹 정보 검색)

  • 정태진;장병탁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.94-96
    • /
    • 2001
  • 현재 인터넷상에서 제공되고 있는 대부분의 서치엔진들은 정보소스에 접근해서 이를 가져오는 웹 로봇(webbot)이라고 불리우는 에이전트를 이용한다. 그런데 이런 웹 로봇들이 웹 문서를 검색하는 방법은 극히 단순하다. 물론 많은 정보를 가지고 오는 것에 초점이 맞추어져 있어서 정확도를 중시하지 않는 것에도 한 원인이 있다. 범용 검색엔진과는 달리 검색하는 영역을 축소하여 특정 주제에 관련된 정보만을 더 정확히 찾아주는 검색엔진의 필요성이 증가하고 있다. 이에 본 논문에서는 강화 학습 방법을 이용하여 웹 상에 존재하는 정보 중에서 특정 주제의 웹 페이지를 보다 더 정확히 찾는 방법을 제시한다. 강화 학습은 웹 상의 하이퍼링크를 따라가는 문제에 있어서 미래에 이로움을 주는 행동의 효용성을 측정하는데 있어서 이점을 보인다. 강화 학습을 이용하여 제시된 방법을 통한 실험에서는 일반적인 방법보다 더 적은 링크를 따라가고도 더 정확한 결과를 보였다.

  • PDF

Design and implementation of Web Query System Using Web Structure (웹 구조(構造)를 이용(利用)한 웹 질의(質疑) 시스템의 설계(設計) 및 구현(具現))

  • Ko, Sung-Jun;Kim, Sang-Suk;Kim, Ung-Mo
    • Annual Conference of KIPS
    • /
    • 2000.04a
    • /
    • pp.260-265
    • /
    • 2000
  • 사용자 질의를 통한 검색엔진의 도움 없이 웹 데이터베이스의 개념을 도입하여, 웹을 직접 검색할 수 있는 웹 질의 엔진(Web Query Engine)을 제안한다. 특히 사용자가 자신이 원하는 질의를 할 수 있도록 기존의 질의 언어와 유사한 웹 질의 언어를 설계하고, 설계되어진 질의 언어를 사용하여 인덱스 서버에 정보의 요청 없이 네트워크 구조와 위상 기반의 질의를 할 수 있도록 하는 웹 질의 엔진을 설계 및 구현을 하였다.

  • PDF