• Title/Summary/Keyword: 메타검색엔진

Search Result 82, Processing Time 0.026 seconds

Design and Implementation of an HTML Pages Modification Detector for Meta-search Engines (메타 검색엔진을 위한 HTML 문서 변경 탐지기의 설계 및 구현)

  • Park, Sang-Wi;O, Jeong-Seok;Lee, Sang-Ho
    • The KIPS Transactions:PartD
    • /
    • v.9D no.3
    • /
    • pp.345-354
    • /
    • 2002
  • HTML pages in the web change at any time. It could cause to decrease the functionality of meta-search engines which provide users with integrated results of search engines. To solve this problem, we propose an HTML pages modification detector. It utilities information of element positions in HTML pages and the modified Jaak Vilo algorithm. The HTML page modification detector uses patterns that represent the structure of HTML expressions occurring repeatedly in HTML pages. An experiment is carried out to verify the correctness of the modification detector.

A Study on the Retrieval Effectiveness in the Search Engines Using Data Mining Techiniques (데이터마이닝기법을 이용한 검색엔진의 검색효율성 측정에 관한 연구)

  • 김성희;이수연
    • Journal of Korean Library and Information Science Society
    • /
    • v.31 no.4
    • /
    • pp.191-212
    • /
    • 2000
  • This study is intlded to ampre the effectiveness of the Northemlight and Google, which are based on Datamining kdmique with a Metacrawler, one of metasearch engines. As a result, searches responding to queries in the Northemlight and Google produced a higher precision and recall as comparrd with searches nspcdhg to queries in the metacrawler. The results show that the Datamining techniques can help improve information retrieval effectinveness.

  • PDF

A Comparative Study on Metasearch System and Google Scholar in the Digital Library Environment (디지털도서관 환경에서 메타서치시스템과 구글스칼라에 관한 비교 연구)

  • Yang, Ji-Ann;Nam, Young-Joon
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2010.08a
    • /
    • pp.45-54
    • /
    • 2010
  • 정보환경의 변화에 따라 도서관과 웹 검색엔진의 차별성이 있음에도 불구하고 이용자들은 인터넷의 자원과 학술데이터베이스의 자원을 혼동하고 있다. 특히 구글스칼라가 갖는 검색속도와 조작의 편의성이라는 장점에 따라 데이터베이스의 학술적 가치에도 불구하고 구글스칼라를 가장 많이 이용하고 있다. 이 연구에서는 구글스칼라가 갖는 장점을 반영한 메타서치시스템의 특성과 가치를 조사하였다. 조사 대상은 메타서치시스템이 갖는 인터페이스 측면과 전자정보원 측면에서 비교 분석하였다. 이러한 새로운 검색채널로써 메타서치시스템을 이용하는 기관의 이용통계를 분석하여, 이를 바탕으로 구글스칼라와 같은 웹 검색엔진이 갖는 이용자선호가치를 수용하는 상황에서 이용자 이용행태 패턴과 주제별 전자정보 탐색 행위 등을 조사하였다.

  • PDF

An Ontology-based Annotation System for Semantic Web (시맨틱 웹에서 온토로지를 기반한 Annotation 시스템)

  • 강상구;양재영;최중민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.298-300
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 이해할 수 있도록 하는데 있다. 이를 위해 본 논문에서는 Annotation Editor를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 수정하고 RDF Store로 저장할 수 있으며, 주석 뷰를 통하여 수동으로 RDF 메타데이타를 입력할 수 있다. 본 논문은 검색 엔진을 통하여 논문 검색 시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

Automatic Generation of RDF Metadata for Semantic Search in Semantic Web (시맨틱 웹에서 의미 검색을 위한 RDF 메타데이타 자동 생성)

  • 강상구;양재영;양승섭;최원종;최중민
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.311-320
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 처리할 수 있도록 하는데 있다. 그러나 인터넷 등 정보통신 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보 자원을 효과적으로 검색하기에는 많은 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 주석 에디터를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 볼 수 있으며, HTML 뷰를 통해 메타데이타를 수동으로 수정이 가능하다. 이 메타데이타는 RDF Repository로 저장할 수 있으며, 주석 뷰를 통하여 RDF 메타데이타 생성을 확인할 수 있다. 이렇게 생성된 RDF 메타데이타는 웹 로봇이 내용의 의미 파악 및 카테고리 정보를 쉽게 알 수 있도록 해준다. 본 논문은 검색 엔진을 통하여 논문 검색시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

청소년 대상 과학정보시스템의 구축 및 사용성 평가 연구

  • 곽승진
    • 한국문헌정보학회 학술발표논집
    • /
    • 2004.04a
    • /
    • pp.61-89
    • /
    • 2004
  • 지식정보자원의 급속한 증가에 따른 정보문제를 보다 효율적으로 해결하기 위해 다양한 기능을 갖춘 검색엔진들이 개발되고 있다. 메타검색은 다른 웹 검색서비스보다 더 포괄적인 검색을 수행할 뿐만 아니라 더욱 안정된 검색 기술로써, 다양한 검색 정보원들에 대한 검색결과를 시스템이 통합하여 제공하기 때문에 검색에 소요되는 시간과 노력이 덜 든다는 점에서 효율적이고 사용하기 용이한 장점이 있다(Selberg 1999). 그러나 이러한 메타검색의 장점에도 불구하고 기존의 연구에서는 많은 이용자들이 각 데이터베이스를 통합하여 검색하는 것보다 개별적으로 검색하고 그 결과를 스스로 통합하는 분리 인터페이스를 더 선호하고 검색결과에 더 만족하였으며, 검색 효율성도 더 높은 것으로 나타나고 있다.(박소연 1999). (중략)

  • PDF

LSTM Model Design to Improve the Association of Keywords and Documents for Healthcare Services (의료서비스를 위한 키워드와 문서의 연관성 향상을 위한 LSTM모델 설계)

  • Kim, June-gyeom;Seo, Jin-beom;Cho, Young-bok
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.75-77
    • /
    • 2021
  • A variety of search engines are currently in use. The search engine supports the retrieval of data required by users through three stages: crawling, index generation, and output of search results based on meta-tag information. However, a large number of documents obtained by searching for keywords are often unrelated or scarce. Because of these problems, it takes time and effort to grasp the content from the search results and classify the accuracy. The index of search engines is updated periodically, but the criteria for weighted values and update periods are different from one search engine to another. Therefore, this paper uses the LSTM model, which extracts the relationship between keywords entered by the user and documents instead of the existing search engine, and improves the relationship between keywords and documents by entering keywords that the user wants to find.

  • PDF

An XQuery Engine for MPEG-7 Based Digital Library Systems (MPEG-7 기반 디지털도서관 시스템을 위한 XQuery Engine)

  • 고은정;김철수;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.546-548
    • /
    • 2003
  • MPEC-7 메타데이타는 이미지의 칼라 히스토그램과 같은 멀티미디어 객체의 속성을 기술할 수 있어서, MPEG-7을 사용하는 멀티미디어 디지털도서관 시스템은 멀티미디어 객체에 대한 내용기반 검색을 가능하게 해준다. MPEC-7 메타데이타는 XML 데이터이며, 이애 대한 질의를 위해서는 XQuery와 같은 XML 데이터를 위한 질의어가 필요하다. 본 논문에서는 MPEG-7 데이터에 대한 XQuery 질의를 처리할 수 있는 XQuery 엔진을 제안한다. 엔진은 XQuery를 입력받아 정보검색을 위한 POT(Primitive Operation Tree)를 생성한다. 우리의 방식은 표준질의어인 XQuery를 처리함으로써 디지털도서관 시스템 사이의 상호 운영성을 확보할 수 있으며, XQuery 엔진과 정보검색기 사이의 표준 인터페이스로 사용할 수 있는 POT를 위한 primitive operation 집합을 정의하였으며, 또한 POT 상에서의 질의 최적화를 수행하여 검색 성능 향상을 도모하였다.

  • PDF

Noise Removal and Pattern Matching for Efficient Meta-Search of Web Documents (Web 문서의 효율적인 실시간 검색을 위한 잡음 제거와 패턴 정합 기법)

  • 강대기;이제선;함호상
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.132-134
    • /
    • 1998
  • 웹 상의 메타 검색 엔진, Push 프로그램 그리고 에이전트와 같은 웹 기반 응용 프로그램들은 웹 문서의 취득과 자동 필터링에 대한 능력을 필요로 한다. 이를 위한 인터페이스의 지식들은 대부분 코드 내에서 ad-hoc으로 구현되어 왔다. 본 논문에서는 취득된 웹 문서를 전처리하고 원하는 정보를 추출하기 위한 방법을 제시하고, 웹 상위 신문 기사에 대한 검색으로 실험해 보았다. 검색 시스템은 웹 문서의 전처리 과정을 통해 필요한 정보에만 집중할 수 있고, 아주 적은 양의 일반화된 지식을 토대로 원하는 정보를 용이하게 찾을 수 있었으며, 또한 웹 문서의 형식이 바뀌더라도 크게 영향을 받지 않으며, 새로운 웹사이트의 추가도 용이하였다. 본 논문의 방법으로 구현된 신문 기사 검색 시스템은, URL과 아주 적은 양의 지식만으로도, 10 개의 신문 웹사이트에서 문서를 가져와 효과적으로 해석할 수 있었다. 본 논문의 방법은 메타 검색 엔진이나, 잡지나 신문 기사 정보의 푸쉬(Push) 솔루션, 또는 상품 정보 검색 시스템 등의 설계에 활용될 수 있다.

  • PDF

Design and Implementation of a System for multimedia retrieval and Intelligent service supporting the Specification of TV-Anytime (TV-anytime 표준을 지원하는 멀티미디어 검색 및 지능화 서비스 시스템의 설계 및 구현)

  • 이종설;이윤주;박우출;이석필;조위덕
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2002.11a
    • /
    • pp.247-250
    • /
    • 2002
  • 본 논문에서는 인터넷 및 방송망 등과 같은 분산된 다수의 환경을 통해 배포되는 대용량의 멀티미디어 컨텐츠를 검색 및 저장하기 위한 TV-Anytime 멀티미디어 컨텐츠 맞춤형 시스템을 설계 및 구현한다. 본 논문에서는 멀티미디어 컨텐츠의 저장 및 검색, 획득을 위해 TV-Anytime 표준과 Mpeg-7 표준을 사용하였다. 구현한 저장관리 시스템은 메타데이터 객체 관리자, 메타데이터 인덱스 관리자, 개인화엔진, 메타데이터 검색 API, Location Handler 모듈 등으로 구성된다. 본 논문에서 구현한 저장관리 시스템은 메타데이터의 처리를 위해 DOM/SAX 인터페이스를 지원하며 메타데이터에 대한 내용검색과 애트리뷰트에 기반한 검색을 제공하며, 사용자 프로파일을 이용하여 개인화 된 지능형 맞춤 서비스를 제공한다.

  • PDF