• Title/Summary/Keyword: 웹 검색시스템

Search Result 1,329, Processing Time 0.029 seconds

SWOSpark : Spatial Web Object Retrieval System based on Distributed Processing (SWOSpark : 분산 처리 기반 공간 웹 객체 검색 시스템)

  • Yang, Pyoung Woo;Nam, Kwang Woo
    • Journal of KIISE
    • /
    • v.45 no.1
    • /
    • pp.53-60
    • /
    • 2018
  • This study describes a spatial web object retrieval system using Spark, an in - memory based distributed processing system. Development of social networks has created massive amounts of spatial web objects, and retrieval and analysis of data is difficult by using exist spatial web object retrieval systems. Recently, development of distributed processing systems supports the ability to analyze and retrieve large amounts of data quickly. Therefore, a method is promoted to search a large-capacity spatial web object by using the distributed processing system. Data is processed in block units, and one of these blocks is converted to RDD and processed in Spark. Regarding the discussed method, we propose a system in which each RDD consists of spatial web object index for the included data, dividing the entire spatial region into non-overlapping spatial regions, and allocating one divided region to one RDD. We propose a system that can efficiently use the distributed processing system by dividing space and increasing efficiency of searching the divided space. Additionally by comparing QP-tree with R-tree, we confirm that the proposed system is better for searching the spatial web objects; QP-tree builds index with both spatial and words information while R-tree build index only with spatial information.

A Design of Book Search program based on the Semantic Web (시맨틱 웹 기반의 도서검색 프로그램 설계)

  • Choi, Jun-nyeong;Lee, Ji-hun;Jung, In-jung;Yu, Don-hui
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.05a
    • /
    • pp.130-131
    • /
    • 2014
  • 시맨틱 웹은 1998년 웹의 창시자인 Tim Berners Lee가 제안을 한 웹 기술로써 인간의 언어를 이해하고 인간과 쉽게 의사소통이 가능한 네트워크를 말한다. 즉 컴퓨터 스스로 웹에 연결된 정보의 의미를 인식하고 사용자가 필요로 하는 정보를 검색하며 검색된 정보에서 지식을 유추할 수 있는 기능을 제공하는 지능형 웹 환경이다. 이런 시맨틱 웹 개념을 적용한 사례로는 네이버 시맨틱 웹 영화검색 이있다. 본 논문에서는 네이버 시맨틱 웹 영화검색 시스템을 벤치마킹한 도서검색 서비스 설계를 제안하고자 한다. 본 도서검색 서비스는 온톨로지 개념을 적용하여 도서와 관련된 검색 카테고리를 설정하며, 간단한 시나리오는 다음과 같다. 한 권의 책을 검색하면 해당 책과 연관된 첫 번째 카테고리로 출판사, 제작한 년도, 저자, 장르, 관련 검색 도서 등의 데이터들이 상단에 제시된다. 제시된 카테고리에서 임의의 항목을 선택하면 그 하단 공백에 선택된 항목과 연관된 카테고리에 해당하는 항목들이 제시된다. 예를 들어, 출판사를 선택한다면 해당 출판사에서 출간된 도서들이 하단 공백에 열거가 되고 상단 두 번째 카테고리에 원작국가, 저자 관련 책, 수상정보, 공동 집필자, 책을 원작으로 확장된 컨텐츠 등 또 다른 카테고리가 우측으로 생성이 되며 선택을 할 수 있게 된다. 본 논문에서 제안하는 시맨틱 웹 기반 도서검색 서비스는 사용자가 검색하고자 하는 정보를 보다 효율적이고 사용자 중심에서 제공할 수 있다고 사료된다.

  • PDF

Implementation of a Large-scale Web Query Processing System Using the Multi-level Cache Scheme (계층적 캐시 기법을 이용한 대용량 웹 검색 질의 처리 시스템의 구현)

  • Lim, Sung-Chae
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.14 no.7
    • /
    • pp.669-679
    • /
    • 2008
  • With the increasing demands of information sharing and searches via the web, the web search engine has drawn much attention. Although many researches have been done to solve technical challenges to build the web search engine, the issue regarding its query processing system is rarely dealt with. Since the software architecture and operational schemes of the query processing system are hard to elaborate, we here present related techniques implemented on a commercial system. The implemented system is a very large-scale system that can process 5-million user queries per day by using index files built on about 65-million web pages. We implement a multi-level cache scheme to save already returned query results for performance considerations, and the multi-level cache is managed in 4-level cache storage areas. Using the multi-level cache, we can improve the system throughput by a factor of 4, thereby reducing around 70% of the server cost.

Information Retrieval System Using Korean Speech Recognition on the Web Browser (웹 브라우저 상에서 한국어 음성인식을 이용한 정보검색 시스템)

  • 이항섭
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.35-38
    • /
    • 1998
  • 웹 브라우저 상에서 한국어 음성인식을 이용한 정보검색 시스템에 대한 것이다. 이 시스템의 특징은 웹 브라우저 상에서 보여지는 Hypertext Word를 인식할 수 있는 거승로 기존의 웹 브라우저를 마우스 click 대신 음성인식을 이용하여 사용할 수 있다는 것이다. 웹 브라우저를 통해서 보여지는 고정되지 않고 계속 하여 변화하는 인식후보를 인식하기 위해 당 연구실에서 개발한 가변 어휘 인식기를 사용하였다. 시스템은 windows 95/NT 환경에서 개발되었으며, 사용자가 새로운 인터페이스를 배울 필요 없이 바로 사용할 수 있도록 사용자 편의성 부분도 고려하여 개발되었다. 개발된 시스템은 독립 환경, 독립 화자에 대해 실험한 결과 130여개의 단어에 대해 편균 90% 정도의 인식성능을 보인다.

  • PDF

Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion (자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색)

  • 윤성희;장혜진
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.2
    • /
    • pp.235-248
    • /
    • 2004
  • For the users of information retrieval systems, natural language query is the more ideal interface, compared with keyword and boolean expressions. This paper proposes a retrieval technique with expanded keyword from syntactically-analyzed structures of natural language query as user input. Through the steps combining or splitting the compound nouns based on syntactic tree traversal of the query, and expanding the other-formed or shorten-formed into multiple keyword, it can enhance the precision and correctness of the retrieval system.

A Study for Search Method WBI Components Based-on XML Component Specification (XML 명세를 통한 교육컴포넌트 검색에 관한 연구)

  • Jeon, Ju-Hyun;Hong, Chan-Ki
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1081-1084
    • /
    • 2002
  • 웹 기반 교육 컴포넌트를 효과적으로 재사용하기 위해서는 충분히 많은 수의 교육컴포넌트 존재, 등록과 검색시스템의 지원, 효과적인 교육컴포넌트의 서술 등의 문제가 해결되어야 한다. 이 논문에서는 웹 기반 교육시스템에 컴포넌트 개념을 도입하여 재사용성을 높이는 연구의 연장으로 등록된 교육 컴포넌트를 검색하여 새로운 교육 소프트웨어 개발에 사용할 때 생산성과 신뢰성 증대를 위하여 효과적인 교육 컴포넌트 검색을 제공하기 위한 XML기반의 교육컴포넌트 검색 방법을 제시하고 검색 시스템을 설계 구현하였다.

  • PDF

Investigating Web Search Behavior via Query Log Analysis (로그분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구)

  • 박소연;이준호
    • Journal of the Korean Society for information Management
    • /
    • v.19 no.3
    • /
    • pp.111-122
    • /
    • 2002
  • In order to investigate information seeking behavior of web search users, this study analyzes transaction logs posed by users of NAVER, a major Korean Internet search service. We present a session definition method for Web transaction log analysis, a way of cleaning original logs and a query classification method. We also propose a query term definition method that is necessary for Korean Web transaction log analysis. It is expected that this study could contribute to the development and implementation of more effective Web search systems and services.

Development of an Exteneded UDDI for Quality based Web Service Retrieval (품질기반의 웹 서비스 검색을 위한 확장 UDDI 개발)

  • Park Sung-Soo;Lee Jong-Keun;Yoon Jee-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.79-81
    • /
    • 2006
  • 최근 이질 분산형태를 갖는 정보를 통합하는 방법으로서 웹 서비스 기술을 이용한 바이오 정보 시스템이 개발 구축되고 있다. 이러한 웹 서비스 기반 바이오 정보 시스템으로 Bio-MOBY. DDBJ, MyGrid Project 등을 들 수 있다. 그러나 이들 기존 시스템에서는 선택한 DB에 대한 accession 번호 검색을 지원하거나. 시스템에 등록된 서비스의 선택만이 허용되는 등 이용형태가 매우 제한적이다. 또한 서비스의 품질 평가 기능이 제공되지 않아 서비스의 관련성을 판별하지 못하며, 심지어 링크가 바르게 연결되지 않았거나, 작동하지 않는 서비스의 분별조차 불가능한 실정이다. 본 논문에서는 이러한 문제점을 해결하고자 서비스 검색과정에서 웹 서비스의 품질을 평가하고 평가된 품질을 기반으로 웹 서비스를 순위화해 사용자에게 제공하는 품질기반 UDDI를 제안한다. 이를 위해 우리는 Gene Ontology를 이용한 연관 키워드 검색방식과 키워드 기반의 서비스 품질 평가 방법을 제안하고, 본 방식의 유용성을 보인다.

  • PDF

A Study on Ontology-Based Semantic Search System (온톨로지 기반의 시맨틱 검색 시스템에 대한 연구)

  • Heo, Sun-Young;Kim, Eun-Gyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.463-466
    • /
    • 2007
  • 현재 웹 서비스에서 주로 사용하고 있는 키워드 기반 검색은 사용자의 의도와는 상관없는 정보까지 검색하는 경우가 많아서, 실제로 원하는 정보를 찾는데 많은 시간과 노력을 요구한다는 단점이 있다. 이러한 단점을 보완하기 위해서 최근 시맨틱 웹이라는 개념이 등장하였으며, 본 논문에서는 검색 결과의 신뢰성을 향상시키기 위해 온톨로지를 기반으로 시맨틱 검색시스템을 설계하였다. 본 논문에서 설계한 온톨로지 기반의 시맨틱 검색 시스템은 기능적으로 크게 두 부분으로 구성되어 있다. 즉, 자료 수집을 하는 로봇 에이전트와 온톨로지를 기반으로 자료를 검색하는 시맨틱 검색 엔진으로 구성된다. 로봇 에이전트는 자율적으로 웹을 순회하면서 자료를 수집하고 필터링하여 메타데이터 저장소로 가져오는 역할을 한다. 시맨틱 검색 엔진은 사용자의 검색 폼으로부터 전달된 정보 검색 요구사항을 기초로 시맨틱 질의어로 변환한 후, 온톨로지 저장소를 활용하여 검색한다. 시맨틱 검색 엔진은 사용자가 입력한 검색어를 시맨틱 질의어로 변환해 주는 질의처리 모듈과 사용자의 의도를 추론하여 보다 향상된 검색을 가능하게 해주는 추론(Inference) 모듈, 온톨로지를 보관해주는 온톨로지 저장소 등으로 구성된다. 본 논문에서 설계한 온톨로지 기반의 시맨틱 검색 시스템은 키워드 기반 검색에 비해 사용자가 원하는 정보를 찾는데 소요되는 시간과 노력을 줄여 주고, 사용자의 의도에 적합한 정보를 제공할 것으로 기대된다.

  • PDF

Design and Implementation of a Web-Based Search Engine for Single Nucleotide Polymorphism Data (웹기반의 Single Nucleotide Polymorphism 데이터 검색 시스템의 설계 및 구현)

  • 양진옥;김상수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.160-162
    • /
    • 2002
  • SNP는 개인과 개인간의 DNA에 존재하는 한 염기 쌍의 차이(single base-pair variation)이다. SNP를 이용하면 사람마다 다른 유전병의 형태 등을 규명할 수 있다. 본 논문에서는 한국생명공학연구원의 유전체 사업단에서 개발해 오고 있는 웹기반 SNP데이터 검색 시스템의 설계와 구현에 대해서 설명한다. 본 시스템은 일반 속성(attribute)을 저장하고 검색하기 위해 PostgreSQL DBMS를 사용하고, DNA 시퀸스 검색을 위해 BLAST검색엔진을 사용한 약결합 아키텍쳐(loosely-coupled architecture)를 채택하고 있다. 즉, 일반 속성으로 저장될 수 있는 데이터들은 데이터베이스의 테이블들의 컬럼 값으로 저장하고 SQL 언어를 통해 검색할 수 있도록 하였으며, DNA 시퀸스 검색을 위해서는 BLAST에서 제공하는 인덱스를 구축하고 BLAST 명령어를 사용하여 검색할 수 있도록 하였다. 또한, 결과 분석 모듈을 구현하여 검색 결과들이 다른 웹 사이트의 데이터를 가리키도록 하였다.

  • PDF