• 제목/요약/키워드: 검색 기능

검색결과 1,946건 처리시간 0.025초

인터넷 홈페이지 검색시스템 구현과 검색효율 향상 (Implementation of an Internet Homepage Retrieval System and Improvement of Retrieval Efficiency)

  • 박현주;최재덕;강상배;박승;박용욱;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.227-232
    • /
    • 1997
  • 이 논문은 인터넷 홈페이지를 검색하는 정보검색시스템인 미리내 시스템을 제시한다. 웹 문서의 특성을 고려하여 로봇의 기능을 확장하고, 색인, 등록, 수정, 삭제, 분류의 자동화를 구현하여 관리효율을 높인다. 자동화에 따른 문제점과 해결방법을 제시하고, 불리언질의검색 외에 자연언어질의 검색에서 질의어 확장의 방법으로 웹페이지 링크속성검색, Relevance feedback을 통한 검색효율을 높인다.

  • PDF

Open API를 활용한 다국어 정보검색 시스템 모델링에 관한 연구

  • 황세찬;김흥철;김선진;정주석;강신재
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.129-132
    • /
    • 2009
  • 본 논문은 오픈 API를 이용하여 다국어 정보검색 시스템을 모델링하는 방법론을 제시한다. 웹 2.0이 대두되면서 웹 2.0의 개념을 활용한 기술들이 발달하고 있는데, 그 중 한 기술이 오픈 API이다. 기업에서 개발한 새로운 서비스나 기능, 데이터 등을 API로 공개함으로써 사용자들이 공개된 API를 이용하여 새로운 서비스를 쉽게 개발할 수 있게 되었다. 본 연구에서는 구글, 플리커, 유튜브, 네이버, 다음 등의 사이트에서 제공하는 오픈 API를 이용하여, 다국어 정보 검색 시스템을 구현하였다. 구글 번역 API를 이용하여 한국어 질의어를 검색 대상 언어(영어, 일본어, 중국어 등)로 번역한 후, 소설 웹 사이트(플리커, 유튜브, 다음, 네이버 등)의 정보를 검색하고, 검색된 결과 내 텍스트를 다시 한국어로 번역한 후, 통합된 검색 결과를 사용자에게 보여준다.

  • PDF

오디세우스/parallel-OOSQL: 오디세우스 객체 관계형 데이터베이스 관리 시스템을 사용한 병렬 정보 검색 시스템 (ODYSSEUS/Parallel-OOSQL: A Parallel Information Retrieval System Using the Odysseus Object-Relational Database Management System)

  • 류재준;이재길;이민재;황규영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.187-189
    • /
    • 2002
  • 인터넷의 성장과 함께 전자적인 형태로 표현되는 정보의 양이 급격하게 증가함에 따라, 문서를 병렬적으로 검색하는 병렬 정보 검색이 많은 양의 문서에 대한 빠른 검색을 지원하는 것에 있어 더욱 중요한 역활을 하고 있다. 병렬 정보 검색 시스템을 구현하기 위해서는 역 색인을 분활하고 분활된 역 색인을 병렬적으로 검색하는 것이 필요하다 역 색인을 분활하는 방법으로는 다음과 같은 두 가지 방법이 있다: 1) 문서 식별자를 기반으로 하는 분활 방법과 2) 키워드 식별자를 기반으로 하는 분활 방법. 그러나 각 방법은 단점들을 가지고 있다. 본 논문에서는 정보 검색 기능이 밀결합된 데이터베이스 관리 시스템인 오디세우스를 사용하여 병렬 정보 검색 시스템을 설계하고 구현한다. 첫째로, 기존의 역 색인 분할 방법을 분석하고 각 분말 방법의 단점들을 보완할 수 있는 혼합 분활 방법을 제안한다. 둘째로, 많은 양의 문서에 대해 성능 저하의 원인이 되는 대형 포스팅을 분할 하는 방법을 제안한다. 마지막으로 제안된 시스템의 유용성을 보이기 위해 실험을 수행한다. 예제 데이터베이스로서는 이백만 건의 웹 페이지를 사용한다. 실험 결과, 질의 저리 시간이 역 색인 분말의 블록의 개수에 근사하게 비례하여 줄어들고 시스템이 좋은 확장성을 가짐을 보인다.

  • PDF

객체 특징을 이용한 내용 기반 검색 시스템 (Content-based Retrieval System using Object Features)

  • 정성호;황병곤;이상열
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.83-87
    • /
    • 2001
  • 본 연구에서는 입력된 영상을 구성하는 객체의 형태 특징을 이용한 영상 검색 시스템을 제안한다. 현재 MPEG-7의 XM에서 제안된 영상 검색 기술은 정확한 검색이나 유사도를 측정한 수 있는 기능을 가지는 객체정보를 정확하게 추출했다는 가정하에서 기술되고 있다. 그러나 실제 영상에서 물체의 외곽선을 정확히 추출하는 것은 매우 어려우며 물체 내부에 중요한 특징이 있을 때 이를 표현하기도 어렵다. 따라서 현재의 영상 검색 시스템에서는 물체의 추출 없이 물체 외곽선 및 내부 특징에 대한 대략적인 정보를 이용하여 검색을 할 수 있는 형태 위주의 정보가 필요하다. 이를 위해 8방향 chain code를 이용하여 입력 영상으로부터 물체의 중요한 특징 중 하나인 물체의 내부 외부의 경계선을 추출하여 영상의 특징으로 이용한다. 이렇게 함으로써 기존의 물체 추출의 과정없이 형태에 대한 영상 검색을 수행한 수 있다. 형태특징을 얻기 위해서 먼저 체인코드를 이용하여 경계선 추출을 추출하였다. 형태특징으로 객체의 경계선과 무게중심까지의 합, 표준편차 그리고 객체의 장축과 단축 비율 등을 추출하였다. 이러한 형태특징 정보를 이용하여 데이터 베이스에 저장된 영상과 질의 영상을 비교하여 유사도 순위에 따라 후보 영상들을 검색하였다. 환 실험의 결과 크기, 회전 이동 등의 변화에 둔감하였다.

  • PDF

웹 상의 정보검색을 위한 지능형 검색시스템의 연구 (A Study of Practical Search System for Information Retrieval on the Web)

  • 박병율;임종태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1737-1740
    • /
    • 2002
  • 검색시스템은 분류시스템과 지식탐사 시스템을 결합하여 구성한 복합적인 시스템으로 일반 사용자들에게 자신이 일하는 정보의 데이터를 우선적으로 제공한다. 시스템의 특징으로 겉으로 보기에는 일반 검색엔진과 유사하나, 시스템적으로는 요구하는 각종 기능과 검색 기법, 지식탐사기법이 들어있다. 시스템에서는 문서 분류기법과 문서와 검색어 사이의 연관성을 찾기 위한 방법, 문서간의 연속적인 사건을 통한 검색 패턴 탐사기법을 사용하였다. 이들은 시스템의 검색과 분류 결과를 지금까지보다 더욱 인공지능에 가깝도록 하여 준다.

  • PDF

한글 인터넷 정보검색 시스템의 기술방향 (The State of the Art in Internet Information Retrieval System)

  • 이수현;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.59-62
    • /
    • 1996
  • 빠르고 다양하게 늘어나는 정보 더미 속에서 사용자가 원하는 정보를 쉽고 정확하게 찾아주는 방법이 바로 정보 검색이다. 최근에는 인터넷을 이용하여 세계 각처에 흩어져 있는 데이터를 찾거나 웹 홈 폐이지를 찾아 주는 인터넷 정보 검색 프로그램들이 각광을 받고 있다. 본 논문에서는 현재 국내외에서 상용되고 있는 인터넷 정보검색 시스템의 검색 방법에 따른 특성을 살펴보고 국내에서 개발된 한국어 정보검색 시스템과 외국에서 개발된 정보검색 시스템과의 기능을 비교함으로써, 한국어 정보검색 시스템의 처리 항목을 제시한다.

  • PDF

SGML/XML 검색 시스템의 설케 및 구현 (Design and Implementation of a SGML/XML Document Retrieval System)

  • 고승규;조승기;최윤철;고견
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.99-102
    • /
    • 2000
  • 이기종 간의 문서 교환 표준으로 제안되 SGML은 문서의 구조정보를 표현할 수 있는 장점으로 인해 CALS(Commerce At Light Speed), EC(Electronic Commerce), EDI(Electronic Data Interchange), 전자 도서관(Digital Library) 등 여러 분야에서 사용되고 있다. 이렇게 SGML이 여러 분야에서 사용됨에 따라 많은 SGML 문서 중에서 원하는 문서를 효율적으로 찾아줄 수 있는 검색 시스템의 필요성이 증가하고 있다. 이에 본 연구실에서는 기본적인 구조 검색을 지원하는 SGML 문서 관리시스템을 기개발하였다. 그러나 이 시스템은 구조 검색을 효과적으로 지원하기 못하기 때문에 본 연구에서는 구조 검색의 기능을 정의하고, 이를 지원하는 새로운 구조 질의어를 정의하였다. 또한 이러한 구조 검색을 효과적으로 지원하기 위한 구조 색인을 정의하였다. 그리고 구조 검색 방식으로 세가지 방식을 각각 구현 및 실험하여 그 중에서 성능이 뛰어난 절충식을 이용하여 검색 시스템을 구현하였다.

  • PDF

TV-Anytime 메타데이터 검색을 위한 XQuery 엔진 (An XQuery Engine for searching TV-Anytime metadata)

  • 박종현;김병규;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.551-553
    • /
    • 2003
  • TV-Anytime은 국제 표준으로 자리잡아가고 있는 차세대 디지털 방송용 메타데이터로서 사용자가 직접 원하는 방송을 검색하고 선택하여. 선택한 멀티미디어 데이터를 저장하였다가 시간과 장소에 구애받지 않고 사용할 수 있도록 하는 것을 목표로 하고 있다. 이러한 TV-Anytime 메타데이터를 효율적으로 사용하기 위해서 TV-Anytime 메타데이터를 검색하기 위한 검색엔진은 필수적이다. 본 논문에서는 TV-Anytime 메타데이터가 XML 형식을 따른다는 점을 고려 하여 XML 데이터를 검색하기 위한 표준 질의어인 XQuery를 TV-Anytime 메타데이터의 검색을 위한 질의어로 사용하여 XQuery엔진을 설계하고 구현하였다. 본 논문에서 구현한 XQuery엔진은 XQquery를 검색어로 사용하기 때문에 디지털방송 환경에서 시스템 간의 상호 운용성을 높이고, 보다 풍부한 질의를 가능하도록 한다. 또한 XQuery엔진은 DB에 엘리먼트 단위로 분할되어 저장된 TV-Anytime 메타데이터를 효율적으로 검색할 수 있도록 XQuery를 SQL로 변환하는 기능을 수행한다.

  • PDF

MPEG-7과 TV-Anytime 기반 방송용 메타데이터 관리시스템 (The Metadata management system based on MPEG-7 and TV-Anytime for broadcasting)

  • 박종현;이민우;이용희;정민옥;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.175-177
    • /
    • 2003
  • 차세대 디지털 방송용 메타데이터 표준인 TV-Anytime은 사용자가 직접 원하는 방송을 검색하고 선택하여, 선택한 멀티미디어 데이터를 저장하였다가 시간과 장소에 구애받지 않고 사용할 수 있도록 하는 것을 목표로 하고 있다. Mpeg-7은 멀티미디어 컨텐츠를 위한 메타데이타 표준으로 본 논문에서는 TV-Anytime 메타데이터에서 부족한 내용기반 검색을 위하여 사용한다. 방송용 메타데이터 관리시스템은 TV-Anytime 메타데이터를 저장, 관리하고 검색하는 기능을 수행할 뿐만 아니라 Mpeg-7을 방송용 메타데이터에 추가하여 사용자에게 보다 풍부한 검색을 가능 하도록 내용기반 검색을 지원한다. 또한 메타데이터 관리시스템은 검색을 위한 질의어로 XML 검색을 위한 표준질의어인 XQuery를 사용하므로 상호 운용성을 높일 뿐만 아니라 향후, XML 데이터의 검색이 필요한 어떠한 응용에서도 사용 가능할 것이다.

  • PDF

객체 탐지 알고리즘 기반 이미지 검색 시스템 (Image Search System Based on Object Detection Algorithm)

  • 안지현;박승민
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.685-687
    • /
    • 2023
  • 최근에 이르러 인공신경망의 발전은 CNN(Convolutional Neural Network) 알고리즘을 활용한 이미지 분석 및 검색 시스템에 비약적인 기여를 하고 있다. 이는 이미지를 입력으로 받아 유사한 이미지를 찾아내는 기능을 향상시키는 연구를 촉진시켰다. 이와 같은 기술의 실용화는 다양한 분야를 포괄하며, 대표적으로 쇼핑몰의 상품검색, 검색 엔진 등에 응용되어 사용자의 편의를 제고하고 있다. 이에 따라 상품명에 대한 정보가 없는 상황에서도 단순한 이미지 정보를 통해 원하는 상품을 검색하는 것이 가능해졌다. 그러나, 실제 세계의 이미지에는 다양한 객체들이 복잡하게 혼재하고 있어 CNN 알고리즘 단독으로는 이미지 내부의 객체를 정확히 분석하고, 그 객체가 포함된 다른 이미지들을 효과적으로 검색하는데 한계가 있음이 인지되고 있다. 본 연구는 이러한 문제점을 개선하기 위해 객체 탐지 알고리즘을 적용하는 방안을 모색하였다. 본 논문에서는 객체 탐지 알고리즘을 통해 이미지 내부의 객체를 분석하고, 그에 따른 유사 객체를 포함하는 이미지를 찾아내는 전략을 제시한다. 이를 통해 이미지 분석 및 검색의 정확성을 더욱 향상시킬 수 있는 가능성을 제안한다.

  • PDF