• 제목/요약/키워드: 학술정보 검색엔진

검색결과 344건 처리시간 0.032초

HCI를 위한 다중 디스플레이와 웹 정보검색 (MultiDisplay for HCI and Web Information Retrieval)

  • 양현택;박나연;김원중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.402-404
    • /
    • 2000
  • 현재 WWW(World Wide Web)는 가장 중요한 정보전달 및 획득 수단이 되었다. 대부분의 네트워크 사용자들은 웹에서 정보를 습득하기 위하여 대부분 검색엔진(Search Engine)을 사용한다. 그러나 웹에 등록되는 정보의 종류와 분량이 폭발적으로 증가함에 따라 검색엔진들이 제공하여 주는 인덱스화된 정보의 리스트들이 너무 많고, 또한 많은 문서들은 중복되어 나타나 사용자들이 효율적으로 정보를 검색하는데 문제점이 되고 있다. 본 연구에서는 다중디스플레이(MultiDisplay) 기법을 이용하여 사용자들에게 친숙하고, 웹의 정보검색에 필요한 시간과 노력을 대폭 줄이는 방안을 제시하였다.

  • PDF

내용기반 웹 서비스 검색 엔진의 개발

  • 손승범;이규철
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2006년도 춘계학술대회
    • /
    • pp.656-699
    • /
    • 2006
  • 웹 서비스는 사용자가 다양한 인터페이스 정의와 교환 메시지 형식을 가지는 서비스를 개발하는데 있어 보다 효과적이고 단일화된 방법을 제공한다. 웹 서비스에서 인터페이스 정의와 교환 메시지 형식은 WSDL 통해 정의되며, 이 WSDL 문서를 통해 이용할 서비스의 인터페이스와 교환 메시지 형식을 파악하여 빠르게 해당 서비스를 이용할 수 있도록 한다. 이러한 웹 서비스의 등록과 검색을 위해서는 레지스트리 방식을 이용한다. 개발된 서비스에 관한 설명 정보는 서비스 제공자에 의해 작성되어 레지스트리에 등록되며, 서비스 요청자는 레지스트리로부터 필요한 서비스를 검색하여 이용한다. UDDI는 웹 서비스를 위한 분산 레지스트리 표준으로 웹 서비스를 위한 등록과 검색 메커니즘을 제공한다. UDDI에서 지원하는 검색 메커니즘은 크게 키워드 검색과 비즈니스와 서비스에 대한 카테고리별 검색으로 구분된다. 키워드 기반 검색은 SQL LIKE 연산을 통해 비즈니스와 서비스의 이름에 대하여 부분 문자열이 일치하는지 검사하는 방식으로 이루어진다. 이러한 UDDI 의 키워드 기반 검색은 등록된 서비스의 이름 이외의 내용 정보에 대한 검색을 지원하지 못하므로 효과적인 검색을 지원하지 못하는 단점을 가진다. 또한 UDDI는 WSDL 문서의 내용에 대한 검색은 지원하지 못하는 단점을 가진다. 이에 따라 현대의 서비스 검색은 서비스의 이름에 대한 검색만을 지원한다. 이러한 현재의 웹 서비스 검색에서의 문제점을 해결하기 위해서는 UDDI 에 등록된 설명 정보와 WSDL 문서 모두에 대한 내용 기반의 검색을 지원하고 검색 결과를 순위화 (ranking)하여 제시할 수 있는 검색 엔진이 요구된다. 이 논문은 이러한 문제점들을 해결할 수 있도록 내용 기반 검색을 지원할 수 있는 웹 서비스를 위 한 검색 엔진을 제안한다. 제안한 검색 엔진은 UDDI 등록 정보에 대하여 내용 기반 검색을 수행할 수 있도록 벡터 공간 모델을 활용한 유사도 비교 방법을 이용한다. 또한 UDDI 등록 정보 외에 실질 적인 서비스의 인터페이스와 교환 메시지 형식에 대한 비교의 수행을 위하여 WSDL 문서에 대한 유사도 비교를 수행한다. 유사도 측정시 UDDI 등록 정보와 WSDL 문서와 같은 계층적인 문서 구조를 검색 결과에 반영할 수 있는 방법을 지원한다. 지원하는 검색 방법은 두 가지로 키워드 검색과 함께 텀플릿 검색을 지원한다. 템플릿 검색은 서비스의 등록 정보 외에 인터페이스 정의가 얼마나 일치하는지를 비교하기 위해 WSDL 문서에 대한 유사도를 비교할 수 있도록 한다. 이러한 검색의 지원을 통해 제안한 웹 서비스를 위한 검색 엔진은 기존의 레지스트리를 이용한 검 색 방법보다 정확한 검색 결과를 제공한다.

  • PDF

유전자 알고리즘을 이용한 WWW 정보검색 (WWW Information Retrieval Using a Genetic Algorithm)

  • 서영우;장병탁
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 춘계학술대회 학술발표 논문집
    • /
    • pp.89-92
    • /
    • 1998
  • 최근 웹 상에서 여러 가지 정보에 대한 접근이 용이하여 많은 사람들이 다양한 검색 시스템을 이용하여 원하는 정보를 얻고 있다. 그러나 웹의 크기가 점점 커지고 그에 따른 사용량 또한 증가함에 딸 원하는 시간 안에 원하는 수준의 정보를 얻기가 매우 어렵다. 본 논문에서는 유전자 알고리즘을 이용하여 사용자의 요구수준에 보다 가까운 저오를 검색하는 학습방법에 대해 고찰한다. 검색 엔진의 초기 검색 결과로부터 만들어진 색인어들이 하나의 염색체로 구성한다. 염색체를 구성하고 있는 각 유전자는 사용자의 기호에 맞는 URL을 추천하기 위해 검색된 문서들과 연관성 값을 비교하여 유전 연산자에 의해 변형된다. 제시된 저오 검색 방식은 기존의 검색 엔진으로부터 반환되는 검색 결과로부터 사용자가 원하는 장보에 연관된 하나 이상의 색인어를 생성한 다음 재검색하여 연관성이 높은 소수의 정보만을 사용자에게 제공한다. 제안된 학습 방식과 기존 검색 엔진으로 검색된 결과를 초기의 사용자 정보 요구와의 연관성에 있어서 비교 분석하였다.

  • PDF

병렬 정보검색 시스템의 순차적인 검색엔진 알고리즘의 병렬화를 위한 연구 (A Study for Parallelizing Sequential Algorithms of Search Engine in Parallel Information Retrieval System)

  • 김석영;박미영;박혁로;정인상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.693-696
    • /
    • 2007
  • 대규모 데이터를 효율적으로 검색하기 위한 병렬 정보검색 시스템에서는 하드웨어 확장으로 인한 병렬화로 시스템 전체의 작업 처리량을 증가시켰다. 그러나 병렬 시스템 상에서 수행되는 검색엔진의 알고리즘들은 여전히 순차적으로 수행되기 때문에, 사용자의 개별적인 질의처리 시간은 단축되지 않는다. 본 연구는 검색엔진의 병렬화를 위하여 사용자 질의처리 과정과 역색인 파일처리 과정의 순차 알고리즘들을 조사하여 병렬화의 필요성과 가능성을 평가한다. 이러한 평가는 병렬 정보검색 시스템에서 수행되는 순차 알고리즘들의 효과적이고 체계적인 병렬화를 도모하고, 보다 효율적인 병렬 정보검색 시스템의 구축을 가능하게 한다.

TV-Anytime 메타데이터 검색을 위한 XQuery 엔진 (An XQuery Engine for searching TV-Anytime metadata)

  • 박종현;김병규;강지훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.551-553
    • /
    • 2003
  • TV-Anytime은 국제 표준으로 자리잡아가고 있는 차세대 디지털 방송용 메타데이터로서 사용자가 직접 원하는 방송을 검색하고 선택하여. 선택한 멀티미디어 데이터를 저장하였다가 시간과 장소에 구애받지 않고 사용할 수 있도록 하는 것을 목표로 하고 있다. 이러한 TV-Anytime 메타데이터를 효율적으로 사용하기 위해서 TV-Anytime 메타데이터를 검색하기 위한 검색엔진은 필수적이다. 본 논문에서는 TV-Anytime 메타데이터가 XML 형식을 따른다는 점을 고려 하여 XML 데이터를 검색하기 위한 표준 질의어인 XQuery를 TV-Anytime 메타데이터의 검색을 위한 질의어로 사용하여 XQuery엔진을 설계하고 구현하였다. 본 논문에서 구현한 XQuery엔진은 XQquery를 검색어로 사용하기 때문에 디지털방송 환경에서 시스템 간의 상호 운용성을 높이고, 보다 풍부한 질의를 가능하도록 한다. 또한 XQuery엔진은 DB에 엘리먼트 단위로 분할되어 저장된 TV-Anytime 메타데이터를 효율적으로 검색할 수 있도록 XQuery를 SQL로 변환하는 기능을 수행한다.

  • PDF

고속 한글 정보 검색을 위한 한글 MG 시스템 구현 (Implementation of Hangul MG System for Fast Hangul Information Retrieval)

  • 박미란;나연묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.330-332
    • /
    • 1998
  • 정보의 양의 기하급수적인 증가에 따라 저장 용량과 검색 공간의 크기로 인한 문제를 효율적인 압축기법을 사용함으로써 해결하려는 노력이 계속되고 있다. 국내의 경우 한글 처리가 가능한 정보 검색 엔진에 대한 요구가 크게 증가하고 있다. 본 논문에서는 정보 검색 엔진에 고압축 기법을 적용한 MG(Managing Gigabytes) 1.2 시스템과 한글 형태소 분석기 HAM 4.0을 사용하여 고속 한글 정보 검색이 가능한 한글 MG 시스템을 구현하였다. 또한 인터프리터 방식의 질의 처리기를 수정하여 웹에서 한글 문서를 검색하는 한글 MG 테스트베드를 구축하였다.

구조 정보 검색을 위한 XML 저장관리시스템 설계 및 구현 (Design and Implementation of an XML Repository System for Structural Retrieval)

  • 이종설
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.36-38
    • /
    • 1999
  • 본 논문에서는 대용량의 XML 문서를 효과적으로 저장, 관리 및 구조 기반 검색이 가능한 XML 저장관리시스템을 설계하고 구현한다. 구현한 XML 저장관리시스템은 관계형 모델을 기반으로 하고, XML 문서 전체를 저장하는 비분할 저장 모델을 사용하며, DTD에 따라 스키마가 생성되는 동적 스키마 생성 모델을 특징으로 한다. 본 논문의 XML 저장관리 시스템은 BRS 검색엔진과 ORACLE을 기반으로 하며 질의처리기 및 검색결과생성기, XML 객체관리자, XML 인덱스관리자, 구조검색엔진 등으로 구성된다. 이를 통하여 내용 및 애트리뷰트 검색 뿐만 아니라 다양한 구조 정보검색을 효율적으로 지원한다.

  • PDF

메타 데이타베이스를 이용한 퍼지 검색엔진의 설계 및 프로토타입 구현 (Design and Prototype of Fuzzy Information Retrieval Engine with Meta Database)

  • 유자영;김남영;박순철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1123-1126
    • /
    • 2001
  • 현재 인터넷상에는 수많은 정보가 산재되어 있고, 사용자가 원하는 정보를 검색해주는 수많은 검색엔진들이 개발되어 사용되고 있다. 하지만 기존의 검색엔진은 사용자들이 입력한 질의어만을 가지고 단지 시소러스 사선만을 참조해서 검색결과를 나타내는 게 대부분이이서 사용자의 구미에 맞는 정보를 찾는데 어려운 점이 많았다. 이에 본 논문에서는 MetaDB안에 있는 보편적 Meta 데이터를 이용, 사용자의 간단한 정보 입력과 합께 퍼지연산을 적용시킨 매칭기법으로 사용자의 특성에 맞는 검색결과를 도출하는 퍼지 검색시스템을 제안한다.

  • PDF

질의 추론을 통한 온톨로지기반 시맨틱 검색 시스템의 성능 향상 (Performance Enhancement of A Ontology-based Semantic Search System with Query Inference)

  • 하상범;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.157-159
    • /
    • 2004
  • 시맨틱 웹 기술을 활용한 시맨틱 검색은 문서의 의미를 온톨로지의 메타데이터로 생성하여 이를 바탕으로 검색을 수행하게 된다. 이와같은 온톨로지 기반의 시맨틱 검색은 논리를 바탕으로 추론을 적용할 수 있다. 본 논문에서는 온톨로지 기반의 추론을 적용한 시맨틱 검색 시스템을 언급하고 시맨틱 검색 시스템에서의 성능향상을 위해 추론엔진의 작업메모리 영역의 부하를 줄여 기존의 시스템보다 빠른 성능의 시맨틱 검색 시스템을 제안한다. 본 논문에서 시맨틱 검색 시스템의 성능향상을 위한 방법론으로는 다음과 같다 첫째, 추론엔진이 검색 도메인내의 전체 메타데이터를 가지고 추론을 수행하지 않고 메타데이터의 온톨로지부분 만을 사용하여 사용자가 원하는 질의문을 추론하여 검색에 사용하게 한다. 둘째, 시맨틱 검색 방법에서 Dirtectly 매칭 검색과 시맨틱 추론검색을 병행하여 수행하게 한다. 이를 위해 본 논문에서는 메타데이터의 온톨로지부분과 인스턴스부분을 분리하는 단계와 분리된 온톨로지부분에서 사용자가 원하는 질의를 추론하는 단계, 추론된 질의문을 검색시스템에서 매칭하는 단계를 수행하게 된다. 이러한 방법은 메타데이터의 양이 증가하여도 온톨로지부분은 증가하지 않으므로 추론엔진에서 전 방향 추론단계의 수행시간을 단축과 추론엔진의 호출 횟수를 단축시키는 결과를 가져온다.

  • PDF

빈 연결을 제거하는 메타 검색 엔진의 구현 (An Implementation of Meta Search Engine of Removing Empty-Link)

  • 김연곤;엄채임;변정용
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.359-364
    • /
    • 1998
  • 지금까지 정보 검색에 대한 많은 연구가 있어 왔지만, 여전히 여러 가지 문제들로 인해 사용자는 많은 시간을 소비하게 된다. 본 논문에서는 이러한 문제를 해결하기 위해 검색결과를 분석하여 중복된 URL을 제거하고, 접근이 불가능한 URL 정보를 사용자에게 보여준다. 해결 방안으로는 멀티쓰레드를 이용한 로봇 에이젼트가 자동으로 각 URL을 방문함으로써 가능하게 했으며, 사용자는 직접 방문하지 않고도 접근 불가능한 이유를 미리 알게된다. 구현된 메타 검색 엔진을 기존의 검색 엔진들과 비교 했을 때 약 13%의 효율성 향상을 가져왔으며, 앞으로 시소러스 등을 이용한 더 많은 연구가 진행될 것이다.

  • PDF