• 제목/요약/키워드: 검색어 확장 시스템

검색결과 122건 처리시간 0.037초

KNetIRS : 키워드망을 이용한 정보검색 시스템 (KNetIRS : Information Retrieval System using Keyword Network)

  • 우선미;유춘식;이종득;김용성
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2185-2196
    • /
    • 1997
  • 기존의 정보검색 시스템들은 질의가 정확하지 않더라도 원하는 정보를 검색할 수 있도록 하기 위해 시소리스 (thesaurus)를 사용했다. 그러나 시소러스를 구축하고 유지하는데 드는 비용이 매우 높고 검색에 있어서도 완전하다고 볼 수 없다. 그래서 본 논문에서는 이러한 문제점들을 해결하기 위하여 키워드망을 이용한 정보검색 시스템인 KNetIRS를 설계 및 구현한다. 키워드망은 문서로부터 직접 추출한 키워드들로 구성된다. KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 역파일 (Iinverted file)의 개념에 기반을 둔 키워드망을 이용하여 데이터베이스에서 적합한 문서만을 탐색한다. 그리고 KNetIRS는 키워드망 브라우저(Keyword Network Browser)를 사용하여 질의를 확장하고, 분할 연산(spilt function)을 정의하여 "정보 검색", "정보", 그리고 "검색"과 같은 복합어에 관한 처리를 한다.

  • PDF

온톨로지 기반의 문화·관광지 검색 어플리케이션 구현 (Ontology-based Culture·Tourist Attraction Search Application)

  • 황태원;서정희;박흥복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.772-774
    • /
    • 2017
  • 현재 지역 문화 관광에 대한 개괄적인 단순 검색들은 많이 있으나, 온톨로지 기술을 적용한 체계적인 정보검색은 미약한 수준이다. 기존의 검색방법인 키워드 중심의 검색은 사용자가 원하는 의도와는 다른 검색 결과를 도출한다. 반면에 온톨로지를 이용한 시맨틱 검색은 추출한 웹 데이터들을 온톨로지로 구축하여 단어와 단어 간의 관계를 만들어 검색어와 관련된 정보를 보여준다. 따라서 관광객들이 해당 지역의 문화 관광지에 대해 검색 할 때, 검색결과에 의미 연관성을 포함하는 내용을 제공한다면 온톨로지를 통해 해당 지역의 문화 관광지, 이동수단, 연계된 장소 혹은 관련 행사에 대한 정보 등을 보다 쉽게 파악할 수 있을 것이다. 본 논문에서는 사용자에게 정확하고 신뢰성 있는 정보를 제공하기 위해 기존의 내부 데이터베이스에만 의존하던 검색 시스템을 확장하여 공공기관의 데이터베이스를 활용한 문화 관광지에 특화된 온톨로지 기반의 검색 시스템을 모바일 애플리케이션을 이용하여 제안하고자 한다. 이러한 효율적인 온톨로지의 구성으로 사용자에게 적합한 정보를 빠르고 정확하게 제공할 수 있다.

  • PDF

관계형 테이블을 이용한 W3C XQuery 변경 기능의 지원 (W3C XQuery Update facility on SQL hosts)

  • 홍동권
    • 한국지능시스템학회논문지
    • /
    • 제18권3호
    • /
    • pp.306-310
    • /
    • 2008
  • XML 질의어의 표준으로 인정받고 있는 XQuery의 검색 기능의 확장으로 새로운 XML의 삽입, 삭제 기능에 대한 표준화가 진행되고 있다. XML 데이터베이스가 단순한 문서 관리의 기능에서 벗어나 기존 데이터베이스의 장점인 OLTP 기능까지 지원하려는 노력을 하고 있다. 본 논문은 XQuery 검색 기능을 관계형 환경에서 지원하기 위한 선행 연구의 결과에 XQuery 변경 기능을 추가하기 위한 연구의 결과로 1) XML을 저장하기 위한 테이블 구조, 2) 계층 구조를 저장하기 위한 번호 부여 방식, 3) 효율적인 검색 기능을 지원하기 위한 경로 사용의 장.단점, 4) XQuery 변경 구문의 SQL 변환 과정을 제시한다.

문서 자동요약 기술을 적용한 클라우드 스토리지 기반 지능적 아카이빙 시스템 (Cloud storage-based intelligent archiving system applying automatic document summarization)

  • 유기동
    • 한국산업정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.59-68
    • /
    • 2012
  • 제로 클라이언트 체제는 기업의 문서 중앙화를 위해 제시된 최신의 방법이며, 이를 기업의 현실에 보다 적합하도록 토착화시키는 작업은 필수적이다. 본 연구는 제로 클라이언트 체제의 잘 알려진 보안 및 프라이버시 상의 문제점을 제외한, 사용 상의 문제점을 보완하고자 고안되었다. 즉, 작업자가 작업한 문서를 기업 클라우드 스토리지에 저장하고자 저장 카테고리를 검색하는 과정의 부담과 정확성을 향상시키기 위하여, 작업 문서의 주제어를 자동으로 파악하고, 이를 바탕으로 해당 문서가 저장되어야 하는 카테고리를 자동으로 검색하여 작업자의 확인을 통해 자동 저장되도록 하는, 지능적 아카이빙 방식을 제시한다. 본 연구에서 제시하는 주제어 자동 파악 및 자동 아카이빙을 위한 방법론과 프로토타입 시스템은 기업 환경에 적용이 가능할 정도로 정확성과 확장성을 갖추고 있다.

불리언 질의 최적화에 관한 연구 (A Study on Boolean Query Optimization in Information Retrieval)

  • 주원균;이민호;강무영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1879-1882
    • /
    • 2002
  • 본 논문에서는 불리언 모델을 지원하는 정보검색 시스템에서 사용자로부터 입력받은 불리언 질의를 효율적으로 연산하기 위한 3 가지 방법을 제안한다. 첫째, 불리언 대수를 사용하여 형태적으로 불필요한 노드를 제거한다. 둘째 색인어 출현 빈도 정보를 사용함으로써 빈도 0 을 가지는 노드와 이를 포함하는 노드의 연산 제외 여부를 결정하고, 연산 수행 시 시간이 적게 걸리는 순으로 피 연산자와 연산자의 순서를 재배열한다. 셋째, 불리언 질의 내에 복합 명사가 포함되어 있을 경우 구성 명사와 연산자의 조합을 이용한 질의 확장을 실시한다. 처음 두 가지 방법은 검색 속도의 향상을, 세 번째 방법은 정확도의 향상을 목표로 한다.

  • PDF

학습 객체를 기반으로 한 객체 지향 데이터베이스 시스템의 설계 (The Modeling of Object oriented Database basesed E-learning Object)

  • 김준모
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권9호
    • /
    • pp.941-946
    • /
    • 2004
  • 기존의 객체지향 데이터베이스에 학습 객체에 기반을 둔 새로운 클래스를 도입한 확장된 객체 지향 데이터 베이스의 모델을 설계한다. 이를 구현하기 위해 기존의 객체 데이터 베이스에 학습객체클래스를 도입하였으며, 이 클래스들을 연산하기 위한 학습객체 연산 클래스를 설계하였다. 그리고 확장된 객체 지향의 데이터 모델상에서 데이터베이스에 저장된 학습객체의 경험적 분류 모델에 기반을 둔 검색이 가능한 질의어를 설계하였다.

  • PDF

좌우접속정보를 이용한 명사추출기 (A Noun Extractor using Connectivity Information)

  • 안동언
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.173-178
    • /
    • 1999
  • 본 논문의 명사추출기는 정보검색시스템을 위한 색인어 추출기로 좌우접속정보를 이용한 형태소해석을 통하여 얻어진 형태소들 중에서 명사를 추출한다. 본 형태소해석기는 형태소해석을 위한 언어지식과 어절 분리 엔진을 분리하여 수정과 확장이 용이하게 하였다. 사용한 언어지식은 좌우접속정보로서 한 어절을 이루는 형태소들의 품사간의 접속여부를 행렬로 표현한 것이다. 어절 분리 엔진은 사전을 참조하여 한 어절에서 최장일치법에 의해 형태소를 분리하고 좌우접속정보를 참조하여 형태소 분리가 올바른지를 판단한다. 형태소들의 품사분류는 표준 태그셋을 기반으로 음절 정보를 추가하여 확장하였다. 형태소를 해석한 결과 미등록어가 발생하였을 때 미등록어에서 명사를 추정하는 모듈이 없기 때문에 재현율은 좋지 않았다.

  • PDF

분산 객체 관계 데이터베이스 시스템을 이용한 분산 XQuery 질의 처리기 설계 및 구현 (Design and Implementation of Distributed XQuery Query Processor using Distributed ORDBMSs)

  • 이재민;장건업;홍의경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.55-59
    • /
    • 2007
  • 최근 컴퓨팅 환경은 인터넷 환경의 웹을 기반으로 한 분산 컴퓨팅 환경으로 변화하고 있다. 그에 따라 XML 문서의 사용과 XML 문서의 양이 급속하게 증가하였으며, 언제나 쉽게 필요한 XML 문서에 접근할 수 있어야 한다. 또한 다양한 형태로 분산 저장된 XML 문서에서 원하는 데이터를 추출하고 변환하며, 단편화된 XML 데이터를 통합하는 작업들이 필요하게 된다. 따라서 XML 문서를 분산 객체 관계 데이터베이스 시스템에 효율적으로 저장하는 시스템을 개발하고, 분산 저장된 XML 문서에서 사용자가 필요한 정보를 검색할 수 있도록 하기 위해 XQuery 질의어를 지원하는 연구가 필요하다. 본 논문에서는 분산 객체 관계 데이터베이스 시스템에 저장된 XML 데이터를 접근할 수 있도록 하기 위해 XPath를 분산 SQL로 변환하여 실행하는 분산 XPath 의 처리기를 확장하여 XQuery를 분산 SQL로 변환하여 실행하는 분산 XQuery 질의 처리기를 설계 및 구현하였다.

  • PDF

객체지향 기법을 이용한 시소러스 관리 시스템의 개발에 관한 연구 (Development of a Thesaurus Management System based on the Object-Oriented Technique)

  • 박계숙
    • 정보관리학회지
    • /
    • 제13권2호
    • /
    • pp.5-18
    • /
    • 1996
  • 시소러스를 구축하기 위해서는 새로운 단어의 입력, 수정, 삭제 및 단어간 관계생성 등의 동적인 변하에 신속 정확히 대용할 수 있도록 시소러스 관리 시스템이 개발되어야 한다. 본 연구에서 개발한 시소러스 관리 시스템은 객체지향적 구조로 데이터베이스를 설계하였으며, GUI화면을 제공하여 이용자 인터페이스를 향상시켰다. 또한 시소러스를 구축하는데 있어서 동일한 영문 용어의 다양한 한글표기로 인한 정보검색 효율 저하 문제를 해결하기 위해 동의어의 확장에 역점을 두었다.

  • PDF

2단계 퍼지 지식베이스를 이용한 질의 처리 모델 (Query Processing Model Using Two-level Fuzzy Knowledge Base)

  • 이기영;김영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-16
    • /
    • 2005
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 따라서 본 논문에서는 문서 지식 구조를 파악하여 사용자 질의 용어와 색인어 사이의 내용 기반 유사도를 반영한 순위 재조정 모델을 제안한다. 이를 위해 전자는 시소러스 및 유사관계 행렬을 구축하여 주제 분석 메커니즘을 제공하고, 후자는 사용자 요구를 분석하기 위해 질의 확장 등의 탐색 모형을 수립하는 알고리즘을 제안한다. 따라서 본 논문에서 제안한 알고리즘은 검색 시스템의 정보 구조를 활용한 검색으로 재현율을 유지하면서 동시에 기존 퍼지 검색 모델의 단점인 정확률을 향상시키는 2단계 탐색모형을 수립하는 내용 기반검색 기법이라 할 수 있다.

  • PDF