• 제목/요약/키워드: 텍스트검색시스템

검색결과 351건 처리시간 0.027초

특허정보 검색을 위한 벡터스페이스 검색모텔의 적용 (Vector Space Model for Patent Information Retrieval System)

  • 원상훈;노태길;손기준;박정희;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.516-518
    • /
    • 2003
  • 본 논문은 특허 문서에 맞게 벡터스페이스 모델을 적용하여 특허정보 검색기를 구현한다. 기존의 상용 특허 검색 시스템의 문제점을 제시하고, 특허 문헌의 특징을 분석하여, 이를 반영한 특허 문헌 검색등의 벡터 스페이스 모델을 제시한다. 하나의 특허 문서는 서로 상이한 특성을 지닌 텍스트와 데이터의 조합으로 이루어져 있다. 따라서 이를 하나의 벡터로 표현하는 것이 용이하지 않다. 이에 대해 본 연구에서는 내용 필드들을 특성에 따라 둘 이상의 벡터로 표현하고, 수치 및 고유명 필드는 불린검색형태로 처리되는 혼합형 벡터 모델을 제안한다. 각 필드의 특징에 맞게 색인어를 추출하며, 텍스트 필드의 색인어률 벡터로 표현하는 과정에서는 잘 알려진 TF-IDF 가중치를 사용하되, 특허 문서가 IPC 특허 분류 기준에 따라 완전 분류되어 있는 문서라는 특징을 이용, 보다 정확한 가중치를 부여한다. 실험과 성능평가를 통하여 제안한 특허 모델의 유용성을 보인다.

  • PDF

탐색과 브라우징을 지원하는 하이퍼미디어 시스템의 설계 (Design of a hypermedia system for effective searching and browsing)

  • 고영곤;최윤철
    • 정보관리학회지
    • /
    • 제10권1호
    • /
    • pp.15-30
    • /
    • 1993
  • 하이퍼미디어 시스템은 멀티미디어 정보간의 연상적 관게를 링크, 노드개념에 입각하여 지원함으로써 기존의 데이타베이스 시스템이나 텍스트 검색 시스템의 한계성을 극복해 준다. 본 연구는 텍스트, 그래픽, 영상, 목소리/사운드 등의 멀티미디어 정보를 지원해 주는 하이퍼미디어 시스템을 설계, 구현하였고 시스템의 기능을 보여주기 위하여 성경과 성경 관련 정보에 적용하여 응용시스템을 구축하였다. 특히 본 시스템에서는 탐색과 브라우징 기능을 효율적으로 통합함으로써 하이퍼미디어 시스템의 정보검색 기능과 사용자 인터페이스를 높이도록 설계하였다. 국립중앙도서관에 제안한 고서용 MARC 포멧과 기술규칙을 기초로 그 특징적인 것을 요약 정리한 것이다.

  • PDF

웹기반 한글정보검색시스템의 구현 (An Implementation of Web-Based Korean Language Information Retrieval System)

  • 홍기채;정현수
    • 전자통신동향분석
    • /
    • 제14권6호통권60호
    • /
    • pp.9-21
    • /
    • 1999
  • 최근 인터넷상에는 매일 방대한 양의 정보가 창출되어 유포되고 있으며, 수많은 정보 제공 사이트들이 늘고 있다. 이용자들은 필요한 정보를 찾고 활용하기 위해 야후(Yahoo), 알타비스타(AltaVista) 등 국외 검색엔진(search engine)들과 심마니, 미스 다찾니 등 국내 검색엔진 등 인터넷상에 운용되고 있는 이들 시스템들을 이용하고 있지만, 대부분의 시스템들은 자체 정보 제공보다는 로봇 에이전트를 이용하여 인터넷 사이트에 등록되어 있는 다양한 분야의 홈페이지 정보들을 수집/분석하여 관련 사이트를 연결해주는 방식의 메타 검색엔진들로서 불필요한 정보들까지 제공함에 따라 이용자들이 필요로 하는 정보를 찾기에는 너무 많은 노력과 시간을 소모하게 되는 문제점을 안고 있다. 이에 본 고에서는 형태소 분석 및 시소러스 사전을 이용하여 검색의 정확성 및 재현율 향상을 고려하고, 주제어 중심의 불리언 검색뿐만 아니라 하이퍼텍스트 기반의 주제어 카탈로그 검색, 각기 다른 사이트의 검색엔진들로부터 질의한 결과를 통합하여 제공하는 지능형 통합검색, 이용자 프로파일에 근거하여 최신 업데이트된 정보를 주기적으로 제공해주는 맞춤정보서비스(Selective Dissemination of Information Service: SDI) 등을 통합한 인터넷 기반의 한글 정보검색시스템의 구현에 대한 내용을 기술하고자 한다.

의미 기반 정보 검색을 제공하는 이미지 게시판 시스템 (An Image Bulletin Board System providing Semantic-based Searching)

  • 정의현;조동찬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (A)
    • /
    • pp.733-735
    • /
    • 2004
  • 게시판 시스템은 양방향으로 정보를 교환하는 정보 시스템으로서의 높은 효용을 지니고 있으며, 웹과 결합하여 다양한 정보 시스템의 핵심 요소로 자리잡고 있다. 또한 이미지 등의 멀티미디어 정보를 게시물에 포함하여 효율적인 정보 공유에 사용되고 있다. 그러나 지금까지의 게시판 시스템은 게시물의 내용에 접근하기 위해, 단순한 텍스트 패턴 매칭에 의존하고 있다. 이러한 접근 방식은 텍스트 중심의 게시판에서는 어느 정도 효용을 갖지만. 멀티미디어를 포함하는 게시판의 경우에는 적용되기 어려운 단점을 갖고 있다. 본 논문에서는 이의 해결을 위해 이미지 데이터를 포함하는 게시물에 대해 시맨틱 태깅을 할 수 있는 게시판 시스템에 관하여 논한다. 제안된 시스템은 사전에 정해진 태깅 정보가 코드에 고착되지 않고, 외부에서 지정한 시맨틱 태깅을 동적으로 수용하는 구조물 갖고 있다. 이러한 구조를 통하여 이미지의 종류나 성격에 가장 적합한 태깅을 동적으로 지정할 수 있게 되며. 의미 기반의 검색을 지원하게 된다.

  • PDF

구조 및 의미 검색을 지원하는 비디오 데이타의 모델링 (Video Data Modeling for Supporting Structural and Semantic Retrieval)

  • 복경수;유재수;조기형
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.237-251
    • /
    • 2003
  • 이 논문에서는 비디오 데이타의 논리적 구조와 의미적 내용을 효과적으로 검색하기 위한 비디오 검색 시스템을 제안한다. 제안하는 검색 시스템은 비정형화된 비디오 데이타를 원시 데이타 계층, 내용 계층 그리고 키프레임 계층의 세 계층으로 구성하는 계층화된 모델링을 사용한다. 계층화된 모델링에 존재하는 내용 계층은 비디오 데이타에 대한 논리적인 계층 구조와 의미적 내용을 표현한다. 제안하는 검색 시스템은 모델링에 따라 텍스트 기반의 검색은 물론 시각적인 특징 기반의 유사도 검색을 지원한다. 또한 시공간 관계에 기반한 의미적 내용 검색과 유사도 검색을 지원한다.

감성 기반 음악 검색 및 추천 시스템 설계 (A Design of Music Retrieval and Recommendation System based on Emotion)

  • 윤보국;홍성용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(D)
    • /
    • pp.153-155
    • /
    • 2011
  • 최근 음악 검색 연구에서 일반적으로 사용되는 방법은 키워드 중심의 텍스트 기반 검색방식, 음원의 특징 정보나 허밍 질의 처리 등을 이용하는 내용기반 검색 방식 등이 있다. 그러나 이러한 검색 방식은 단순히 원하는 음악을 질의에 따라 검색해 주며 인간의 감성을 고려하지 못하고 있다. 따라서 본 논문에서는 질의에 의한 검색뿐만 아니라 질의한 음원과 감성정도가 같은 음원을 추천하는 인간 감성 기반 음악 검색 및 추천 시스템을 제안한다. 인간 감성 기반 음악 검색 및 추천 시스템은 크게 2가지 요소로 구성된다. 첫 번째는 사용자가 질의한 질의어를 분석하는 감성기반 검색추론엔진과 두 번째는 음원의 특징 정보 및 감성 정보를 가지고 있는 음원 감성 정보 데이터베이스로 구성된다. 사용자의 감성에 따라 음악을 검색하고 추천한다는 것은 향후 음반 산업에 큰 발전에 기여할 것으로 기대한다.

목적을 가진 게임을 이용한 사용자의 검색 의도 자동 획득 시스템 설계 (The automatic acquisition system design of the user's searching intention using Game With A Purpose(GWAP))

  • 양영욱;임희석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.810-812
    • /
    • 2009
  • 정보의 양이 기하급수적으로 증가함에 따라, 그 정보들을 효과적으로 제공하기 위해 검색 기술들이 개발 되었다. 현대 검색 기술은 단순 텍스트 매칭 기반으로 사용자의 의도와는 상관없는 정보까지 검색하는 경우가 많아서, 실제로 원하는 정보를 찾는데 많은 시간과 노력을 요구한다. 이런 단점들을 극복하고자 사용자의 검색 의도를 고려한 검색 기술들이 개발되었다. 검색 의도를 획득하는 방법에는 자동적인 방법과 수동적인 방법, 그리고 반자동적인 방법이 있다. 자동적인 방법은 사람이 아닌 컴퓨터를 통해서 획득이 이루어지기 때문에 사용자의 의도를 완벽히 반영하는 것이 어렵다. 수동적인 방법은 사람이 직접 참여하여 작성하기 때문에 사용자의 의도를 반영할 수 있지만, 시간과 비용이 많이 드는 단점이 있다. 반자동적인 방법은 위의 두 가지 단점을 보완할 수 있다. 본 논문에서는 반자동적인 방법인 목적을 가진 게임을 이용한 사용자의 검색 의도 획득 시스템을 사용한다. 이 후에 시스템에서 도입한 Game With A Purpose(GWAP)의 개념과 시스템의 구성, 그리고 발전방향 및 결론을 논의한다.

  • PDF

서지마크 데이터베이스로부터의 색인어 추출과 색인어의 검색 활용에 관한 연구 - 경북대학교 도서관 학술정보시스템 사례를 중심으로 - (A Study on the Extraction and Utilization of Index from Bibliographic MARC Database)

  • 박미성
    • 한국도서관정보학회지
    • /
    • 제36권2호
    • /
    • pp.327-348
    • /
    • 2005
  • 본 연구의 목적은 서지정보검색시스템의 색인 정의의 중요성을 강조하고 최적 색인의 기초 자료를 마련하기 위함이다. 이를 위해 서지마크 데이터베이스로부터 색인 태그 정의 및 정규화를 통한 색인어추출이론에 대해 고찰하고, 이론에 따라 생성된 색인어의 검색 활용도를 분석하였다. 실험은 서지 2,200,488건에서 생성된 색인어 29,219,853건을 텍스트형 색인과 코드형 색인으로 나누어 이용자 왱 검색 로그에 나타난 색인 항목과 비교하여 어떤 색인 정의가 얼마나 활용되는가를 분석하였다. 결과에 따르면 서명, 저자, 출판사, 주제와 같은 텍스트형 색인어는 높은 검색 활용도를 보인 반면에 코드형 색인어는 검색 활용도가 낮아 검색에 활용되지 않는 불필요한 색인 정의들은 과감하게 제거하여 색인 정의를 최적화해야 함을 제안하였다.

  • PDF

내용 기반 이미지 검색을 위한 복합 질의문 계획 생성 기법 (Generating Combined Query Plan for Content-Based Image Retrieval)

  • 박미화;엄기현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권4호
    • /
    • pp.562-571
    • /
    • 2000
  • 이미지 데이터는 텍스트 데이터와는 달리 다양한 색상과 모양, 질감과 같은 비정형적인 특징을 가진다. 따라서 이미지 데이터베이스는 텍스트 기반의 전통 데이터베이스와는 다른 모델링 방법과 질의, 검색 방법을 사용한. 특히, 내용 기반 이미지 검색에서의 검색 속도와 정확도를 향상시키기 위해서는 새로운 복합 질의문 계획 생성 기법이 필요하다. 본 논문에서는 이를 위해 먼저, 단일 조건을 갖는 시각 질의에 대한 처리 기법들을 토대로 여러 조건을 갖는 복합 질의를 처리하기 위한 복합 질의문 계획 생성기법인 SSCC(Similarity Search for Conjunction Combination Query) 알고리즘을 제안한다. SSCC는 이미지 데이터베이스 검색 시스템에서 복합 질의를 처리하기 위한 질의 최적화 과정에서 질의 수행 시간과 투플 I/O를 최소화하는 질의문 계획을 생성하기 위해 사용된다. SSCC 알고리즘은 복합질의를 단일 질의들로 준해하고 퍼지 집합 이론을 도입하여 단일 질의의 결과들을 통합한다. 논문에서 연구된 내용 기반 복합 질의문 계획 생성 기법은 특정 이미지 영역에 국한되지 않으며 다양한 종류의 시각 질의를 수행하기 위한 효율적인 질의문 계획 생성 기법으로 사용될 수 있다.

  • PDF

하이퍼텍스트 기반의 정보 지도에 관한 연구 (A Study on Information Map based on Hypertext)

  • 류철;이강찬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (하)
    • /
    • pp.755-758
    • /
    • 2001
  • 웹 문서는 하이퍼텍스트의 특성을 가지는 문서 형태를 가지며, 일반적인 문서의 특성 보다는 사용자에 의하여 쉽게 생성, 변경, 삭제되는 특성을 가지고 있다. 본 논문은 WWW 검색 엔진이 WWW의 확장성과 역동성을 반영하지 못하는 단점을 보완하는데 그 의의가 있다. 본 논문에서 제시하는 시스템은 기존의 WWW 검색 엔진을 통하여 얻은 검색 결과를 출발점으로 한 실시간 검색을 통하여 WWW 문서의 현재 상태를 정확하게 파악할 수 있는 장정이 있다. 또한 탐색 결과의 가시화를 통하여 웹 문서에 대한 정보 지도(information map)를 추출할 수 있으며, 이러한 기능을 통하여 기존의 정보 검색 엔진에서 제공하지 못하던 자신의 정보 요구에 맞는 정보 지도를 제공함으로써 새로운 지식의 전달을 꾀할 수 있다.

  • PDF