• 제목/요약/키워드: Text Retrieval System

검색결과 177건 처리시간 0.033초

문서기술언어 SGML에 의한 전문 데이터베이스의 구축 (Construction of Full-text Database by SGML)

  • 김창봉
    • 정보관리연구
    • /
    • 제27권4호
    • /
    • pp.35-56
    • /
    • 1996
  • 문서기술언어 SGML(Standard Generalized Markup Language, 표준 범용 마크업 언어)과 그 전문 데이터베이스(도표나 화상 포함)에의 적용에 대하여 해설하였다. SGML을 적용한 전문데이터베이스의 구조는 SGML로 작성한 DTD (document type definition)로 표현하고 텍스트자체는 DTD에 따른 범용 마크업을 사용하여 기술한다. 본고에서는 장, 절, 단락 등의 계층구조와 각주, 도표, 화살 등의 비계층 구조로 되어 있는 문서 구조를 어떻게 표현하는가에 대하여 예를 들어 해설하였다. 그러고 SGML의 효과, 전자 출판, 검색 시스템, 하이퍼텍스트, SGML 관련 도구 등에 대해서도 해설하였다.

  • PDF

구조 및 의미 검색을 지원하는 비디오 데이타의 모델링 (Video Data Modeling for Supporting Structural and Semantic Retrieval)

  • 복경수;유재수;조기형
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권3호
    • /
    • pp.237-251
    • /
    • 2003
  • 이 논문에서는 비디오 데이타의 논리적 구조와 의미적 내용을 효과적으로 검색하기 위한 비디오 검색 시스템을 제안한다. 제안하는 검색 시스템은 비정형화된 비디오 데이타를 원시 데이타 계층, 내용 계층 그리고 키프레임 계층의 세 계층으로 구성하는 계층화된 모델링을 사용한다. 계층화된 모델링에 존재하는 내용 계층은 비디오 데이타에 대한 논리적인 계층 구조와 의미적 내용을 표현한다. 제안하는 검색 시스템은 모델링에 따라 텍스트 기반의 검색은 물론 시각적인 특징 기반의 유사도 검색을 지원한다. 또한 시공간 관계에 기반한 의미적 내용 검색과 유사도 검색을 지원한다.

Using Context Information to Improve Retrieval Accuracy in Content-Based Image Retrieval Systems

  • Hejazi, Mahmoud R.;Woo, Woon-Tack;Ho, Yo-Sung
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.926-930
    • /
    • 2006
  • Current image retrieval techniques have shortcomings that make it difficult to search for images based on a semantic understanding of what the image is about. Since an image is normally associated with multiple contexts (e.g. when and where a picture was taken,) the knowledge of these contexts can enhance the quantity of semantic understanding of an image. In this paper, we present a context-aware image retrieval system, which uses the context information to infer a kind of metadata for the captured images as well as images in different collections and databases. Experimental results show that using these kinds of information can not only significantly increase the retrieval accuracy in conventional content-based image retrieval systems but decrease the problems arise by manual annotation in text-based image retrieval systems as well.

  • PDF

HSI 컬러 공간과 신경망을 이용한 내용 기반 이미지 검색 (Content-based Image Retrieval Using HSI Color Space and Neural Networks)

  • 김광백;우영운
    • 한국전자통신학회논문지
    • /
    • 제5권2호
    • /
    • pp.152-157
    • /
    • 2010
  • 컴퓨터와 인터넷의 발달로 정보의 형태가 다양화 되어 문서 위주의 자료들로부터 이미지, 오디오, 비디오, 음성 등의 모습으로 혼합되어 가고 있다. 하지만 대부분의 검색은 문서 위주로 하기 때문에 이미지, 오디오, 비디오 등은 파일의 이름이 명확하게 설정되어 있지 않을 경우에는 검색을 할 수 없다. 이러한 문제점을 해결하기 위해 문서가 아닌 내용을 기반으로 검색하는 방법을 내용 기반 검색이라고 한다. 그리고 이미지의 내용을 기반으로 검색하는 방법을 내용 기반 이미지 검색이라고 한다. 본 논문에서는 HSI 컬러 공간, ART2 알고리즘, SOM 알고리즘을 이용한 내용 기반 이미지 검색 방법을 제안한다. 제안하는 방법은 학습 대상을 선정하기 위해 원 영상의 특징을 분할한다. 그리고 사용자가 학습 대상을 선정하도록 하기 위해 분할된 특징을 SOM 알고리즘에 적용하여 비슷한 특징을 가지는 영상들로 군집화 한다. 군집화된 영상들에 대해 사용자가 학습 대상을 선정하여 ART2 알고리즘에 적용하여 학습한다. 제안한 방법을 적용하여 이미지 검색을 실험한 결과 제안된 방법은 하나의 이미지가 여러 개의 키워드를 가질 수 있기 때문에 이미지에 포함된 정보를 효과적으로 검색하는 것을 확인하였다.

혼합형 질의 방법에 의한 온톨로지 기반 유물 검색 시스템 (Ontology based Retrieval System for Cultural Assets Using Hybrid Text-Sketch Queries)

  • 천현재;백승재;이홍철
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.17-26
    • /
    • 2005
  • 최근 각종 정보가 증가함에 따라 효율적인 관리를 위해 정보 검색에 관한 연구가 더욱 활기를 띠고 있다. 현재 웹 환경에서 운영되고 있는 국내 유물 검색시스템의 경우 대부분이 키워드 기반의 텍스트 검색 방식을 채택하고 있다. 이러한 텍스트 검색 방식은 그 유물에 대한 정확한 이름이나 키워드를 질의자 (user)가 미리 알고 있어야 한다. 하지만 검색대상에 관한 정보가 부족하여 키워드가 모호하거나 단순히 형상에 관한 기억만 있을 경우에는 검색이 쉽지 않았다. 이 논문에서는 기존 유물 검색 시스템의 문제점을 해결하기 위해 온톨로지 기반의 택스트 질의와 사용자 스케치 이미지 질의를 사용하는 자바 기반의 혼합형 유물 검색시스템을 제안한다. 이 시스템은 국내 유물들을 대상으로 사용자가 기억하고 있는 유물에 관한 정보의 형태(택스트, 형상 등)에 따라 다양한 질의방법을 제공하며, 검색결과 내에서 온톨로지 의미관계를 이용한 추가검색이 가능하다.

  • PDF

공간관계 표현 기반 RDF 메타데이터를 이용한 의미적 이미지 검색 (Semantic Image Retrieval Using RDF Metadata Based on the Representation of Spatial Relationships)

  • 황명권;공현장;김판구
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.573-580
    • /
    • 2004
  • 현대 과학 기술의 발달로 인해, 사람들은 필요한 정보들을 웹에 보관하고 관리한다. 특히, 이미지 데이터는 복잡한 데이터를 한눈에 알아보기 쉽게 표현할 수 있기 때문에 가장 많이 사용하고 있다. 또한 스캔(scan) 기술의 발달, 핸드폰 카메라와 디지털 카메라가 보편화 되면서 누구나 손쉽게 이미지를 제작하여 웹상에 게시할 수 있게 되었다. 하지만 이렇게 많은 이미지 데이터의 생성 및 제공에 반해, 웹상에 있는 이미지를 검색하는 시스템에는 극히 원시적인 방법(text-based)을 이용하고 있는 것이 추세이다. 이에 본 논문에서 우리는 ‘공간 관계 표현 기반 RBF 메타데이터를 이용한 의미적 이미지 검색’을 제안한다. 이는 이미지에 표현되어 있는 개체들 사이의 공간적인 관계의 표현을 위하여 새로운 공간관계 어휘들을 정의하고, RDF 메타데이터에 이를 의미적으로 표현함으로써, 이미지 검색에서 더욱 정확한 응답을 제공하고, 궁극적으로 의미적 이미지 검색 시스템(Semantical Image Retrieval System)을 구축하고자 한다.

이미지데이터 활용을 위한 문서인식시스템 연구 및 개발 (Research and Development of Document Recognition System for Utilizing Image Data)

  • 곽희규
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.125-138
    • /
    • 2010
  • 본 연구는 공공기관이 소장한 이미지데이터의 검색 및 열람 등의 활용성을 높이기 위한 전문검색서비스 구현 시 필수적인 문서인식시스템의 고도화를 목표로 한다. 주요한 연구방향은 공공기관이 소장하고 있는 데이터를 사전에 분석하여 문서이미지 전처리 및 문서구조분석 기술을 개발하고, 문서인식 과정에서 활용하기 위한 이미지내용DB, 문자모델DB, 용어DB로 구성되는 특화된 지식베이스를 구축하는 것이다. 또한, 지식베이스 관리도구를 개발하여 향후 다양한 형태의 문서이미지로의 확장을 가능하게 한다. 최근 본 연구는 국가기록원에서 소장하고 있는 이미지데이터에 적합한 문서구조분석 라이브러리와 특화된 지식베이스를 결합한 문서인식 프로토타입 시스템 개발을 완료했다. 향후 본 연구의 결과는 방대한 소장자료의 검색 및 활용을 극대화할 전문검색시스템 연계를 위한 성능평가 및 테스트베드 구축에 활용될 것이다.

텍스트분할에 의한 색인방법 연구 (A Study on Indexing Method using Text Partition)

  • 강무영;이상구
    • 정보관리학회지
    • /
    • 제16권4호
    • /
    • pp.75-94
    • /
    • 1999
  • 색인은 데이터베이스에 저장된 문서를 효과적으로 검색하기 위한 정보검색시스템의 필수 기능이다. 컴퓨터의 발달로 전자정보가 점점 많아짐에 따라 데이터베이스에 저장해야할 문서가 대량화되고 있고, 이러한 대용량 문서를 색인하기 위해서는 많은 시스템 자원과 처리 시간을 필요로 한다. 따라서 본 논문에서는 대용량 문서를 적은 자원으로 짧은 시간에 색인할 수 있는 개선된 텍스트분할에 의한 색인기법을 제안한다. 제안한 색인기법은 실제 검색시스템에 적용하고, 실험을 통해 우수성을 증명한다.

  • PDF

Classifying Biomedical Literature Providing Protein Function Evidence

  • Lim, Joon-Ho;Lee, Kyu-Chul
    • ETRI Journal
    • /
    • 제37권4호
    • /
    • pp.813-823
    • /
    • 2015
  • Because protein is a primary element responsible for biological or biochemical roles in living bodies, protein function is the core and basis information for biomedical studies. However, recent advances in bio technologies have created an explosive increase in the amount of published literature; therefore, biomedical researchers have a hard time finding needed protein function information. In this paper, a classification system for biomedical literature providing protein function evidence is proposed. Note that, despite our best efforts, we have been unable to find previous studies on the proposed issue. To classify papers based on protein function evidence, we should consider whether the main claim of a paper is to assert a protein function. We, therefore, propose two novel features - protein and assertion. Our experimental results show a classification performance with 71.89% precision, 90.0% recall, and a 79.94% F-measure. In addition, to verify the usefulness of the proposed classification system, two case study applications are investigated - information retrieval for protein function and automatic summarization for protein function text. It is shown that the proposed classification system can be successfully applied to these applications.

형태소 분석기를 이용한 키워드 검색 기반 한국어 텍스트 명령 시스템 (Keyword Retrieval-Based Korean Text Command System Using Morphological Analyzer)

  • 박대근;이완복
    • 한국융합학회논문지
    • /
    • 제10권2호
    • /
    • pp.159-165
    • /
    • 2019
  • 딥러닝을 기반으로 한 음성 인식 기술이 상용 제품에 적용되기 시작했지만, 음성 인식으로 분석된 텍스트를 효율적으로 처리할 방법이 없기 때문에 VR 컨텐츠에서 그 적용 예를 찾아 보기는 쉽지 않다. 본 논문은 문장의 형태소를 분석하는 형태소 분석기와 챗봇 개발에 주로 이용되는 검색 기반 모델(Retrieval-Based Model)을 활용하여 명령어를 효율적으로 인식하고 대응할 수 있는 한국어 텍스트 명령 시스템을 제안하는 것을 목적으로 한다. 실험 결과 제안한 시스템은 문자열 비교 방식과 같은 동작을 하기 위해 16%의 명령어만 필요했으며, Google Cloud Speech와 연동하였을 때 60.1%의 성공률을 보였다. 실험 결과를 통해 제안한 시스템이 문자열 비교 방식보다 효율적이라는 것을 알 수 있다.