• 제목/요약/키워드: 텍스트 검색

검색결과 677건 처리시간 0.029초

비트맵 필터를 이용한 효율적인 유사 문자열 검색 기법 (Efficient Approximate String Searches using Bitmap Filter)

  • 권인택;김종익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.1298-1301
    • /
    • 2011
  • 텍스트 데이터는 표현 방식의 차이, 타이핑 오류 등을 포함하고 있어 정확히 일치하는 검색으로는 유용한 정보를 얻기 어렵다. 따라서 유사도 기반 검색 방법이 많이 연구되고 있으며 효율적인 유사도 기반 검색을 위해 텍스트 데이터에 대한 역 리스트를 구성한다. 그리고 이를 병합하여 질의와 일정 기준 이상 유사한 데이터를 찾는다. 본 논문에서는 역 리스트 병합 과정에서 역 리스트의 탐색 비용을 줄이기 위해 비트맵 필터를 사용하는 기법을 제안한다. 비트맵 필터를 사용하여 역 리스트의 탐색 여부를 결정하여 불필요한 역 리스트 탐색을 회피함으로써 역 리스트 병합 비용을 줄인다. 실험을 통하여 제안된 기법이 기존의 연구에서 제안된 역 리스트 병합 알고리즘의 성능을 30~40% 정도 개선함을 보인다.

다중바이트 문자집합 텍스트에서의 문자열 검색 알고리즘 (String Matching Algorithm on Multi-byte Character Set Texts)

  • 김은상;김진욱;박근수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1015-1019
    • /
    • 2010
  • 문자열 완전일치 검색 알고리즘용 지금까지 많은 연구가 되어왔지만, EUC-KR 용 다중바이트 문자집합에 대해서는 연구원 것이 부족한 상황이다. 이 논문에서는 기존의 KMP 알고리즘을 사용할 때 EUC-KR과 같은 다중바이트 문자집합 텍스트에서 오검색이 발생할 수 있음을 보이며, 문자 단위의 접두사 함수를 적용하여 오검색이 발생하지 않도록 개선한 KMP 알고리즘을 제안한다. 또한, 널리 사용되고 있는 편집기인 Vim과 Emacs의 검색 알고리즘 및 기존의 오토마타 방식의 연구 결과에 비해 논문에서 제안한 알고리즘이 더 빠른 속도를 보이는 실험 결과를 제시한다.

웹에서 효율적인 텍스트 문서 브라우징 (The Efficient Text Documents Browsing on World Wide Web)

  • 김원중;조이기;손철수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.457-459
    • /
    • 2001
  • 웹의 등장으로 우리는 현재 멀티미디어 정복까지도 쉽게 이용할 수 있게 되었지만, 웹에서의 텍스트 문서정보의 브라우징(Browsing)은 많은 마우스 클릭과 스크롤링을 필요로 하고 있다. 또한 현재의 웹 텍스트 문서의 브라우징은 문서의 내용이 클 경우 검색자가 현재 브라우징하고 있는 문서가 본인이 필요로 하는 것인지, 아닌지를 판단하는데 많은 시간과 노력을 요구한다. 본 논문에서는 문서의 제목 부분과 내용 단락의 전체가 아닌 1-2줄만으로도 문서의 전체 윤곽을 쉽게 파악할 수 있다는데 착안하여 웹에서의 효율적인 텍스트 문서 브라우징 시스템을 개발하였다.

  • PDF

JPSearch 기술개요 및 동향조사

  • 조재훈;김영섭
    • 한국반도체및디스플레이장비학회:학술대회논문집
    • /
    • 한국반도체및디스플레이장비학회 2007년도 춘계학술대회
    • /
    • pp.271-275
    • /
    • 2007
  • 본 문서는 JPEG(Joint Photographic coding experts group)에서 새로운 분야로 준비중인 JPSearch의 기술개요와 구조를 소개함으로써 텍스트 기반에서 영상 대 영상 검색 시스템의 전환을 제시한다. 또한 영상 대 영상 검색 시스템의 기본적인 기술특징과 JPSearch에서 요구하는 시스템 구조를 설명한다. JPSearch의 영상 검색 시스템이 사용 가능한 다양한 사용자 경우를 제시하였다.

  • PDF

모양 기반의 식물 잎 이미지 인덱싱 (Shape-based Leaf Image Indexing)

  • 남윤영;손정민;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.493-495
    • /
    • 2004
  • 최근, 디지털 카메라와 디지털 캠코더처럼 디지털 장비가 대중화됨에 따라, 이미지 데이터가 급증하게 되었다. 이와 함께, 이미지 검색에 대한 요구도 증가하게 되었으며, 단순한 텍스트 검색이 아닌 이미지의 특징에 기반한 검색이 요구되고 있다. 특징 기반의 검색은 색상, 질감, 모양 등과 같은 특성에 기반한 검색으로 사람이 일일이 주석을 입력하는 방식보다 자동화가 가능하며, 빠르게 인덱싱할 수 있는 장점이 있다. 본 연구에서는 모양을 이용하여 이미지를 인덱싱 하였으며, 스케치된 식물의 잎 모양의 이미지를 이용 하였다. 또한, 식물의 잎에 뻗어있는 잎맥의 모양을 이용하여 검색의 정확도를 높였다.

  • PDF

문화예술하이퍼미디어 정보 검색시스템 (Culture & arts hypermedia information retrieval)

  • 이창조;강윤희;김성훈;김문호;이상헌
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1995년도 춘계공동학술대회논문집; 전남대학교; 28-29 Apr. 1995
    • /
    • pp.396-400
    • /
    • 1995
  • 문화예술 정보는 텍스트, 이미지, 동화상등의 다양한 멀티미디어 데이타로 구성되어 있다. 이를 효과적으로 검색하기 위해서 노드와 링크로 구성된 하이퍼미디어를 사용하였다. 지금까지는 문화예술 정보중 연극 정보와 문화재 정보에 대하여 프로토타입을 구축하였으며, 계속하여 문화예술 전분야로 확대해 나갈 것이다. 연극정보를 검색하기 위해서는 데이타베이스 검색과 키워드 검색을 이용할 수 있으며, 최종적인 검색 결과는 분산하이퍼미디어 시스템인 Mosaic을 수정하여 이용하였다.

  • PDF

하이퍼미디어를 이용한 문화예술 정보검색 (Culture & Arts Information Retrieval Using Hypermedia)

  • 김명철;이창조;김성훈;김한구;두일철;오영주;김문호;이상헌
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.11-14
    • /
    • 1994
  • 문화예술 정보는 텍스트, 이미지, 동화상등의 다양한 멀티미디어 데이타로 구성되어 있다. 이를 효과적으로 검색하기 위해서 노드와 링크로 구성된 하이퍼미디어를 사용하였다. 지금까지는 우선적으로 문화예술 정보중 연극 정보와 문화재 정보에 대하여 프로토타입을 구축하였으며, 계속하여 문화예술 전분야로 확대해 나갈 것이다. 연극정보를 검색하기 위해서는 데이타베이스 검색과 키워드 검색을 이용할 수 있으며, 최종적인 검색 결과는 하이퍼미디어 뷰어 (Hypermedia Viewer)인 Mosaic를 이용하였다.

  • PDF

내용기반 검색을 위한 웨이브릿 변환을 이용한 텍스쳐 특징 추출 (Texture Feature Extraction Using Wavelet Transform For Content-Based Retrieval)

  • 채영심;위성두;강현철;김정규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.505-507
    • /
    • 2001
  • 최근 여러 멀티미디어 서비스가 활발히 실시되고 있으며 멀티미디어 검색분야도 상당한 연구가 이루어지고 있다. 멀티미디어 검색 중 내용 기반 검색은 기존의 텍스트기반의 여러 단점들을 극복하여 이미지 자체에 있는 여러 정보의 혼합으로 보다 더 정확한 이미지를 찾을 수 있다. 예를 들면, 색상검색이나 질감검색을 이미지 자체내에서 추출해내고 색상과 질감을 같이 표현함으로써 색상만으로 표현할 수 없는 부분을 질감을 참고로 하여 찾을 수 있다. 본 논문에서는 웨이브릿 변환(daubechies 7-9 tab)을 사용하여 질감을 표현하는 특징 추출하는 방법을 제안하고자 한다.

  • PDF

방사선 의료영상 검색 시스템에 관한 연구 (A Study on Radiological Image Retrieval System)

  • 박병래;신용원
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제28권1호
    • /
    • pp.19-24
    • /
    • 2005
  • 방사선사를 위한 교육 및 영상 정보에 대한 정확한 판단에 유용한 주석-기반 방사선 의료영상 검색 시스템을 설계 및 구현하고, 방사선 의료영상에 대한 단순 속성정보, 부가적인 정보인 텍스트 설명정보로부터 추출한 중요 키워드에 대한 효율적인 검색을 위해 $B^+$-트리와 역화일 기법을 이용한 색인기법을 제안하고자 한다. 윈도우즈 XP에서 Delphi를 이용하여 구현하였으며, 방사선사는 방사선 의료영상에 대한 속성 정보, 부가적인 설명정보, 이미지 정보를 저장하도록 하고, 구축된 영상 데이터베이스로부터 속성정보와 텍스트 키워드 정보를 이용하여 검색 가능하도록 하였다. 임상방사선사가 단순속성정보 및 텍스트 설명정보를 찾아냄으로써 임상현장에서의 체계적인 교육뿐 만 아니라 지식을 구조화함으로써 교육시간의 단축과 방사선 의료영상에 대해 정확한 판단을 내릴 수 있다. 구현되어진 방사선 의료영상검색 시스템은 차후에 일반촬영, 특수조영영상을 포함한 통합화상시스템으로의 확장이 요구되며, 아울러 웹을 통한 서비스를 구축함으로써 의사결정시스템으로 발전 할 수 있는 기반기술로 기대된다.

  • PDF

혼합형 질의 방법에 의한 온톨로지 기반 유물 검색 시스템 (Ontology based Retrieval System for Cultural Assets Using Hybrid Text-Sketch Queries)

  • 천현재;백승재;이홍철
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.17-26
    • /
    • 2005
  • 최근 각종 정보가 증가함에 따라 효율적인 관리를 위해 정보 검색에 관한 연구가 더욱 활기를 띠고 있다. 현재 웹 환경에서 운영되고 있는 국내 유물 검색시스템의 경우 대부분이 키워드 기반의 텍스트 검색 방식을 채택하고 있다. 이러한 텍스트 검색 방식은 그 유물에 대한 정확한 이름이나 키워드를 질의자 (user)가 미리 알고 있어야 한다. 하지만 검색대상에 관한 정보가 부족하여 키워드가 모호하거나 단순히 형상에 관한 기억만 있을 경우에는 검색이 쉽지 않았다. 이 논문에서는 기존 유물 검색 시스템의 문제점을 해결하기 위해 온톨로지 기반의 택스트 질의와 사용자 스케치 이미지 질의를 사용하는 자바 기반의 혼합형 유물 검색시스템을 제안한다. 이 시스템은 국내 유물들을 대상으로 사용자가 기억하고 있는 유물에 관한 정보의 형태(택스트, 형상 등)에 따라 다양한 질의방법을 제공하며, 검색결과 내에서 온톨로지 의미관계를 이용한 추가검색이 가능하다.

  • PDF