• 제목/요약/키워드: 검색 속도

검색결과 1,335건 처리시간 0.047초

한글 단어의 고속 검색을 위한 두 단계 알고리즘 (A Two-Pass Algorithm for Fast Retrieval of Korean Words)

  • 양진호;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.439-441
    • /
    • 2001
  • 대용량 한글 문서를 대상으로 하는 검색 시스템은 고속의 단어 매칭 알고리즘을 필요로 한다. 이 논문은 두 단계 매칭 접근 방법을 제시하고 그 유용성을 실험을 통해 입증한다. 특징으로는 웨이브렛(wavelet) 계수를 사용하여 첫 단계에서는 적은 수의 특징만을 사용하여, 거친 정합(coarse matching)을 하며 두 번째 단계에서는 미세한 정합(fine matching)을 한다. 거친 정합은 가능성이 없는 단어를 아주 빠른 속도로 걸러내는 역할을 한다. 실제 한글 단어 영상 데이터베이스에 적용한 실험 결과 검색률의 희생 없이 약 7배의 속도 향상을 얻었다.

  • PDF

의료영상 저장 전송 시스템에서 영상 데이터의 동적 이동 기법 (Dynamic Migration Strategy of Image Data in PACS)

  • 이순희;윤홍원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.116-118
    • /
    • 2000
  • 의료영상 저장 전송 시스템에서 환자의 이력 영상은 시간이 지나면서 데이터의 양이 급격히 증가하므로 자기 디스크에서 제 3의 저장 장치로 데이터를 옮기고 있다. 일정한 보존 기간이 경과하면 옮기는 기존의 이동 방법은 곧 검색될 영상을 자기 디스크에서 제 3의 저장 장치로 옮길 가능성이 높다. 이 문제점을 해결하기 위해서 이력 영상의 검색 속도를 향상시키는 두 가지 이동 기법 AIP와 EAIP 제안하였다. 두 기법 모두 기존의 방법보다 검색 속도가 우수하였다. 제안하는 두 가지 이동 기법 사이의 질의 처리 속도를 비교하였는데 EAIP가 우수하였다. 또한, EAIP 이동 기법을 이용한 이동 실행기를 구현하였다.

  • PDF

사전 기반 최소대립쌍 검색 도구 (A minimal pair searching tool based on dictionary)

  • 김태훈;이재호;장문수
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.117-122
    • /
    • 2014
  • 최소대립쌍이란 한 음소의 차이만으로 다른 의미를 갖는 단어의 쌍을 말한다. 본 논문은 최소대립쌍을 이용한 국어음운학 연구의 효율성을 위해 최소대립쌍 검색도구를 제안한다. 검색 도구 개발에 앞서 기존 프로그램과 몇 가지 비교 분석을 통해, 개발해야할 한국어 최소대립쌍 검색 도구의 방향을 제시한다. 제안하는 검색도구는 컴퓨터 사용에 익숙하지 않은 국어학자를 위해 키보드 입력을 최소화한 사용자 친화적인 인터페이스를 제시한다. 효율적인 최소대립쌍 연구를 위해 분류 검색 기능을 제공함으로써 더욱 면밀한 최소대립쌍 연구가 가능하도록 한다. 그리고 성능 향상을 위해 유니코드 분석으로 음소를 분리하여 사전 로딩 속도를 향상시키고, 검색의 효율성을 위해 사전 구조를 최적화한다. 검색 알고리즘은 음절 개수를 이용한 해시 탐색으로 검색 속도를 높인다. 제안하는 도구는 초기 버전에 비해 사전 변환 속도는 5배, 검색 속도는 3배 향상되었다.

IP 주소 검색을 위한 최적화된 영역분할 이진검색 구조 (Optimized Binary-Search-on- Range Architecture for IP Address Lookup)

  • 박경혜;임혜숙
    • 한국통신학회논문지
    • /
    • 제33권12B호
    • /
    • pp.1103-1111
    • /
    • 2008
  • 라우터는 입력되는 패킷을 인터넷 주소 검색을 통하여 패킷의 목적지로 향하는 포트로 포워딩하는 역할을 하는데, 입력되는 속도와 같은 속도로 패킷을 포워딩하기 위해서는 매우 빠른 검색을 제공할 필요가 있다. 본 논문에서는 이진 검색을 이용한 IP 주소 검색구조에 대해 연구하였다. 대부분의 이진 검색 알고리즘들은 균형 이진 검색을 진행하지 않아 과도한 메모리 접근을 야기함으로써 검색속도가 느린 단점이 있다. 한편 영역분할을 이용한 이진 검색 알고리즘은 매우 빠른 검색 성능을 보이지만, 메모리 요구량이 크다는 단점이 있다. 본 논문에서는 영역분할 이진 검색에서 불필요한 엔트리와 항목을 삭제함으로써 라우팅 테이블의 크기를 최적화하여 메모리 요구량을 감소시키는 방법에 대하여 연구하였다. 이러한 최적화를 통하여 프리픽스의 개수와 비슷하거나 적은 수의 엔트리를 갖는 영역분할 이진 검색 라우팅 테이블을 구성할 수 있음을 보였다. 실제 사용되는 다양한 크기의 라우팅 테이블을 이용하여 영역분할 이진 검색의 원래 구조와 최적화된 구조의 검색 성능을 비교하였으며, 다른 여러가지 이진 검색 알고리즘과의 성능을 비교하였다.

높은 자릿수 나눗셈 연산기에서의 영역변환상수를 위한 검색테이블 설계 및 구현 (Design and Implementation of Lok-up Table for Pre-scaling in Very-High Radix Divider)

  • 이병석;송문식;이정아
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.3-5
    • /
    • 1999
  • 나눗셈 알고리즘은 다른 덧셈이나 곱셈 알고리즘에 비해 복잡하고, 수행 빈도수가 적다는 이유로 그동안 고속 나눗셈의 하드웨어 연구는 활발하지 않았다. 그러나 멀티미디어의 발전 및 고성능의 그래픽 랜더링을 위한 보다 빠른 부동소수점연산기(FPU)가 필요하게 되었으며, 이에 따라서 고속의 나눗셈 연산기의 필요성이 증가하게 되었다. 특히, 전체의 수행 시간 향상을 위해서라도 고속 나눗셈 연산기의 중용성은 더욱 부각되고 있다. 그러나 고속 나눗셈 연산기는 연산 속도와 크기라는 서로 상반되는 요소를 가지고 있다. 즉, 연산 속도가 빠르면 크기는 늘어나고, 크기를 줄이면 연산 속도는 늦어지게 된다. 본 논문은 높은 자릿수(Very-High Radix) 나눗셈 알고리즘에서 영역변환상수를 구하는 방법으로 연산이 아닌 검색테이블(Look-up Table)을 이용한다. 그리고 검색테이블의 크기를 줄이는 방법으로 영역변환상수의 범위 분석 및 캐리 저장형을 이용한 검색테이블 분할 방법을 이용하였다. 전체적으로는 영역변환상수를 구하는 연산주기가 필요없게 되므로 나눗셈 연산기의 영역 크기의 변화가 적으면서 연산 속도는 빨라졌음을 알 수 있다.

  • PDF

고차원 멀티미디어 데이터 검색을 위한 벡터 근사 비트맵 색인 방법 (Vector Approximation Bitmap Indexing Method for High Dimensional Multimedia Database)

  • 박주현;손대온;낭종호;주복규
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.455-462
    • /
    • 2006
  • 고차원 데이터 공간에서의 효과적인 검색을 위해 최근 VA-file[1], LPC-file[2] 등과 같이 벡터 근사에 기반을 둔 필터링 색인 방법들이 연구되었다. 필터링 색인 방법은 벡터를 근사한 작은 크기의 색인 정보를 사용하여 근사 거리를 계산하고, 이를 사용하여 질의 벡터와 유사하지 않은 대부분의 벡터들을 빠른 시간 안에 검색 대상에서 제외한다. 즉, 실제 벡터 대신 근사 벡터를 읽어 디스크 I/O 시간을 줄여 전체 검색 속도를 향상시키는 것이다. 하지만 VA-file 이나 LPC-file은 근사 거리를 구하는 방법이 순차 검색과 같거나 복잡하기 때문에 검색 속도 향상 효과가 그리 크지 않다는 문제점을 가지고 있다. 본 논문은 이러한 근사 거리 계산 시간을 줄이기 위하여 새로운 비트맵 색인 구조를 제안한다. 근사 거리 계산속도의 향상을 위하여, 각 객체의 값을 특성 벡터 공간상의 위치를 나타내는 비트 패턴으로 저장하고, 객체 사이의 거리를 구하는 연산은 실제 벡터 값의 연산보다 속도가 훨씬 빠른 XOR 비트 연산으로 대체한다. 실험에 의하면 본 논문이 제안하는 방법은 기존 벡터 근사 접근 방법들과 비교하여 데이터 읽기시간은 더 크지만, 계산 시간을 크게 줄임으로써 전체 검색 속도는 순차 검색의 약 4배, 기존의 방법들보다는 최대 2배의 성능이 향상되었다. 결과적으로, 데이터베이스의 속도가 충분히 빠른 경우 기존의 벡터 근사 접근법의 필터링을 위한 계산 시간을 줄임으로써 더욱 검색 성능을 향상 시킬 수 있음을 확인할 수 있다.

정규 표현식을 이용한 패턴 매칭 엔진 개발 (Development of the Pattern Matching Engine using Regular Expression)

  • 고광만;박홍진
    • 한국콘텐츠학회논문지
    • /
    • 제8권2호
    • /
    • pp.33-40
    • /
    • 2008
  • 스트링 패턴 매칭 알고리즘은 특정 검색어, 키워드를 검색하는 속도에서는 우수성이 다양한 방법으로 입증되었지만 다양한 패턴에 대해서는 기존의 알고리즘으로는 한계를 가지고 있다. 본 논문에서는 정규 표현식을 이용하여 특정 키워드를 포함하여 다양한 패턴의 검색어에 대해서도 효율적인 패턴 매칭을 수행하여 패턴 검색의 효율을 높이고자 한다. 이러한 연구는 기존의 단순한 키워드 매칭에 비해 각종 유해한 스트링 패턴을 효과적으로 검색할 수 있으며 스트링 패턴 매칭 속도에서도 기존의 알고리즘에 비해 우수성을 갖는다. 본 연구에서 제안한 LEX로부터 생성된 스트링 검색 엔진은 패턴 검색 속도에 대한 실험에서 패턴의 수가 1000개 이상인 경우에서는 BM&AC 알고리즘보다 효율적이지만 키워드 검색에서는 유사한 결과를 얻었다.

유전자 탐색에 의한 웹문서 검색 (Web-Document Retrieval Using Genetic Search)

  • 서영우;장영탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.69-71
    • /
    • 1998
  • 본 논문에서는 웹을 기반으로 한 인터넷에서 유전자 알고리즘을 이용한 정보검색 방법을 제시한다. 특정 문제에 대한 가설 공간을 탐색하여 최적의 해를 찾을 때 지역성과 전역성을 함께 고려하는 유전자 알고리즘의 특성을 웹에서의 정보검색에 이용한다. 여기에서 고려할 점은 탐색속도와 탐색방향인데 본 논문에서는 탐색속도를 고려하지 않았다. 탐색방향은 사용자의 정보 요구와 검색된 문서와 유사도 평가함수로 조절하였다. 본 논문에서 제안한 유사도 평가함수로 실험을 한 결과, 사용자의 초기 정보요구에 대한 검색결과의 적합성 여부에 대한 사용자의평가가 기존의 검색엔진을 사용했을 때보다 개선된 결과를 얻을 수 있었다. 그리고 HTML 문서의 특성을 고려해서 검색하는 경우에는 검색어에 대해 보다 특정적인 결과를 제시했으며, 문서 내에서 검색어의 지역 중요도만을 고려하는 경우는 보다 일반적인 결과를 제시하는 것을 확인할 수 있었다.

  • PDF

고속네트워크 트래픽 저장 및 검색을 위한 데이터베이스 성능 비교 (Performance Comparison of Databases for Store and Search of High Speed Network Flows)

  • 박현욱;최선오;김종현;서동일;김익균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1152-1155
    • /
    • 2015
  • 네트워크상의 사이버 공격을 막고 원인분석 및 공격지를 찾기 위하여, 네트워크패킷 캡쳐 및 플로우 데이터를 수집 저장하고, 수집된 정보를 고속으로 검색하여 분석하는 것을 필요로 한다. 인터넷의 발달과 네트워크를 이용하는 기기들이 많아짐에 따라 네트워크상에는 1초에 수백만 개의 네트워크 패킷이 이동하고 있다. 이러한 대용량 네트워크 패킷을 고속으로 저장하고 검색하기 위하여, 대용량 저장 및 검색에 가장 적합한 데이터베이스를 이용하는 것이 중요하다. 대용량 네트워크 데이터의 저장에 가장 최적인 데이터베이스를 찾기 위해 이 논문에서는 관계형 데이터베이스(MySQL)와 컬럼기반 데이터 베이스(InfiniFlux), 그리고 Bitmap Index 기반 저장구조(FastBit)를 사용하여 로딩속도와 검색 속도, 그리고 각각의 디스크 사용량을 비교하였다.

문자 해시와 이원 탐색 트리를 이용한 어절 빈도 계산 알고리즘의 성능 개선 (Improvement of algorithm for calculating word count using character hash and binary search tree)

  • 박일남;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.599-602
    • /
    • 2010
  • 인터넷 검색 사이트는 사용자들이 검색한 단어들의 순위를 매기는 실시간 검색 순위 서비스를 제공하는데 검색되는 단어들의 순위를 매기기 위해서는 각 단어들의 분포도를 알 수 있는 어절 빈도 계산을 수행해야 한다. 어절 빈도는 BST(Binary Search Tree)를 수행하여 계산할 수 있는데, 사용자에 의하여 검색되는 단어들은 길이와 그 형태가 다양하여 빈도 계산시에 BST 의 깊이가 깊어져서 계산 시간이 오래 걸리게 된다. 본 논문에서는 문자 해시를 이용하여 깊이가 깊은 BST 의 탐색 속도를 개선하는 알고리즘을 제안하였다. 이 방법으로 빈도 계산 속도를 비교하였을 때 문자 해시의 범위에 의해 1KB 의 추가적인 기억공간의 사용하여 9.3%의 성능 개선 효과가 있었고, 해시 공간을 10KB 추가로 사용할 때는 24.3%, 236KB 일 때는 40.6%로의 효율로 BST 의 빈도 계산 속도를 향상 시킬 수 있었다.