• Title/Summary/Keyword: 데이터 검색 알고리즘

Search Result 514, Processing Time 0.031 seconds

Human-Genetic Algorithm Interaction for Emotional Image Retrieval (감성적 영상검색을 위한 인간과 유전자 알고리즘의 상호작용)

  • 이주영;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.225-227
    • /
    • 1998
  • 내용기반 영상검색 방법은 영상 데이터 베이스 검색 분야에서 최근 활발히 연구되고 있는데, 기존의 키워드기반 검색방법에 비해 보다 효율적인 데이터의 관리와 검색 방법을 제공한다. 그러나 데이터의 양이 증가하고 널리 이용됨에 따라 검색 과정에 사용자의 직관과 선호도를 반영한다면 보다 사용자의만족도가 높은 검색결과를 제공할 수 있을 것이다. 이러한 검색 시스템을 개발하기 위하여 이제까지 대화형 유전자 알고리즘을 이용한 감성기반 영상 검색 방법을 개발하여 왔다. 이것은 목적함수가 명시적으로 정의될 수 없는 경우 사용자의 판단을 적합도 함수로 사용하는 유전자 알고리즘이라 할 수 있다. 이 방법은 구체적으로 표현될 수 있는 영상 뿐 아니라 추상적인 감성을 이용하여 영상을 검색할 수 있도록 한다. 본 논문에서는 2000개의 영상 데이터를 대상으로 주관적 실험을 하여 그 유용성을 입증하고자 한다. 이 실험에 대한 통계적 분석 결과 감성적 영상 검색을 위한 유전자 알고리즘의 적용이 유용하다는 것을 알 수 있다.

  • PDF

Design of Efficient Data Search Function using the Excel VBA DAO (엑셀 VBA DAO 기능을 이용한 효율적인 데이타 검색 기능 설계)

  • Jang, Seung Ju;Ryu, Dae-Hyun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.18 no.1
    • /
    • pp.217-222
    • /
    • 2014
  • In this paper, I propose an efficient data search system using data partitioning algorithm in Microsoft Excel. I propose searching algorithm to retrieve data quickly using VBA functioning in the Excel. This algorithm is to specify the sheet you are looking for. Once the sheet is specified, the algorithm searches the beginning and the end of the data in the sheet. The algorithm compares intermediate values and key words, from the starting position of the cell. In this way, it will search data to the end. This proposed algorithm was implemented and tested in the Excel system using VBA program. The experimental results showed that the performance was better than that of the conventional sequential search method.

A Study on Real-time Speed of Searching Algorithms (실시간 시뮬레이션을 위한 검색 기법들의 속도 연구)

  • 윤석준;강현주
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 1999.10a
    • /
    • pp.254-262
    • /
    • 1999
  • 실시간 시뮬레이션에서 주어지는 다양한 종류의 불연속적인 파라미터 값을 가지는 데이터 테이블에서 실시간의 제약 하에서의 검색을 수행하기 위해서는 최적의 기법이 요구된다. 실시간의 제약 하에서 최적 기법의 기준이 되는 것은 보통의 알고리즘들과는 달리 평균 속도가 아니라 worst case에서의 속도가 된다. 검색 알고리즘 들은 iteration을 거치게 되므로 총 탐색에 걸리는 시간은 iteration의 수(logical speed)와 1 probe를 수행하는 데 걸리는 시간(실제 수행속도)의 곱으로 정의된다. 본 연구에서 총 탐색에 걸리는 시간을 이론적으로 계산한 검색 속도 기존의 수행한 수치비교시험의 결과와 대체로 일치하였고, 이분 검색법이 iteration의 수와 실제 수행시간 모두에 있어서 가장 우수하다. 한편, 검색하고자 하는 파라미터 값의 dynamics를 이용하여 주어진 데이터 테이블 내의 검색 영역을 축소시키는 dynamic-window 개념을 도입하여 검색 알고리즘의 속도를 향상시킬 수 있었다. 이 개념의 도입은 데이터 테이블의 형태에 민감한 보간 검색법(interpolation method)과 그 응용 기법들에 대해 탁월한 효과를 나타내었다. 결론적으로 일반적 데이터 테이블에 있어서는 이분 검색법이 logical speed와 실제 수행속도가 우수하고, dynamic-window 개념을 도입한 보간 검색법과 그 변형들은 logical speed가 탁월하게 향상된다.

  • PDF

Design of Data Search Function using the Excel VBA (VBA를 이용한 엑셀 데이타 검색 기능 개발)

  • Janf, Seung Ju
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2013.10a
    • /
    • pp.671-674
    • /
    • 2013
  • In this paper, we propose an efficient data search system using data partitioning algorithm in Microsoft Excel. We propose to retrieve the data quickly using VBA functioning Excel. This algorithm is to specify the sheet you are looking for. Once the sheet is specified, it searches the beginning and the end of the data in the sheet. It compares desired key words and intermediate values, starting from the position of the cell. In this way, it will search data to the end. This proposed algorithm was implemented and tested using actual VBA program. The experimental results showed that the performance was more excellent than that of the conventional search method.

  • PDF

Contents-based Image Retrieval using Fuzzy ART Neural Network (퍼지 ART 신경망을 이용한 내용기반 영상검색)

  • 박상성;이만희;장동식;김재연
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.4 no.2
    • /
    • pp.12-17
    • /
    • 2003
  • This paper proposes content-based image retrieval system with fuzzy ART neural network algorithm. Retrieving large database of image data, the clustering is essential for fast retrieval. However, it is difficult to cluster huge image data pertinently, Because current retrieval methods using similarities have several problems like low accuracy of retrieving and long retrieval time, a solution is necessary to complement these problems. This paper presents a content-based image retrieval system with neural network in order to reinforce abovementioned problems. The retrieval system using fuzzy ART algorithm normalizes color and texture as feature values of input data between 0 and 1, and then it runs after clustering the input data. The implemental result with 300 image data shows retrieval accuracy of approximately 87%.

  • PDF

Search Algorithm Embodiment which uses the Image and Speech Signal from the Vido (동영상에서 이미지와 음성신호를 이용한 검색 알고리즘 구현)

  • Shin, In-Kyoung;Rhee, Sang-Burm
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.88-91
    • /
    • 2010
  • 정보통신망 및 멀티미디어 기술의 발전으로 인해 정보의 형태는 단순한 텍스트 데이터에서 멀티미디어 데이터로 전환되고 있다. 멀티미디어 기술은 저장, 재생, 압축 등 관련 기술의 빠른 발전과 미디어의 사회, 문화적 역할이 계속 증가함에 따라 우리 사회 전반에 걸쳐 매우 광범위하게 사용되고 있으며, 이로 인해 동영상 검색등의 많은 검색을 요구 하고 있으나, 동영상 검색의 문제점은 생산되는 컨텐츠에서 동영상이 가지고 있는 비중은 계속해서 높아지지만 쌓아진 데이터를 검색하기엔 몇 가지 문제점이 있다. 첫 번째는 데이터의 중복성이고 두 번째는 제목, 내용 그리고 Keyword가 일치하지 않으며, 세 번째는 저자권 침해 등이 있다. 본 연구에서는 본 논문에서는 빠르게 변화되고 있는 정보화 시대에 맞게 동영상에서 음성과 얼굴영역을 검출하여, 검색 시 효율적이고 정확한 데이터의 검색이 이루어 질 수 있도록 검색 알고리즘을 제안하고 소개하며, 이중 두 번째의 문제점인 제목, 내용 그리고 Keyword의 불일치한 점에 두어 검색 시 영상의 이미지 검색과 음성을 통하여 keyword를 찾아 효율적이고 검색율의 높일 방법을 연구한다.

  • PDF

BERT Sparse: Keyword-based Document Retrieval using BERT in Real time (BERT Sparse: BERT를 활용한 키워드 기반 실시간 문서 검색)

  • Kim, Youngmin;Lim, Seungyoung;Yu, Inguk;Park, Soyoon
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.3-8
    • /
    • 2020
  • 문서 검색은 오래 연구되어 온 자연어 처리의 중요한 분야 중 하나이다. 기존의 키워드 기반 검색 알고리즘 중 하나인 BM25는 성능에 명확한 한계가 있고, 딥러닝을 활용한 의미 기반 검색 알고리즘의 경우 문서가 압축되어 벡터로 변환되는 과정에서 정보의 손실이 생기는 문제가 있다. 이에 우리는 BERT Sparse라는 새로운 문서 검색 모델을 제안한다. BERT Sparse는 쿼리에 포함된 키워드를 활용하여 문서를 매칭하지만, 문서를 인코딩할 때는 BERT를 활용하여 쿼리의 문맥과 의미까지 반영할 수 있도록 고안하여, 기존 키워드 기반 검색 알고리즘의 한계를 극복하고자 하였다. BERT Sparse의 검색 속도는 BM25와 같은 키워드 기반 모델과 유사하여 실시간 서비스가 가능한 수준이며, 성능은 Recall@5 기준 93.87%로, BM25 알고리즘 검색 성능 대비 19% 뛰어나다. 최종적으로 BERT Sparse를 MRC 모델과 결합하여 open domain QA환경에서도 F1 score 81.87%를 얻었다.

  • PDF

대용량 그래프에서의 삼각형 검색 연구: 알고리즘과 응용

  • Park, Ha-Myeong;Gang, Yu
    • Information and Communications Magazine
    • /
    • v.31 no.11
    • /
    • pp.58-66
    • /
    • 2014
  • 본 고에서는 다양한 네트워크를 표현하는 그래프에서 삼각형을 검색하는 알고리즘과 그 응용을 다룬다. 삼각형은 그래프에서 서로가 연결된 세 정점의 집합을 의미한다. 삼각형 검색 문제는 폭 넓은 응용이 가능하기 때문에 데이터 마이닝, 네트워크 분석 등 다양한 분야에서 중요하고 기본적인 문제로서 인식되어왔다. 삼각형 검색 문제의 중요성이 널리 인식되면서 여러 알고리즘이 제안 되어 왔지만, 최근의 소셜 네트워크, 웹 등의 크기가 방대해 기존의 방법은 이러한 네트워크를 분석하기가 사실상 불가능하다. 최근 맵리듀스를 활용한 분산/병렬 처리를 통해 대용량 그래프에서 삼각형을 검색하는 알고리즘들이 여럿 제안되었다. 본 논문에서는 지금까지 제안된 알고리즘들을 설명하고 삼각형 검색의 응용에 대해서 소개한다.

Approximate k-Nearest Neighbor Search Algorithms for Content-Based Retrieval of Multimedia Data (대용량 멀티미디어 데이터의 내용-기반 검색을 위한 근사 k-최근접 데이터 탐색 알고리즘)

  • 송광택;심춘보;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.256-258
    • /
    • 1998
  • 대용량의 멀티미디어 자료를 기반으로 하는 내용-기반 멀티미디어 검색 시스템에서 k-최근접 탐색 질의는 사용자의 매우 중요한 검색 질의 중에 하나이다. 하지만, 방대한 양의 멀티미디어 데이터베이스를 기반으로하는 경우에는 적중 에러 없는 정확(exact) k-최근접 데이터 탐색을 위해서 상당히 많은 디스크 접근 횟수가 요구된다. 본 논문에서는 X-트리에서의 정확 k-최근접 탐색 질의를 개선하고, 또한 사용자의 빠른 검색 성능을 위해 다소의 적중 에러는 허용한다 하더라도 디스크 접근 횟수를 줄이는 근사(approximate) k-최근접 탐색 알고리즘을 제안한다.

Fast Nearest Neighbor Search on General Size Images (일반적인 그림 데이터에서의 빠른 최인접 검색)

  • Hwang, Yoon-Ho;Ahn, Hee-Kap
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.417-418
    • /
    • 2012
  • 우리는 유클리드 공간에서 그림 데이터의 평균화 분산을 이용한 비선형 변환을 이용하여, 그림 데이터에서 최인접검색(nearest neighbor search)을 빠르게 할 수 있는 알고리즘을 제시한다. 기존의 평균과 분산을 이용한 최인접검색 알고리즘은 고차원 그림 데이터를 그보다 낮은 차원의 유클리드 공간의 데이터로 변환하고, 낮은 차원에서의 비교를 통해 최인접검색의 해가 될 수 없는 그림 데이터를 빠르게 제외하는 방법을 사용한다. 우리는 기존의 방법이 균일하게 나누어지는 크기의 그림 데이터에서만 가능하던 기존방법에 대한 해결책을 이 논문에서 제시하여 일반적인 그림 데이터에서도 평균과 분산을 이용하는 최인접검색을 가능하게 한다.