• Title/Summary/Keyword: 검색 알고리즘

Search Result 1,682, Processing Time 0.027 seconds

Improved PageRank Algorithm Using Similarity Information of Documents (문서간의 유사도를 이용한 개선된 PageRank 알고리즘)

  • 이경희;김민구;박승규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.169-171
    • /
    • 2003
  • 웹에서의 검색 방법에는 크게 Text-Based 기법과 Link-Based 기법이 있다. 본 논문은 그 중에서 Link-Based 기법의 하나인 PageRank 알고리즘에 대해 연구 하고자 한다. 이 PageRank 알고리즘은 각 페이지의 중요성을 수치로 계산하는 방법이다. 하지만 이 알고리즘에서는 페이지에서 페이지로 링크를 따라갈 확률의 값을 일정하게 주어서 모든 페이지의 값을 획일적으로 계산하였기 때문에 각 페이지의 검색 효율성에 문제가 있다고 판단하여, 이를 해결하고자 본 논문은 페이지사이의 유사도를 측정하여 유사도에 따라 링크를 따라가는 확률 값인 Damping factor값을 다르게 부여하여 검색의 효율성을 높였다. 이를 위하여 두 가지 방법의 실험을 통하여 구현, 증명하였다.

  • PDF

Design and implementation of web document clustering system using on incremental algorithm (점진적 알고리즘을 이용한 웹 문서 클러스터링 시스템의 설계 및 구현)

  • 황태호;손기락
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.207-209
    • /
    • 1999
  • 클러스터 분석은 관측의 대상이 되는 집합에 맞는 분류 구조를 생성하는데 이용되는 통계학적인 기술이다. 정보검색 응용에서 전형적으로 발견되는 높은 차원을 가진 많은 데이터 집합을 클러스터하기 위하여, 많은 공간과 시간이 필요하다. SLINK 알고리즘은 O(n2)의 시간과 O(n)의 공간의 성능을 갖으며 점진성을 반영할 수 있는 알고리즘이다. SLINK알고리즘을 이용하여 검색 엔진의 검색결과에 온라인으로 클러스터 분류를 수행하는 시스템을 구현하였다. 구현된 시스템은 상대적으로 높은 정확도와 각 클러스터를 저장하고 표현하는데 있어서의 장점을 제공하며, 상대적으로 느린 수행 속도는 온라인으로 문서들이 다운로드 되는 속도가 느리므로 문제가 되지 않음을 알 수 있었다.

  • PDF

A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research (유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구)

  • Park, Dong-Jin;Choi, Ki-Seok;Lee, Myung-Sun;Lee, Sang-Tae
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.11
    • /
    • pp.54-62
    • /
    • 2009
  • To avoid the redundant investment on the project selection process, it is necessary to check whether the submitted research topics have been proposed or carried out at other institutions before. This is possible through the search engines adopted by the keyword matching algorithm which is based on boolean techniques in national-sized research results database. Even though the accuracy and speed of information retrieval have been improved, they still have fundamental limits caused by keyword matching. This paper examines implemented TFIDF-based algorithm, and shows an experiment in search engine to retrieve and give the order of priority for similar and redundant documents compared with research proposals, In addition to generic TFIDF algorithm, feature weighting and K-Nearest Neighbors classification methods are implemented in this algorithm. The documents are extracted from NDSL(National Digital Science Library) web directory service to test the algorithm.

Design of Data Search Function using the Excel VBA (VBA를 이용한 엑셀 데이타 검색 기능 개발)

  • Janf, Seung Ju
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2013.10a
    • /
    • pp.671-674
    • /
    • 2013
  • In this paper, we propose an efficient data search system using data partitioning algorithm in Microsoft Excel. We propose to retrieve the data quickly using VBA functioning Excel. This algorithm is to specify the sheet you are looking for. Once the sheet is specified, it searches the beginning and the end of the data in the sheet. It compares desired key words and intermediate values, starting from the position of the cell. In this way, it will search data to the end. This proposed algorithm was implemented and tested using actual VBA program. The experimental results showed that the performance was more excellent than that of the conventional search method.

  • PDF

Structure Based Information Retrieval Algorithm Using XML Technology and String Matching Algorithm (XML 기술과 스트링 매칭 기법을 이용한 구조 기반 정보 검색 알고리즘)

  • Han, Gi-Deok;Kwon, Hyuk-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.171-176
    • /
    • 2007
  • Parsing 작업의 결과인 Parse Tree 정보는 문장에 관한 구조적 정보를 가지고 있는 Tree 정보로 이 정보를 이용하여 정보 검색에 활용하는 알고리즘을 제안한다. 제안하는 알고리즘은 XML 기술과 스트링 매칭 기법을 이용하였으며, 사용한 스트링 매칭 기법은 Approximate String Matching 기법이다. Query 정보와 문서 정보를 Parsing하여 얻은 Parse Tree를 XML 형태의 정보로 변환한 후, 두 정보를 가지고 Approximate String Matching 기법을 적용하여 Query 정보와 문서 정보 간의 유사도를 계산한다. 제안하는 알고리즘의 장점은 구조 기반의 정보 검색 기능이 가능하고 비슷한 정보에 대한 검색 기능이 가능하며 비슷한 구조에 대한 검색 기능이 가능하다는 것이다.

  • PDF

A Music Retrieval Scheme based on Variation of Musical Mood (음악 무드의 변화 기반 유사 음악 검색 기법)

  • Sanghoon Jun;Byeong-jun Han;Eenjun Hwang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.760-762
    • /
    • 2008
  • 음악에서는 다양한 감정의 표현을 시간에 따른 음악 무드의 전이로 표현한다. 본 연구에서는 Longest Common Subsequence (LCS) 알고리즘 및 k-Means 알고리즘에 기반한 유사 음악 검색 기법을 제안한다. 우선, 음악 무드의 흐름을 무드 세그먼트 단위로 나누고, 이를 추출된 다양한 음악 특성을 k-Means 알고리즘으로 분류하여 무드 시퀀스로 변환한다. 또한, 유사한 무드의 흐름을 가지는 음악을 검색하기 위해 LCS 알고리즘에 기반한 무드 시퀀스의 유사도를 정의한다. 본 논문은 제안된 내용을 바탕으로 실험과 설문 조사를 통해, 기존의 전역적 특성 검색 방식보다 시퀀스를 이용한 검색방식이 좀 더 효율적임을 증명하였다.

A Packet Classification Algorithm Using Bloom Filter Pre-Searching on Area-based Quad-Trie (영역 분할 사분 트라이에 블룸 필터 선 검색을 사용한 패킷 분류 알고리즘)

  • Byun, Hayoung;Lim, Hyesook
    • Journal of KIISE
    • /
    • v.42 no.8
    • /
    • pp.961-971
    • /
    • 2015
  • As a representative area-decomposed algorithm, an area-based quad-trie (AQT) has an issue of search performance. The search procedure must continue to follow the path to its end, due to the possibility of the higher priority-matching rule, even though a matching rule is encountered in a node. A leaf-pushing AQT improves the search performance of the AQT by making a single rule node exist in each search path. This paper proposes a new algorithm to further improve the search performance of the leaf-pushing AQT. The proposed algorithm implements a leaf-pushing AQT using a hash table and an on-chip Bloom filter. In the proposed algorithm, by sequentially querying the Bloom filter, the level of the rule node in the leaf-pushing AQT is identified first. After this procedure, the rule database, which is usually stored in an off-chip memory, is accessed. Simulation results show that packet classification can be performed through a single hash table access using a reasonable sized Bloom filter. The proposed algorithm is compared with existing algorithms in terms of the memory requirement and the search performance.

Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System (음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가)

  • 김태수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

The Test of existing Visual Search Algorithms with the ETRI dataset (비주얼 검색 알고리즘 성능분석)

  • Je, Sung-Kwan;Na, Sang-Il;Oh, Weon-Geun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2012.07a
    • /
    • pp.407-408
    • /
    • 2012
  • 최근 모바일환경에서 영상검색을 위한 연구가 활발히 진행됨에 따라 MPEG에서도 국제표준을 위한 연구가 진행되고 있다. 그러나 모바일의 제한된 성능환경과 외부적인 실외환경변화에 강인한 알고리즘개발이 시급하다. 따라서 본 논문에서는 다양한 환경변화에 강인한 영상검색 알고리즘을 개발하기 위하여 기존의 영상검색으로 많이 사용되고 있는 SIFT와 SURF 알고리즘의 성능을 분석하고자 한다. 실험에 사용된 데이터베이스는 MPEG에서 표준영상으로 채택된 ETRI dataset을 이용하였다. 실험결과, 기존의 알고리즘은 특징점 검출과 그 서술자가 서로 의존적임을 알 수 있었다.

  • PDF

Experiment and Performance Evaluation of RIFLE Algorithm (RIFLE 알고리즘에 대한 실험 및 성능평가)

  • Kim Dong-Hoi;Won Young-Sang;Ko Young-woong;Kim Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.697-700
    • /
    • 2004
  • 서열의 유사성 검색에 잘 알려진 도구로는 BLAST 와 FASTA 가 있으며 이들 알고리즘은 알려지지 않은 유기체를 sequencing 작업을 통하여 얻어진 염기서열과 유전자 데이터베이스를 대상으로 유사성을 검색한다. 이때 서열의 유사성을 검색하기에 앞서 선행 되어야만 하는 sequencing작업은 시간적인 면에서 상당한 비용을 요구한다. 반면 sequencing 작업을 하기 않고도 간단한 실험에 의해 얻을 수 있는 부분적인 서열정보만을 대상으로 데이터베이스에서 검색 할 수 있는 알고리즘으로 RIFLE가 있다. 본 논문에서는 RIFLE 알고리즘을 구현하고 실험데이터를 생성하여 성능에 대한 분석 평가를 하고자 한다. 성능평가 결과 RIFLE 알고리즘은 시간복잡도 $O(n^2)$으로 빠른 반면 일부 서열에 있어서 실제 유사도에 비해 정확도가 낮게 평가되는 결과가 산출되었다.

  • PDF