• 제목/요약/키워드: and Information Retrieval

검색결과 3,440건 처리시간 0.04초

A Comparative Analysis of Music Similarity Measures in Music Information Retrieval Systems

  • Gurjar, Kuldeep;Moon, Yang-Sae
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.32-55
    • /
    • 2018
  • The digitization of music has seen a considerable increase in audience size from a few localized listeners to a wider range of global listeners. At the same time, the digitization brings the challenge of smoothly retrieving music from large databases. To deal with this challenge, many systems which support the smooth retrieval of musical data have been developed. At the computational level, a query music piece is compared with the rest of the music pieces in the database. These systems, music information retrieval (MIR systems), work for various applications such as general music retrieval, plagiarism detection, music recommendation, and musicology. This paper mainly addresses two parts of the MIR research area. First, it presents a general overview of MIR, which will examine the history of MIR, the functionality of MIR, application areas of MIR, and the components of MIR. Second, we will investigate music similarity measurement methods, where we provide a comparative analysis of state of the art methods. The scope of this paper focuses on comparative analysis of the accuracy and efficiency of a few key MIR systems. These analyses help in understanding the current and future challenges associated with the field of MIR systems and music similarity measures.

분산 이형 환경에서의 이동에이전트를 이용한 정보 검색 시스템 (Information Retrieval System based on Mobile Agents in Distributed and Heterogeneous Environment)

  • 박재복;이광용;조근식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.30-41
    • /
    • 2002
  • 분산 이형 환경에서 대용량의 정보를 검색하는 새로운 패러다임으로 이동 에이전트가 주목받고 있다. 검색을 수행하기 위해 많은 양의 데이터를 전송하는 대신 검색을 수행하는 에이전트를 검색을 수행할 서버로 직접 전달하는 방식을 이용하는 것이다. 본 논문에서는 분산 이형 환경에 독립적으로 존재하는 정보를 효율적으로 검색할 수 있는 이동 에이전트 기반의 정보 검색 모델을 제시하고 질의응답(Q&A)을 검색하는 시스템을 다지인하고 구현한다. 제안된 모델인 이동 에이전트 기반의 질의응답 검색 시스템(QASSMA : Q&A Search System using Mobile Agents)은 이형 분산의 환경에 존재하는 질의응답 게시판 및 뉴스그룹을 검색할 수 있는 모델이다. QASSMA의 특징을 요약하면, 우선, 최적의 검색 위치로 검색 코드 자체가 이동하여 검색을 수행하므로 기존의 정적인 검색 로봇에 비하여 고정된 네트워크 거리를 극복할 수 있고 단축된 원격 서버와의 네트워크 거리만큼 검색시간을 단축시킬 수 있다. 또한 출발서버에서 검색할 위치로 검색코드가 이동하여 실행되므로 중앙 집중적인 네트워크 트래픽 형성을 막고 출발서버의 부담을 줄일 수 있다. 마지막으로, QASSMA의 이동 검색 에이전트는 검색 환경에 맞는 클래스를 능동적으로 탑재하여 효율적으로 검색 환경의 변화에 대처할 수 있고 다양한 검색 방법을 지원할 수 있다. 본 논문에서는 실험을 통해 제안된 이동 에이전트 기반의 질의응답 시스템의 검색 방법이 기존의 정적인 검색 방법에 비해 효율적임을 보인다.

A Keyword Matching for the Retrieval of Low-Quality Hangul Document Images

  • 나인섭;박상철;김수형
    • 한국문헌정보학회지
    • /
    • 제47권1호
    • /
    • pp.39-55
    • /
    • 2013
  • It is a difficult problem to use keyword retrieval for low-quality Korean document images because these include adjacent characters that are connected. In addition, images that are created from various fonts are likely to be distorted during acquisition. In this paper, we propose and test a keyword retrieval system, using a support vector machine (SVM) for the retrieval of low-quality Korean document images. We propose a keyword retrieval method using an SVM to discriminate the similarity between two word images. We demonstrated that the proposed keyword retrieval method is more effective than the accumulated Optical Character Recognition (OCR)-based searching method. Moreover, using the SVM is better than Bayesian decision or artificial neural network for determining the similarity of two images.

데이터 결합이 웹 문서 검색성능에 미치는 영향 연구 (A Study on the Effect of Data Fusion on the Retrieval Effectiveness of Web Documents)

  • 박옥화;정영미
    • 정보관리연구
    • /
    • 제38권1호
    • /
    • pp.1-19
    • /
    • 2007
  • 이 연구에서는 최근 검색성능을 향상시키기 위한 전략으로 사용되는 데이터 결합기법을 웹 문서 검색에 적용하고, 실험을 통해 문서표현 방법의 결합이 검색성능에 미치는 영향을 분석하였다. 문서 표현 방법으로는 내용기반 표현, 링크기반 표현,URL 등을 선정하고, 단일 표현 방법에 의한 검색결과와 표현방법의 결합을 통한 검색결과를 비교하였다. 분석결과 다른 문서표현 방법의 결합이 웹 문서의 검색성능을 향상시키지는 못하는 것으로 나타났다.

온톨로지 기술과 스피어만 상관계수를 적용한 시맨틱 정보 검색 향상 (Improvement of the Semantic Information Retrieval using Ontology and Spearman Correlation Coefficients)

  • 이병욱
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.351-357
    • /
    • 2013
  • 질의 키워드의 정보 검색은 키워드의 의미가 다양하여 검색된 문서들이 사용자의 요구에 부합되지 않는 문제점을 가지며, 사용자의 상황과 특성이 사용자 마다 달라 정보가 매우 적고 연관성을 찾기 어렵다. 또한, 일반 상관 계수의 사용은 정보에 대한 연관성을 나타내지 못하는 문제가 있다. 본 연구에서는 시맨틱 웹 기술을 기반으로 인선에 필요한 다양한 개념들과 지식으로 구성된 인선 온톨로지와 인선 규칙들을 구축하고 규칙들을 지원하는 인선 절차와 인선 결과의 적합성을 확인할 수 있는 지식검색 시스템을 제안한다. 제안된 시스템에서는 스피어만 상관계수를 이용하여 사용자의 상황과 특성에 적합한 정보를 제공하여 제한적인 정보 추천의 단점을 해결하였다. 키워드 기반 검색과 시맨틱 기반 검색 실험 결과 시맨틱 기반 검색이 키워드 검색에 비하여 정확도는 90.3%, 재현율은 71.8%의 성능을 보였다.

한국어 정보검색 시스템을 위한 구 단위 색인 (Phrase-based Indexing for Korean Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권1호
    • /
    • pp.44-48
    • /
    • 2004
  • 본 논문에서는 자연언어 처리 기술인 구문 분석 모듈을 도입해 단어 이상의 단위인 구 단위를 색인과 검색의 단위로 삼는 구 단위 색인 및 검색 기법의 사용을 제안한다. 초기의 정보검색의 방법으로 단일 주제어를 키워드로 색인하여 검색하는 방식이 널리 사용되어 왔으나 문서의 내용을 정확히 표현하기 어렵고 검색 결과의 문서 집합 또한 너무 커서 사용자의 만족도가 낮다 고도의 문서 처리 측면에서는 웹 문서들 자체가 갖는 다양한 오류들로 인해 현실적으로 충분히 만족할 만할 우수한 성능의 구문 분석 모듈이 구현되기는 어려우므로 상향식 구문 분석 모듈을 구현하여 완전한 구문 분석 결과를 얻지 못하는 많은 문장에 대해서도 가능한 구 단위 색인을 이용하여 검색 정확률과 재현률이 향상되고 검색 과정의 처리 부하도 줄이는 장점을 얻는다.

  • PDF

An Encrypted Speech Retrieval Scheme Based on Long Short-Term Memory Neural Network and Deep Hashing

  • Zhang, Qiu-yu;Li, Yu-zhou;Hu, Ying-jie
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권6호
    • /
    • pp.2612-2633
    • /
    • 2020
  • Due to the explosive growth of multimedia speech data, how to protect the privacy of speech data and how to efficiently retrieve speech data have become a hot spot for researchers in recent years. In this paper, we proposed an encrypted speech retrieval scheme based on long short-term memory (LSTM) neural network and deep hashing. This scheme not only achieves efficient retrieval of massive speech in cloud environment, but also effectively avoids the risk of sensitive information leakage. Firstly, a novel speech encryption algorithm based on 4D quadratic autonomous hyperchaotic system is proposed to realize the privacy and security of speech data in the cloud. Secondly, the integrated LSTM network model and deep hashing algorithm are used to extract high-level features of speech data. It is used to solve the high dimensional and temporality problems of speech data, and increase the retrieval efficiency and retrieval accuracy of the proposed scheme. Finally, the normalized Hamming distance algorithm is used to achieve matching. Compared with the existing algorithms, the proposed scheme has good discrimination and robustness and it has high recall, precision and retrieval efficiency under various content preserving operations. Meanwhile, the proposed speech encryption algorithm has high key space and can effectively resist exhaustive attacks.

Audio Fingerprint Retrieval Method Based on Feature Dimension Reduction and Feature Combination

  • Zhang, Qiu-yu;Xu, Fu-jiu;Bai, Jian
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권2호
    • /
    • pp.522-539
    • /
    • 2021
  • In order to solve the problems of the existing audio fingerprint method when extracting audio fingerprints from long speech segments, such as too large fingerprint dimension, poor robustness, and low retrieval accuracy and efficiency, a robust audio fingerprint retrieval method based on feature dimension reduction and feature combination is proposed. Firstly, the Mel-frequency cepstral coefficient (MFCC) and linear prediction cepstrum coefficient (LPCC) of the original speech are extracted respectively, and the MFCC feature matrix and LPCC feature matrix are combined. Secondly, the feature dimension reduction method based on information entropy is used for column dimension reduction, and the feature matrix after dimension reduction is used for row dimension reduction based on energy feature dimension reduction method. Finally, the audio fingerprint is constructed by using the feature combination matrix after dimension reduction. When speech's user retrieval, the normalized Hamming distance algorithm is used for matching retrieval. Experiment results show that the proposed method has smaller audio fingerprint dimension and better robustness for long speech segments, and has higher retrieval efficiency while maintaining a higher recall rate and precision rate.

패턴 정보를 이용한 설계패턴 검색 시스템 구축 (Construction of Design Pattern Retrieval System using Pattern Information)

  • 김귀정;송영재
    • 정보처리학회논문지D
    • /
    • 제8D권1호
    • /
    • pp.88-98
    • /
    • 2001
  • 본 연구는 설계패턴의 효율적인 관리와 재사용을 위하여 패턴 정보를 이용한 설계패턴 검색 시스템을 구축하였다. 패턴 정보는 패턴 속성정보와 패턴 메타정보로 구성하였고, 패턴 속성정보는 패턴 패싯 분류와 패턴 검색을 위한 유사도 측정에 이용되며, 패턴 구조를 UML로 모델링하기 위하여 패턴 메타 정보를 이용하였다. Gamma 분류 방법을 확장하여 각 설계패턴이 사용될 수 있는 여러 경험적 상황을 패싯 항목으로 설정하고 패턴 정보로 관리하였다. 또한 E-SARM 검색 방법을 사용하여 검색된 패턴은 메타정보를 이용하여 UML 클래스 다이어그램으로 나타낼 수 있도록 하였고, E-SARM을 설계패턴의 검색에 적용하여 최적의 결과를 얻을 수 있는 환경을 시뮬레이션 하였다. 패턴 뷰어를 통한 신규 패턴 등록이 가능하며, 등록된 패턴은 패턴 속성정보와 메타정보로 관리된다. 따라서 본 시스템은 효율적인 패턴 관리가 가능하고, UML 모델링을 지원하며, 관련 패턴의 우선순위 검색이 가능하여 패턴 선택 비용이 적고, 재사용성이 높은 설계패턴 검색 시스템이다.

  • PDF

바다-$IV/I^2R$: 고차원 이미지 색인 구조를 이용한 효율적인 내용 기반 이미지 검색 시스템의 설계와 구현 (BADA-$IV/I^2R$: Design & Implementation of an Efficient Content-based Image Retrieval System using a High-Dimensional Image Index Structure)

  • 김영균;이장선;이훈순;김완석;김명준
    • 한국정보처리학회논문지
    • /
    • 제7권2S호
    • /
    • pp.678-691
    • /
    • 2000
  • A variety of multimedia applications require multimedia database management systems to manage multimedia data, such as text, image, and video, as well as t support content-based image or video retrieval. In this paper we design and implement a content-based image retrieval system, BADA-IV/I$^2$R(Image Information Retrieval), which is developed based on BADA-IV multimedia database management system. In this system image databases can be efficiently constructed and retrieved with the visual features, such as color, shape, and texture, of image. we extend SQL statements to define image query based on both annotations and visual features of image together. A high-dimensional index structure, called CIR-tree, is also employed in the system to provide an efficient access method to image databases. We show that BADA-IV/I$^2$R provides a flexible way to define query for image retrieval and retrieves image data fast and effectively: the effectiveness and performance of image retrieval are shown by BEP(Bull's Eye Performance) that is used to measure the retrieval effectiveness in MPEG-7 and comparing the performance of CIR-tree with those of X-tree and TV-tree, respectively.

  • PDF