• 제목/요약/키워드: Similarity Function

검색결과 553건 처리시간 0.033초

시퀀스 데이터베이스를 위한 타임 워핑 기반 유사 검색 (A Method for Time Warping Based Similarity Search in Sequence Databases)

  • 김상욱;박상현
    • 산업기술연구
    • /
    • 제20권B호
    • /
    • pp.219-226
    • /
    • 2000
  • In this paper, we propose a new novel method for similarity search that supports time warping. Our primary goal is to innovate on search performance in large databases without false dismissal. To attain this goal, we devise a new distance function $D_{tw-lb}$ that consistently underestimates the time warping distance and also satisfies the triangular inequality. $D_{tw-lb}$ uses a 4-tuple feature vector extracted from each sequence and is invariant to time warping. For efficient processing, we employ a multidimensional index that uses the 4-tuple feature vector as indexing attributes and $D_{tw-lb}$ as a distance function. We prove that our method does not incur false dismissal. To verify the superiority of our method, we perform extensive experiments. The results reveal that our method achieves significant speedup up to 43 times with real-world S&P 500 stock data.

  • PDF

적합도 함수를 이용한 최적의 추천자 그룹 생성 및 유지 알고리즘 (Globally Optimal Recommender Group Formation and Maintenance Algorithm using the Fitness Function)

  • 김용구;이민호;박수홍;황철주
    • 한국정보과학회논문지:정보통신
    • /
    • 제36권1호
    • /
    • pp.50-56
    • /
    • 2009
  • 본 논문에서는 P2P 네트워크 환경에서 유사한 특성을 가진 다른 노드(node)를 찾아 추천자(recommender) 그룹을 형성하고 유지하는 새로운 알고리즘을 제안한다. 두 노드의 유사한 특성을 비교하기 위해 본 논문에서는 두 노드의 특성값(characteristic value. 이하 CV)을 이용한 적합도 검사(fitness evaluation)를 사용하여 유사도(similarity)를 확인한다. 유사도의 크기가 작을수록 두 노드는 매우 유사한 특성을 가지게 된다. 또한, 본 논문에서 제안하는 GORGFM(Globally Optimal Recommender Group Formation and Maintenance) 알고리즘은 최단 기간 내에 최적의 추천자 그룹을 형성하고 사용자의 선호도 변화에 대응할 수 있는 알고리즘이다. GORGFM 알고리즘을 평가하기 위해 본 논문에서는 매칭율(matching rate)과 얼마나 빠르고 정확하게 추천자 그룹을 형성하는가에 대해 시뮬레이션 한다. GORGFM 알고리즘은 네트워크에서뿐만 아니라 인터넷상에서 컨텐츠(contents) 검색 등과 같이 적합도 함수(fitness function)를 이용할 수 있는 모든 시스템에 적용할 수 있다.

h-Stability of differential systems via $t_{\infty}$-similarity

  • Park, Sung-Kyu;Koo, Nam-Jip
    • 대한수학회보
    • /
    • 제34권3호
    • /
    • pp.371-383
    • /
    • 1997
  • In recent years M. Pinto introduced the notion of h-stability. He extended the study of exponential stability to a variety of reasonable systems called h-systems. We investigate h-stability for the nonlinear differential systems using the notions of $t_\infty$-similarity and Liapunov functions.

  • PDF

WHEN ALL PERMUTATIONS ARE COMBINATORIAL SIMILARITIES

  • Viktoriia Bilet;Oleksiy Dovgoshey
    • 대한수학회보
    • /
    • 제60권3호
    • /
    • pp.733-746
    • /
    • 2023
  • Let (X, d) be a semimetric space. A permutation Φ of the set X is a combinatorial self similarity of (X, d) if there is a bijective function f : d(X × X) → d(X × X) such that d(x, y) = f(d(Φ(x), Φ(y))) for all x, y ∈ X. We describe the set of all semimetrics ρ on an arbitrary nonempty set Y for which every permutation of Y is a combinatorial self similarity of (Y, ρ).

Learning Discriminative Fisher Kernel for Image Retrieval

  • Wang, Bin;Li, Xiong;Liu, Yuncai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권3호
    • /
    • pp.522-538
    • /
    • 2013
  • Content based image retrieval has become an increasingly important research topic for its wide application. It is highly challenging when facing to large-scale database with large variance. The retrieval systems rely on a key component, the predefined or learned similarity measures over images. We note that, the similarity measures can be potential improved if the data distribution information is exploited using a more sophisticated way. In this paper, we propose a similarity measure learning approach for image retrieval. The similarity measure, so called Fisher kernel, is derived from the probabilistic distribution of images and is the function over observed data, hidden variable and model parameters, where the hidden variables encode high level information which are powerful in discrimination and are failed to be exploited in previous methods. We further propose a discriminative learning method for the similarity measure, i.e., encouraging the learned similarity to take a large value for a pair of images with the same label and to take a small value for a pair of images with distinct labels. The learned similarity measure, fully exploiting the data distribution, is well adapted to dataset and would improve the retrieval system. We evaluate the proposed method on Corel-1000, Corel5k, Caltech101 and MIRFlickr 25,000 databases. The results show the competitive performance of the proposed method.

Robust Similarity Measure for Spectral Clustering Based on Shared Neighbors

  • Ye, Xiucai;Sakurai, Tetsuya
    • ETRI Journal
    • /
    • 제38권3호
    • /
    • pp.540-550
    • /
    • 2016
  • Spectral clustering is a powerful tool for exploratory data analysis. Many existing spectral clustering algorithms typically measure the similarity by using a Gaussian kernel function or an undirected k-nearest neighbor (kNN) graph, which cannot reveal the real clusters when the data are not well separated. In this paper, to improve the spectral clustering, we consider a robust similarity measure based on the shared nearest neighbors in a directed kNN graph. We propose two novel algorithms for spectral clustering: one based on the number of shared nearest neighbors, and one based on their closeness. The proposed algorithms are able to explore the underlying similarity relationships between data points, and are robust to datasets that are not well separated. Moreover, the proposed algorithms have only one parameter, k. We evaluated the proposed algorithms using synthetic and real-world datasets. The experimental results demonstrate that the proposed algorithms not only achieve a good level of performance, they also outperform the traditional spectral clustering algorithms.

Spectral clustering based on the local similarity measure of shared neighbors

  • Cao, Zongqi;Chen, Hongjia;Wang, Xiang
    • ETRI Journal
    • /
    • 제44권5호
    • /
    • pp.769-779
    • /
    • 2022
  • Spectral clustering has become a typical and efficient clustering method used in a variety of applications. The critical step of spectral clustering is the similarity measurement, which largely determines the performance of the spectral clustering method. In this paper, we propose a novel spectral clustering algorithm based on the local similarity measure of shared neighbors. This similarity measurement exploits the local density information between data points based on the weight of the shared neighbors in a directed k-nearest neighbor graph with only one parameter k, that is, the number of nearest neighbors. Numerical experiments on synthetic and real-world datasets demonstrate that our proposed algorithm outperforms other existing spectral clustering algorithms in terms of the clustering performance measured via the normalized mutual information, clustering accuracy, and F-measure. As an example, the proposed method can provide an improvement of 15.82% in the clustering performance for the Soybean dataset.

멀티모달 기반 악성코드 유사도 계산 기법 (Multi-Modal Based Malware Similarity Estimation Method)

  • 유정도;김태규;김인성;김휘강
    • 정보보호학회논문지
    • /
    • 제29권2호
    • /
    • pp.347-363
    • /
    • 2019
  • 사람의 DNA가 변하지 않는 것과 같이 사이버상의 악성코드도 변하지 않는 고유의 행위 특징을 갖고 있다. APT(Advanced Persistent Threat) 공격에 대한 방어수단을 사전에 확보하기 위해서는 악성코드의 악성 행위 특징을 추출해야 한다. 이를 위해서는 먼저 악성코드 간의 유사도를 계산하여 유사한 악성코드끼리 분류할 수 있어야 한다. 본 논문에서는 Windows OS 상에서 동작하는 악성코드 간의 유사도 계산 방법으로 'TF-IDF 코사인 유사도', 'Nilsimsa 유사도', '악성코드 기능 유사도', 'Jaccard 유사도'를 사용해 악성코드의 유형을 예측해보고, 그 결과를 보인다. 실험결과, 유사도 계산 방식마다 악성코드 유형에 따라 예측률의 차이가 매우 컸음을 발견할 수 있었다. 모든 결과에 월등한 정확도를 보인 유사도는 존재하지 않았으나, 본 실험결과를 이용하여 특정 패밀리의 악성코드를 분류할 때 어떤 유사도 계산 방식을 활용하는 것이 상대적으로 유리할지를 결정할 때 도움이 될 것으로 판단된다.

멘티의 성격특성과 가치성향이 군(軍) 조직의 비공식적 멘토링 기능에 미치는 영향 (The Effects of Mentee's Characteristics and Value Orientation on Informal Mentoring Function of ROK Military)

  • 이호복;이규만
    • 경영과정보연구
    • /
    • 제32권4호
    • /
    • pp.81-101
    • /
    • 2013
  • 본 연구는 군 조직의 비공식적 멘토링 관계에 있는 조직구성원의 성격특성인 심리적 유사성과 내재적 통제위치, 가치관 성향인 개인주의와 권력거리가 멘토링 기능에 어떠한 영향을 미치는지를 규명하는데 목적을 두었다. 이를 위해 육군 사단급의 초급간부 547명을 대상으로 실증분석을 실시하였다. 검증결과 첫째, 심리적 유사성과 내재적 통제위치는 멘토링 기능에 긍정적 영향을 주었다. 둘째, 권력거리 성향은 멘토링 기능에 부정적인 영향을 미치는 것으로 나타난 반면 개인주의 성향은 가설의 의도와는 다르게 멘토링 기능에 긍정적 영향을 미치는 것으로 나타났다. 즉, 군 조직의 비공식 멘토링 관계에서 멘티가 멘토와 심리적 유사성을 높게 지각하거나 내재론자 또는 개인주의 성향이 강한 멘티일수록 멘토링 기능을 많이 지원받는다고 지각하고 있었다. 반면에 권력거리를 높게 지각하는 멘티일수록 멘토링 기능을 상대적으로 적게 받는다고 인식하였다. 본 연구를 통해 군 조직의 멘토링 관계에서 멘토링 기능에 영향을 주는 변인들의 중요성을 확인할 수 있었으며, 본 분석결과가 공식적 비공식적 멘토시스템 운영 및 향후 멘토링 관계 연구에 일조할 수 있다는데서 의의를 찾을 수 있을 것이다.

  • PDF

Content similarity matching for video sequence identification

  • Kim, Sang-Hyun
    • International Journal of Contents
    • /
    • 제6권3호
    • /
    • pp.5-9
    • /
    • 2010
  • To manage large database system with video, effective video indexing and retrieval are required. A large number of video retrieval algorithms have been presented for frame-wise user query or video content query, whereas a few video identification algorithms have been proposed for video sequence query. In this paper, we propose an effective video identification algorithm for video sequence query that employs the Cauchy function of histograms between successive frames and the modified Hausdorff distance. To effectively match the video sequences with a low computational load, we make use of the key frames extracted by the cumulative Cauchy function and compare the set of key frames using the modified Hausdorff distance. Experimental results with several color video sequences show that the proposed algorithm for video identification yields remarkably higher performance than conventional algorithms such as Euclidean metric, and directed divergence methods.