• 제목/요약/키워드: Similarity Measures

검색결과 304건 처리시간 0.027초

Tuning the Parameters for the Decision Making System in Order to Define Athlete's Aerobic and Anaerobic Thresholds

  • Ketola, Jaakko;Saastamoinen, Kalle;Turunen, Esko
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.317-320
    • /
    • 2004
  • In this work we have managed to find parameters for defining athlete's aerobic and anaerobic thresholds. Thresholds which are of vital importance for top athletes. It is shown how differential evolution and different similarity measures has been used to tune computational model for threshold definitions. From our results it is obvious that the use of right parameter values for this kind expert system is of vital importance.

  • PDF

On the clustering of huge categorical data

  • Kim, Dae-Hak
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1353-1359
    • /
    • 2010
  • Basic objective in cluster analysis is to discover natural groupings of items. In general, clustering is conducted based on some similarity (or dissimilarity) matrix or the original input data. Various measures of similarities between objects are developed. In this paper, we consider a clustering of huge categorical real data set which shows the aspects of time-location-activity of Korean people. Some useful similarity measure for the data set, are developed and adopted for the categorical variables. Hierarchical and nonhierarchical clustering method are applied for the considered data set which is huge and consists of many categorical variables.

Spatial Histograms for Region-Based Tracking

  • Birchfield, Stanley T.;Rangarajan, Sriram
    • ETRI Journal
    • /
    • 제29권5호
    • /
    • pp.697-699
    • /
    • 2007
  • Spatiograms are histograms augmented with spatial means and covariances to capture a richer description of the target. We present a particle filtering framework for region-based tracking using spatiograms. Unlike mean shift, the framework allows for non-differentiable similarity measures to compare two spatiograms; we present one such similarity measure, a combination of a recent weighting scheme and histogram intersection. Experimental results show improved performance with the new measure as well as the importance of global spatial information for tracking. The performance of spatiograms is compared with color histograms and several texture histogram methods.

  • PDF

On some properties of distance measures and fuzzy entropy

  • Lee, Sang-Hyuk;Kim, Sungshin
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 추계학술대회 및 정기총회
    • /
    • pp.9-12
    • /
    • 2002
  • Representation and quantification of fuzziness are required for the uncertain system modelling and controller design. Conventional results show that entropy of fuzzy sets represent the fuzziness of fuzzy sets. In this literature, the relations of fuzzy enropy, distance measure and similarity measure are discussed, and distance measure is proposed. With the help of relations of fuzzy enropy, distance measure and similarity measure, fuzzy entropy is represented by the newly proposed distance measure. With simple fuzzy set, example is illustrated.

상품 분류 체계를 고려한 구매이력 유사도 측정 기법 (Purchase Transaction Similarity Measure Considering Product Taxonomy)

  • 양유정;이기용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권9호
    • /
    • pp.363-372
    • /
    • 2019
  • 시퀀스란 두 항목 간의 순서가 존재하는 데이터를 말하며, 고객 한 명이 구매한 상품들이 나열된 구매이력 데이터는 대표적인 시퀀스 데이터 중 하나이다. 일반적으로 모든 상품은 대분류/ 중분류/ 소분류와 같은 상품 분류 체계를 가지며, 서로 다른 상품이더라도 비슷하다면 그 특성에 따라 동일한 범주로 분류된다. 따라서 본 논문에서는 두 구매이력 시퀀스 비교 시 상품의 구매 순서를 고려할 뿐만 아니라, 비교하고자 하는 두 상품이 다르더라도 서로 동일한 상품 군에 속한다면 더 높은 유사도를 부여하여 계산한다. 특히 구매이력 시퀀스 유사도 계산 성능에 직접적인 영향을 미치는 시퀀스 유사도 측정 방법을 선택하기 위해 본 연구에서는 대표적인 시퀀스 간 유사도 측정 방법인 레벤슈타인 거리, 동적 타임 워핑 거리, 니들만-브니쉬 유사도의 성능을 비교하였으며, 항목간의 계층구조도 반영하여 계산하도록 확장하였다. 기존의 유사도 측정 방법의 경우 시퀀스 내 상품 비교 시 상품의 일치 유무에 따라 단순히 0 또는 1의 값을 부여하여 계산한다. 하지만 제안 방법의 경우 서로 다른 상품이더라도 두 상품 간의 연관정도를 다르게 부여하기 위하여 상품 분류 트리를 사용하여 0에서 1 사이의 값을 가지도록 세분화하였다. 실험을 통해 세 알고리즘에 제안 방법을 적용한 경우 기존 방법에 비하여 구매이력 시퀀스 간의 유사도를 더 정확히 측정함을 확인하였다. 또한 정확성 측정 비교 실험을 통해 동적 타임 워핑 유사도가 다른 두 유사도 측정 방법에 비하여 시퀀스 내 상품의 연관 정도를 고려할 뿐만 아니라 두 시퀀스의 길이가 다른 경우에도 좋은 성능을 보였기 때문에 구매이력 데이터에서 시퀀스 간의 유사도 비교 시 가장 적합한 측정 방법임을 확인하였다.

이웃 선정 조건에 따른 협력 필터링의 성능 향상 분석 (Analysis of Performance Improvement of Collaborative Filtering based on Neighbor Selection Criteria)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제18권4호
    • /
    • pp.55-62
    • /
    • 2015
  • 협력 필터링을 통한 추천 시스템은 정보 검색 편의성을 제공함으로써 다방면에서 성공적으로 활용되어왔다. 유사도 측정은 추천인들의 범위를 결정하는 기준이 되기 때문에 이러한 시스템의 성능을 좌우하는 결정적 요소이다. 본 연구에서는 기존의 유사도 측정 공식에서 산출되는 유사도값의 분포를 분석하고, 유사도값과 공통평가항목수와의 관계를 조사하였다. 이를 통해 발견된 문제점을 보완하기 위하여 유사도값의 제한을 통하여 신뢰할 만한 추천인들을 선정하는 방법을 제시하였다. 실험 결과, 유사도의 상한값과 하한값을 동시에 제한하는 방법이 기존보다 월등한 성능 향상을 가져왔다. 특히 적은 수의 최인접이웃을 참조했을 때 두드러졌는데, 코사인 유사도에 대해서는 최대 0.047, 피어슨에 대해서는 최대 0.03의 추천 성능 향상을 보였다. 이 결과는 피어슨과 코사인 유사도를 이용하는 협력필터링 시스템에서 매우 높거나 낮은 유사도의 이웃의 평가 등급은 참조하지 않는 것이 바람직함을 암시한다.

영어 동사의 의미적 유사도와 논항 선택 사이의 연관성 : ICE-GB와 WordNet을 이용한 통계적 검증 (The Strength of the Relationship between Semantic Similarity and the Subcategorization Frames of the English Verbs: a Stochastic Test based on the ICE-GB and WordNet)

  • 송상헌;최재웅
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권1호
    • /
    • pp.113-144
    • /
    • 2010
  • The primary goal of this paper is to find a feasible way to answer the question: Does the similarity in meaning between verbs relate to the similarity in their subcategorization? In order to answer this question in a rather concrete way on the basis of a large set of English verbs, this study made use of various language resources, tools, and statistical methodologies. We first compiled a list of 678 verbs that were selected from the most and second most frequent word lists from the Colins Cobuild English Dictionary, which also appeared in WordNet 3.0. We calculated similarity measures between all the pairs of the words based on the 'jcn' algorithm (Jiang and Conrath, 1997) implemented in the WordNet::Similarity module (Pedersen, Patwardhan, and Michelizzi, 2004). The clustering process followed, first building similarity matrices out of the similarity measure values, next drawing dendrograms on the basis of the matricies, then finally getting 177 meaningful clusters (covering 437 verbs) that passed a certain level set by z-score. The subcategorization frames and their frequency values were taken from the ICE-GB. In order to calculate the Selectional Preference Strength (SPS) of the relationship between a verb and its subcategorizations, we relied on the Kullback-Leibler Divergence model (Resnik, 1996). The SPS values of the verbs in the same cluster were compared with each other, which served to give the statistical values that indicate how much the SPS values overlap between the subcategorization frames of the verbs. Our final analysis shows that the degree of overlap, or the relationship between semantic similarity and the subcategorization frames of the verbs in English, is equally spread out from the 'very strongly related' to the 'very weakly related'. Some semantically similar verbs share a lot in terms of their subcategorization frames, and some others indicate an average degree of strength in the relationship, while the others, though still semantically similar, tend to share little in their subcategorization frames.

  • PDF

Gabor 필터를 이용한 온라인 서명 검증 기법 (On-line signature verification method using Gabor filter)

  • 이종현;김성훈;김재희
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.129-137
    • /
    • 2004
  • 이 논문은 Gabor 필터를 이용하여 두 서명 사이의 유사도를 계산하는 온라인 서명 검증 방법을 제안한다. 온라인 서명들의 유사도를 계산하기 위해서는 두 입력 서명의 각 위치 사이의 시간적인 대응 관계를 정확하게 구하는 것이 중요하다. 그러나 DP(dynamic programming) 매칭을 이용하는 기존의 포인트 매칭 방법은 시간이 많이 소요되는 단점이 있었다. 이 논문에서는 Gabor 필터의 위상 출력을 이용하여 두 서명 사이의 시간적인 대응 관계를 빠르게 추정하는 방법을 제안한다. 제안된 방법에서는 서명의 상이도로서 두 가지 척도를 정의한다. 첫째, 추정된 지역적 시간 변이로부터 두 서명사이의 시간적 상이도를 구하고, 둘째, 두 서명 특징 프로파일의 시간적 대응 관계를 이용하여 시간 정보가 보정된 특징 프로파일 상이도를 구한다. 제안된 방법은 고정된 길이의 코드로 코드화되어 기존의 DP 매칭을 사용하는 시간적 변이 추정 방법보다 30배 이상 빠른 속도로 서명을 비교할 수 있다.

Robust Image Similarity Measurement based on MR Physical Information

  • Eun, Sung-Jong;Jung, Eun-Young;Park, Dong Kyun;Whangbo, Taeg-Keun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권9호
    • /
    • pp.4461-4475
    • /
    • 2017
  • Recently, introduction of the hospital information system has remarkably improved the efficiency of health care services within hospitals. Due to improvement of the hospital information system, the issue of integration of medical information has emerged, and attempts to achieve it have been made. However, as a preceding step for integration of medical information, the problem of searching the same patient should be solved first, and studies on patient identification algorithm are required. As a typical case, similarity can be calculated through MPI (Master Patient Index) module, by comparing various fields such as patient's basic information and treatment information, etc. but it has many problems including the language system not suitable to Korean, estimation of an optimal weight by field, etc. This paper proposes a method searching the same patient using MRI information besides patient's field information as a supplementary method to increase the accuracy of matching algorithm such as MPI, etc. Unlike existing methods only using image information, upon identifying a patient, a highest weight was given to physical information of medical image and set as an unchangeable unique value, and as a result a high accuracy was detected. We aim to use the similarity measurement result as secondary measures in identifying a patient in the future.

협력 필터링 시스템을 위한 순위 기반의 유사도 척도 (A Rank-based Similarity Measure for Collaborative Filtering Systems)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제14권5호
    • /
    • pp.97-104
    • /
    • 2011
  • 협력 필터링은 공통된 흥미를 가진 다른 사용자들로부터 정보를 획득하여 그들의 의견에 따라 웹 사이트를 추천하는 방법이다. 과거 수년간, 이 방법은 서적, 식품, 영화 등 다양한 e-commerce 영역에서 사용되었다. 본 논문에서는 협력 필터링 시스템에서 추천 항목을 결정하기 위한 사용자 간의 유사도 측정 방법을 제시하였다. 기존 연구에서는 사용자가 부여했던 전체 평가등급들의 분포를 고려하지 않은 채각 평가등급을 독립적으로 취급하여 사용자간 유사도를 산출하였으나, 본 연구에서는 사용자의 평가 등급 범위 내에서의 등급의 위치와 순위 정보를 이용하여 유사도를 산출하였다. 실제 데이터집합 상에서 평균 절대 오차의 성능을 측정한 결과, 대부분의 기존 방법들에 비해 제안 방법은 매우 우수하였고, 특히 정해진 등급범위가 클 경우에 그러하였다.

  • PDF