• 제목/요약/키워드: Similarity Measures

검색결과 304건 처리시간 0.031초

금강 유역을 대상으로 한 GIS 기반의 유역의 유사성 평가 (Catchment Similarity Assessment Based on Catchment Characteristics of GIS in Geum River Catchments, Korea)

  • 이효상;박기순;정성혁;최석근
    • 대한공간정보학회지
    • /
    • 제21권3호
    • /
    • pp.37-46
    • /
    • 2013
  • 유역의 수문학적 유사성 평가는 계측지역의 홍수량 정보를 미계측 유역에서 활용하는 지역화 연구의 기초로서 다양하게 연구되고 있다. GIS 기반의 유역 특성인자를 기반으로 대표적인 수문학적 거리산정법을 활용하여 금강유역의 25개 소유역을 대상으로 유역 그룹화를 수행하고, 이를 유황곡선의 관련 계수(저류계수, 갈수계수, 홍수계수, 풍수계수, 유황계수, 하상계수)를 바탕으로 한 결과와 비교하여 유역 유사성 평가의 효용성을 확인하였다. 수문학적 거리산정을 위하여 영국의 FEH(Flood Estimation Handbook)에서 제안하는 유클라디안 거리법을 적용하였으며, 유황관련계수의 군집화를 위하여 SPSS프로그램을 사용하여 계층적 군집분석의 Ward법을 적용하였다. 유역 그룹화를 수행한 결과 유역특성인자를 반영한 수문학적 거리(유사성 척도)에 의한 그룹은 총 3개(H1, H2, H3)이며, 유황관련계수에 의한 그룹은 총 4개(F1, F2, F3, F4)로 분류되었다. 두 그룹들을 대응하여 비교분석한 결과 H1그룹의 7개 유역 중 6개 유역과 H3의 모든 유역이 F1그룹과 대응하였고 H2그룹의 5개 유역 중 4개 유역이 F2그룹과 대응하였으므로 본 연구의 유사성 척도에 의한 유역 그룹화가 효용성이 있음을 확인하였다.

모든 주변 비율을 고려한 확률적 흥미도 측도 기반 유사성 측도의 연관성 평가 기준 활용 방안 (Utilization of similarity measures by PIM with AMP as association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권1호
    • /
    • pp.117-124
    • /
    • 2013
  • 연관성 규칙 탐사는 상당한 양의 데이터베이스에 내재되어 있는 항목들 간의 관련성을 파악하는 것으로 쇼핑몰, 보건 및 의료, 교육분야 등의 현장에서 많이 적용되고 있다. 이러한 연관성 규칙을 생성하기 위해 연관성 규칙 평가 기준인 지지도, 신뢰도, 향상도 등이 활용되고 있다. 이들 중에서 신뢰도가 연관성 평가 기준으로 가장 많이 활용되고는 있으나 항상 양의 값을 취하는 비대칭적 측도이기 때문에 항목 간에 연관성 규칙을 생성하는 데 어려움이 존재하게 된다. 이러한 문제를 해결하기 위해 본 논문에서는 주변 비율 전부를 포함한 확률적 흥미도 기반 유사성 측도를 연관성 평가 기준으로 활용하는 방안을 고려하였다. 이 측도들은 주변비율 전부와 교차표의 모든 항을 고려하여 연관성의 강도를 측정하는 측도이므로 나타나는 모든 정보를 충실히 반영해주는 측도라고 할 수 있다. 모의실험을 통해 확인한 결과, 모든 주변 비율을 고려한 확률적 흥미도 기반 유사성 측도 대부분이 기존의 연관성 평가 기준과 마찬가지로 연관성의 정도를 파악할 수 있는 동시에 부호를 포함하고 있어서 연관성의 방향도 알 수 있었다.

거리 기반 유사도 측정을 통한 유방 초음파 영상의 내용 기반 검색 컴퓨터 보조 진단 시스템에 관한 연구 (A Study of CBIR(Content-based Image Retrieval) Computer-aided Diagnosis System of Breast Ultrasound Images using Similarity Measures of Distance)

  • 김민정;조현종
    • 전기학회논문지
    • /
    • 제66권8호
    • /
    • pp.1272-1277
    • /
    • 2017
  • To assist radiologists for the characterization of breast masses, Computer-aided Diagnosis(CADx) system has been studied. The CADx system can improve the diagnostic accuracy of radiologists by providing objective information about breast masses. Morphological and texture features were extracted from the breast ultrasound images. Based on extracted features, the CADx system retrieves masses that are similar to a query mass from a reference library using a k-nearest neighbor (k-NN) approach. Eight similarity measures of distance, Euclidean, Chebyshev(Minkowski family), Canberra, Lorentzian($F_2$ family), Wave Hedges, Motyka(Intersection family), and Cosine, Dice(Inner Product family) are evaluated by ROC(Receiver Operating Characteristic) analysis. The Inner Product family measure used with the k-NN classifier provided slightly higher performance for classification of malignant and benign masses than those with the Minkowski, $F_2$, and Intersection family measures.

Applying Different Similarity Measures based on Jaccard Index in Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권5호
    • /
    • pp.47-53
    • /
    • 2021
  • 희소한 평가 데이터는 사용자들 간의 신뢰할만한 유사도 산출을 저해하기 때문에 추천 시스템을 위한 메모리 기반의 협력 필터링 기법의 성능을 저하시킨다. 기존 연구의 많은 결과물은 이 데이터 희소성 문제를 해결하기 위해 개발되었으며, 가장 단순하고 대표적인 업적은 자카드 계수를 활용하는 방법들이다. 이 계수는 두 사용자의 공통 평가 항목수를 반영하며, 그들 간의 유사도를 보다 정확하게 계산하기 위해 전통적인 유사도 척도와 통합된다. 그러나, 그러한 통합은 데이터 희소성의 정도를 고려하지 않은 매우 단순한 방법이다. 본 연구는 두 사용자의 자카드 계수값에 의거하여 다른 유사도 척도를 적용하는 새로운 아이디어를 제시한다. 제안 방법에서 사용하는 파라미터의 최적값을 구하기 위하여 성능 실험을 진행하였고, 다른 관련된 방법들과 비교 평가하였다. 결과로서, 제안 방법은 예측 정확도와 추천 정확도에 있어서 가장 우수하거나 대등한 성능을 보였다.

A New Similarity Measure based on Separation of Common Ratings for Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.149-156
    • /
    • 2021
  • 추천 시스템의 여러 구현 기법들 중 협력 필터링은 과거 평가 이력을 토대로 유사성이 높은 인접 이웃들을 선정하여, 그들이 선호했던 상품들을 추천하는데, 많은 상업 사이트에서 성공적으로 활용되고 있다. 유사도의 정확한 측정은 시스템의 성능을 좌우하는 매우 중요한 요소이다. 기존에 다양한 방식의 유사도 척도들이 개발되었는데, 대개 전통적인 유사도 척도와 기개발된 여러 계수들과의 통합 방식이었다. 본 연구에서는 새로운 방식의 유사도 척도를 제안한다. 두 사용자 간의 공통 평가 영역을 평가치 크기에 따라 분할하여 각 부분 영역별로 유사도를 측정하고 이들을 가중 통합함으로써, 유사한 영역이 구체적으로 파악되어 최종 유사도값에 반영된다. 두 종류의 개방형 데이터셋을 활용한 성능을 측정하였고, 그 결과 특히 밀집 데이터셋에서 제안 방법의 예측 정확도, 순위 정확도, 평균 정밀도 성능이 기존보다 우수하였다. 제안 척도는 다양한 상업 시스템에서 사용자들의 선호에 보다 적합한 상품을 추천하는데 유용하게 활용될 것으로 기대한다.

Mutual Information Analysis with Similarity Measure

  • Wang, Hong-Mei;Lee, Sang-Hyuk
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제10권3호
    • /
    • pp.218-223
    • /
    • 2010
  • Discussion and analysis about relative mutual information has been carried out through fuzzy entropy and similarity measure. Fuzzy relative mutual information measure (FRIM) plays an important part as a measure of information shared between two fuzzy pattern vectors. This FRIM is analyzed and explained through similarity measure between two fuzzy sets. Furthermore, comparison between two measures is also carried out.

사용자 기반의 협력필터링을 위한 퍼지 논리를 이용한 새로운 유사도 척도 (A New Similarity Measure using Fuzzy Logic for User-based Collaborative Filtering)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제21권5호
    • /
    • pp.61-68
    • /
    • 2018
  • 협력 필터링은 다수의 상업용 추천 시스템에서 구현되어 온라인 사용자들에게 성공적으로 서비스되고 있는 핵심적 기술이다. 이 기술은 현 사용자와 유사한 평가이력을 가진 다른 사용자들로부터 항목을 추천하기 때문에, 유사도 척도는 시스템 성능에 매우 큰 영향을 미친다. 본 연구에서는 기존 유사도 측정 방법의 문제점을 해결하고자 퍼지 논리에 입각하여 사용자 평가등급의 주관성 및 모호성과 사용자들의 평가 행태를 반영하는 새로운 유사도 척도를 제안한다. 성능 평가를 위한 다양한 실험을 실시하였고, 그 결과 제안 방법은 예측 정확도와 추천 정확도 면에서 우수한 성능 개선 효과를 보였다.

의미 정보를 이용한 다차원 데이터 시퀀스의 유사성 척도 연구 (A Study of Similarity Measures on Multidimensional Data Sequences Using Semantic Information)

  • 이석룡;이주홍;전석주
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.283-292
    • /
    • 2003
  • 연속된 일차원 실수로 이루어진 시계열 데이터는 데이터 마이닝이나 데이터 웨어하우징과 같은 다양한 데이터베이스 응용 분야에서 연구되어져 왔다. 그러나 최근의 복잡한 비즈니스 환경에서, 다차원 데이터 시퀀스(multidimensional data sequence : MDS)는 일차원 시계열 데이터와 더불어 그 중요성이 더해가고 있다. 다차원 데이터 시퀀스의 예로써, 비디오 스트림은 색상과 질감 등의 속성들로 이루어진 다차원 공간상에서 MDS로 나타낼 수 있다. 본 논문에서는 패턴 유사성 검색에서 사용되는 효과적인 유사성 척도를 제시한다. 하나의 MDS는 여러 개의 세그먼트(segment)로 나누어지며, 각 세그먼트는 다양한 의미적인 특징들로 표현된다. 유사성 척도는 이러한 세그먼트에 대해서 정의되는데 이 척도를 사용하여 어떤 주어진 질의 시퀀스에 대하여 무관한 세그먼트들은 검색 대상에서 일차적으로 제외된다. 데이터 시퀀스와 질의 시퀀스 모두 세그먼트 단위로 분할되며, 질의 처리는 전체 시퀀스의 모든 데이터를 검색하지 않고 데이터 세그먼트와 질의 세그먼트의 특징을 비교하는 것을 기초로 하여 수행된다.

최소 자승법에 의한 1차 유사도 및 2차 유사도의 개발 (Development of the 1st-Order Similarity Measure and the 2nd-Order Similarity Measure Based on the Least-Squares Method)

  • 강환일;석민수
    • 대한전자공학회논문지
    • /
    • 제20권6호
    • /
    • pp.23-28
    • /
    • 1983
  • 콘투어 맷칭을 위한 1차 유사도와 2차 유사도가 제안되었다. 그것들은 최소자승법에 의한 것이다. 특히 2차 유사도는 콘투어의 불완전함 혹은 어파인 변환 혹은 이들 특성의 결합같은 왜곡된 변화에 양호한 신뢰도를 가지고 있다는 사실을 비행기 기종의 판별과 인식하는 실험을 통하여 증명하였다. 또한 맷칭 성능에 있어서 2차 유사도가 1차 유사도뿐만 아니라 기존의 맷칭기법들보다 우수함을 보였다.

  • PDF

A Study on Decision Tree for Multiple Binary Responses

  • Lee, Seong-Keon
    • Communications for Statistical Applications and Methods
    • /
    • 제10권3호
    • /
    • pp.971-980
    • /
    • 2003
  • The tree method can be extended to multivariate responses, such as repeated measure and longitudinal data, by modifying the split function so as to accommodate multiple responses. Recently, some decision trees for multiple responses have been constructed by Segal (1992) and Zhang (1998). Segal suggested a tree can analyze continuous longitudinal response using Mahalanobis distance for within node homogeneity measures and Zhang suggested a tree can analyze multiple binary responses using generalized entropy criterion which is proportional to maximum likelihood of joint distribution of multiple binary responses. In this paper, we will modify CART procedure and suggest a new tree-based method that can analyze multiple binary responses using similarity measures.