• Title/Summary/Keyword: 유사성측정

Search Result 2,969, Processing Time 0.059 seconds

A Measurement of Relationship among Similarity Coefficients for Document Clustering (문헌 클러스터링을 위한 유사계수간의 연관성 측정)

  • 한승희;이재윤
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1999.08a
    • /
    • pp.25-28
    • /
    • 1999
  • 자동분류나 정보검색에 주로 이용되는 문헌 클러스터링에서는 문헌간의 유사성을 측정하기 위해 다양한 유사계수를 이용하는데, 모든 유사계수가 동일한 클러스터링 결과를 가져오는 것은 아니다. 본고에서는 50건의 신문기사를 대상으로 SPSS 통계 패키지를 이용하여 다양한 유사계수에 각각 달라지는 문헌 클러스터링의 결과를 살펴본 후, 유사계수간의 연관성을 측정하였다.

  • PDF

A Research of Documents Similarity Measuring Based on Word Weight (단어가중치 기반 문서간 유사도 측정에 관한 연구)

  • 김혜숙;박상철;김수형
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.198-201
    • /
    • 2003
  • 사용자의 요구 사항을 정확히 분석하여 효과적으로 개발 단계에 적용하기 위해 문서간의 의존성, 즉 상·하위 문서간의 연계성 등을 측정할 수 있는 방법에 대한 연구가 절실한데 이를 위해 적게는 두 용어가 얼마나 밀접한 관련이 있는가를 나타내는 용어간의 유사도 정보가 중요시된다. 이에 본 논문은 임의의 두 문서에 대한 다양한 유사도 측정방법을 통하여 최적의 유사도를 알아보고 두 문서간 유사여부를 검증하기 위해 Neural Network을 적용하였다. 이러한 유사도 측정과 검증 방법은 분산환경에서 입력되는 요구사항 문서들을 효율적으로 분류, 관리해 줄 수 있으며 사용자 요구사항 분석과 전체 Project 수행에 좋은 기초자료를 제공해 줄 수 있다.

  • PDF

Development of a Surrogate Technology Load Based upon Horizontal ADCP for Continuous Estimation of Suspended Sediment (횡방향 ADCP기반 연속적 부유사량 측정 방법의 대안 기술 개발)

  • Son, Geunsoo;Kim, Dongsu;Roh, Young Sin
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.47-47
    • /
    • 2020
  • 하천 유사량 자료는 하천관리를 위해 기초적으로 활용되는 자료로 하천의 유지관리를 위한 유사량 자료의 측정은 필수적이다. 따라서, 현재 국내에서는 전국에 138개소의 국가유사량관측망에서 지속적인 유사량 측정을 수행하고 있지만, 기존의 재래식 부유사 채집기를 이용한 부유사 측정을 수행하고 있어 연간 약 20개소 내외에서만 직접조사가 수행되고 있고, 2019년도 기준 전국 138개소 중에서 2006년~2018년 동안 최소 1회 이상 유사량 측정을 수행한 지점은 40개소로 국가 유사량관측망의 약 29% 지점에 대해서만 조사가 수행되고 있다. 해외의 경우에도 기존 재래식 채집기를 통한 유사량 관측을 주로 수행하고 있지만 최근에는 기존 채집기를 이용한 유사량 조사방법의 고비용·저효율로 인한 시공간적 한계로 인해 대안기술이 개발되고 있다. 특히, 최근 해외에서는 ADCP를 활용한 유사량 측정 기술이 기존 부유사 채집기를 이용한 유사량 조사방법의 대안으로 시도되고 있다. ADCP를 이용한 유사량 측정방법은 ADCP의 초음파산란도를 활용하여 간접적으로 부유사의 농도를 추정하는 기술로 ADCP를 이용하여 유량자료과 함께 유사량 자료를 확보할 수 있을 것으로 기대되는 기술이다. 특히, 기존에 설치된 국가하천 자동유량측정장치(H-ADCP)에 적용이 가능하다면 다지점에서의 지속적인 유량측정과 함께 부유사 농도의 측정이 가능할 것으로 기대되고 있다. 이에 본 연구에서는 기존 국가하천에 설치되어 있는 자동유량측정장치(H-ADCP)의 초음파산란도를 활용한 부유사농도 측정 기술의 적용성을 검토하였다. 적용성의 검토를 위해 2016년 진동지점에서 수집된 H-ADCP 원시자료를 사용하여 초음파산란도를 활용한 부유사농도 측정 방법을 시범적으로 적용하였다. 적용결과, 실측 부유사농도와 H-ADCP로부터 추정된 부유사 농도를 비교를 통해서 H-ADCP를 활용한 부유사농도 측정 방법의 가능성을 확인할 수 있었지만, 기술적인 보완 및 개선이 필요할 것으로 판단되었다. 추후에는 지속적인 연구를 통해 ADCP 유사량 측정기술이 개발된다면 기존 부유사 채집기를 이용한 유사량 측정 방법의 대안으로 유사량 조사를 목적으로 활용이 될 수 있을 것으로 기대한다.

  • PDF

Incoming and Outgoing Human Matching Using Similarity Metrics for Occupancy Sensor (점유센서를 위한 유사성 메트릭 기반 입출입 사람 매칭)

  • Jung, Jaejune;Kim, Manbae
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.11a
    • /
    • pp.33-35
    • /
    • 2018
  • 기존의 사람간의 유사성 측정 시스템은 적외선 빔이나 열 감지 영상 장치를 통해 측정하였다. 하지만 이와 같은 방법으로 측정하면 2명 이상의 객체를 분류해내는 기술은 제공하지 않는다. 이에 본 논문은 고정된 카메라를 이용하여 각 사람의 피부색과 옷차림 등의 RGB 정보를 이용한 사람 유사성 측정 기법을 제안한다. RGB카메라 영상을 통하여 객체의 RGB 히스토그램을 얻은 후 각 객체에 대해 Bhattacharyya metric, Cosine similarity, Jensen difference, Euclidean distance로 histogram similarity를 계산하여 객체 추적 및 유사성 측정을 통해 객체를 분류한다. 제안된 시스템은 C/C++를 기반으로 구현하여, 유사성 측정 성능을 평가하였다.

  • PDF

A Study on the Degree of Signature Similarity between Domain Model and Object Candidate Groups (영역 모델과 객체후보군의 유사도 측정에 관한 연구)

  • 박성옥;노경주;이문근
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.522-524
    • /
    • 1999
  • 절차지향 소프트웨어를 객체지향 소프트웨어로 변환하는 여러 가지 방법이 존재한다. 프로그램을 변환하기 위하여 일반적으로 함수, 변수와 자료형들 간의 관계를 이용한다. 이들간의 관계성을 이용하면 결과로서 객체 후보가 생성된다. 생성된 객체 후보와 영역 전문가에 의하여 생성된 영역 모델을 비교하여 두 모델간의 유사성을 측정하여야 한다. 본 논문에서는 클래스의 시그너처(클래스 이름, 속성의 이름, 속성의 자료형, 메소드 이름, 메소드의 리턴형, 메소드 파라미터의 자료형)을 이용하여 클래스와 객체 후보의 유사도를 측정하고, 측정된 유사도의 평균값을 이용하여 객체 후보군의 유사도를 측정한다. 기존의 연구 방법과는 다르게 n개의 클래스와 m개의 객체 후보사이의 구문적 측면의 유사도 측정뿐만이 아니라 의미적 측면의 유사도를 측정하는 방법을 제시하여 최적합 객체 후보군을 추출하도록 하였다.

  • PDF

Sediment Measurement Characteristics Analysis in 2006 (2006년 유사량 측정 성과 분석)

  • Han, Myoung-Sun;Kwon, Dong-Seok;Song, In-Ryeol;Lee, Yeon-Kil;Kang, Kyu-Sang;Jung, Sung-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1689-1695
    • /
    • 2007
  • 본 연구는 2006년 전국 4대 권역, 6개 지점에 대한 유사량 측정성과에 대한 분석을 실시하였다. 6개 지점에 대해 살펴보면 한강권역은 적성(임진강수계) 및 여주 지점, 낙동강 권역은 왜관 및 낙동 지점, 금강 권역은 공주 지점, 영산강 권역은 구례(섬진강수계) 지점이다. 이들 지점에 대해 유사량 측정 실시하였고, 그 결과를 바탕으로 현장에 적합한 유사량 측정 기준, 부유사 및 하상토 입경 분포 곡선 분석, 부유사량 산정, 향후 개선사항에 대해 정리하였다. 유사량 분석 결과는 다음과 같다. 전반적으로 측선별 농도의 편차는 크지 않는 것으로 나타났으며, 6개지점의 모두 유량 및 유사량 관계를 기존의 단순 지수함수로 표현하기에는 측정성과의 분산이 너무 큰 것으로 나타났다. 이는 기존 보고서에도 알려진 바와 같이 수위 상승시와 하강시의 유사량 특성이 너무 상이하기 때문이다. 향후 정밀한 측정 및 분석으로 유량 및 유사량 관계를 적절히 표현하는 방식이 필요하다고 판단된다. 그리고, 향후 전문인력에 의한 정밀 유사량 관측과 장기관측을 통해 보다 신뢰성 있는 유사량 특성을 분석할 수 있을 것이며, 홍수 방재를 위한 기반을 마련할 수 있을 것이다.

  • PDF

Fuzzy Similarity Measure (퍼지 유사도 척도)

  • Lee, Kwang-Hyung
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.8 no.6
    • /
    • pp.119-121
    • /
    • 1998
  • For a fuzzy system modeled by a fuzzy hypergraph, two fuzzy similarity measures are proposed:one for the fuzzy similarity between fuzzy sets and the other between elements in fuzzy sets. The proposed measures can represent the realistic similarities which can not be given by the existing measures. With an example, it is shown that it can be used in the system analysis.

  • PDF

Parametric and Non Parametric Measures for Text Similarity (텍스트 유사성을 위한 파라미터 및 비 파라미터 측정)

  • Mlyahilu, John;Kim, Jong-Nam
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.20 no.4
    • /
    • pp.193-198
    • /
    • 2019
  • The wide spread of genuine and fake information on internet has lead to various studies on text analysis. Copying and pasting others' work without acknowledgement, research results manipulation without proof has been trending for a while in the era of data science. Various tools have been developed to reduce, combat and possibly eradicate plagiarism in various research fields. Text similarity measurements can be manually done by using both parametric and non parametric methods of which this study implements cosine similarity and Pearson correlation as parametric while Spearman correlation as non parametric. Cosine similarity and Pearson correlation metrics have achieved highest coefficients of similarity while Spearman shown low similarity coefficients. We recommend the use of non parametric methods in measuring text similarity due to their non normality assumption as opposed to the parametric methods which relies on normality assumptions and biasness.

Method of Measuring Color Similarity for Color Correction (컬러 보정을 위한 컬러 간의 유사성 측정 기법)

  • Hwang, Youngbae;Kim, Je Woo;Choi, Byeong Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.420-423
    • /
    • 2011
  • 두 카메라 혹은 다수의 카메라에서의 컬러 보정은 알고리즘의 성능 향상 및 양안식 3D 카메라에서 매우 중요한 기술이다. 최근 컬러 보정 방법들이 다수 제안되었지만 이 방법들의 결과에 대한 정확한 측정 방법이 많지 않으며 기존의 측정 방법은 두 영상이 카메라의 위치에 따른 서로 다른 장면을 가지고 있을 경우에 적합하지 않을 수 있다. 본 논문에서는 컬러 보정을 위한 컬러 간의 유사성 측정 기법을 제안한다. 이 기법은 대상이 되는 두 영상의 장면이 일치하지 않는 경우를 고려하여 대응점 검색을 통해 두 장면 간의 같은 컬러를 가져야 하는 대응점을 찾고 이 대응점 주위의 영역으로부터 통계치를 계산하여 컬러의 유사성을 비교한다. 이 경우 두 영상의 위치 변화에 따른 장면 변화와 대응점의 약간의 어긋남에 대해서 고려할 수 있다. 또한 대응점들이 영상의 모든 영역을 포함하지 않을 수 있기 때문에 전체 영상의 통계치를 계산하여 컬러의 유사성을 비교도 동시에 수행하여 결과적인 컬러의 유사성은 대응점 기반과 전체 영상 기반의 유사성의 가중치의 합으로 결정되며 이 가중치는 대응점 기반의 컬러 비교가 영상 내의 얼마만큼의 영역을 포함하는지에 따라서 결정된다.

  • PDF

Hybrid Estimation Method for Selecting Heterogeneous Image Databases on the Web (웹상의 이질적 이미지 데이터베이스를 선택하기 위한 복합 추정 방법)

  • 김덕환;이석룡;정진완
    • Journal of KIISE:Databases
    • /
    • v.30 no.5
    • /
    • pp.464-475
    • /
    • 2003
  • few sample objects and compressed histogram information of image databases. The histogram information is used to estimate the selectivity of spherical range queries and a small number of sample objects is used to compensate the selectivity error due to the difference of the similarity measures between meta server and local image databases. An extensive experiment on a large number of image data demonstrates that our proposed method performs well in the distributed heterogeneous environment.