• 제목/요약/키워드: 유사성측정

검색결과 2,969건 처리시간 0.044초

문헌 클러스터링을 위한 유사계수간의 연관성 측정 (A Measurement of Relationship among Similarity Coefficients for Document Clustering)

  • 한승희;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.25-28
    • /
    • 1999
  • 자동분류나 정보검색에 주로 이용되는 문헌 클러스터링에서는 문헌간의 유사성을 측정하기 위해 다양한 유사계수를 이용하는데, 모든 유사계수가 동일한 클러스터링 결과를 가져오는 것은 아니다. 본고에서는 50건의 신문기사를 대상으로 SPSS 통계 패키지를 이용하여 다양한 유사계수에 각각 달라지는 문헌 클러스터링의 결과를 살펴본 후, 유사계수간의 연관성을 측정하였다.

  • PDF

단어가중치 기반 문서간 유사도 측정에 관한 연구 (A Research of Documents Similarity Measuring Based on Word Weight)

  • 김혜숙;박상철;김수형
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.198-201
    • /
    • 2003
  • 사용자의 요구 사항을 정확히 분석하여 효과적으로 개발 단계에 적용하기 위해 문서간의 의존성, 즉 상·하위 문서간의 연계성 등을 측정할 수 있는 방법에 대한 연구가 절실한데 이를 위해 적게는 두 용어가 얼마나 밀접한 관련이 있는가를 나타내는 용어간의 유사도 정보가 중요시된다. 이에 본 논문은 임의의 두 문서에 대한 다양한 유사도 측정방법을 통하여 최적의 유사도를 알아보고 두 문서간 유사여부를 검증하기 위해 Neural Network을 적용하였다. 이러한 유사도 측정과 검증 방법은 분산환경에서 입력되는 요구사항 문서들을 효율적으로 분류, 관리해 줄 수 있으며 사용자 요구사항 분석과 전체 Project 수행에 좋은 기초자료를 제공해 줄 수 있다.

  • PDF

횡방향 ADCP기반 연속적 부유사량 측정 방법의 대안 기술 개발 (Development of a Surrogate Technology Load Based upon Horizontal ADCP for Continuous Estimation of Suspended Sediment)

  • 손근수;김동수;노영신
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.47-47
    • /
    • 2020
  • 하천 유사량 자료는 하천관리를 위해 기초적으로 활용되는 자료로 하천의 유지관리를 위한 유사량 자료의 측정은 필수적이다. 따라서, 현재 국내에서는 전국에 138개소의 국가유사량관측망에서 지속적인 유사량 측정을 수행하고 있지만, 기존의 재래식 부유사 채집기를 이용한 부유사 측정을 수행하고 있어 연간 약 20개소 내외에서만 직접조사가 수행되고 있고, 2019년도 기준 전국 138개소 중에서 2006년~2018년 동안 최소 1회 이상 유사량 측정을 수행한 지점은 40개소로 국가 유사량관측망의 약 29% 지점에 대해서만 조사가 수행되고 있다. 해외의 경우에도 기존 재래식 채집기를 통한 유사량 관측을 주로 수행하고 있지만 최근에는 기존 채집기를 이용한 유사량 조사방법의 고비용·저효율로 인한 시공간적 한계로 인해 대안기술이 개발되고 있다. 특히, 최근 해외에서는 ADCP를 활용한 유사량 측정 기술이 기존 부유사 채집기를 이용한 유사량 조사방법의 대안으로 시도되고 있다. ADCP를 이용한 유사량 측정방법은 ADCP의 초음파산란도를 활용하여 간접적으로 부유사의 농도를 추정하는 기술로 ADCP를 이용하여 유량자료과 함께 유사량 자료를 확보할 수 있을 것으로 기대되는 기술이다. 특히, 기존에 설치된 국가하천 자동유량측정장치(H-ADCP)에 적용이 가능하다면 다지점에서의 지속적인 유량측정과 함께 부유사 농도의 측정이 가능할 것으로 기대되고 있다. 이에 본 연구에서는 기존 국가하천에 설치되어 있는 자동유량측정장치(H-ADCP)의 초음파산란도를 활용한 부유사농도 측정 기술의 적용성을 검토하였다. 적용성의 검토를 위해 2016년 진동지점에서 수집된 H-ADCP 원시자료를 사용하여 초음파산란도를 활용한 부유사농도 측정 방법을 시범적으로 적용하였다. 적용결과, 실측 부유사농도와 H-ADCP로부터 추정된 부유사 농도를 비교를 통해서 H-ADCP를 활용한 부유사농도 측정 방법의 가능성을 확인할 수 있었지만, 기술적인 보완 및 개선이 필요할 것으로 판단되었다. 추후에는 지속적인 연구를 통해 ADCP 유사량 측정기술이 개발된다면 기존 부유사 채집기를 이용한 유사량 측정 방법의 대안으로 유사량 조사를 목적으로 활용이 될 수 있을 것으로 기대한다.

  • PDF

점유센서를 위한 유사성 메트릭 기반 입출입 사람 매칭 (Incoming and Outgoing Human Matching Using Similarity Metrics for Occupancy Sensor)

  • 정재준;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.33-35
    • /
    • 2018
  • 기존의 사람간의 유사성 측정 시스템은 적외선 빔이나 열 감지 영상 장치를 통해 측정하였다. 하지만 이와 같은 방법으로 측정하면 2명 이상의 객체를 분류해내는 기술은 제공하지 않는다. 이에 본 논문은 고정된 카메라를 이용하여 각 사람의 피부색과 옷차림 등의 RGB 정보를 이용한 사람 유사성 측정 기법을 제안한다. RGB카메라 영상을 통하여 객체의 RGB 히스토그램을 얻은 후 각 객체에 대해 Bhattacharyya metric, Cosine similarity, Jensen difference, Euclidean distance로 histogram similarity를 계산하여 객체 추적 및 유사성 측정을 통해 객체를 분류한다. 제안된 시스템은 C/C++를 기반으로 구현하여, 유사성 측정 성능을 평가하였다.

  • PDF

영역 모델과 객체후보군의 유사도 측정에 관한 연구 (A Study on the Degree of Signature Similarity between Domain Model and Object Candidate Groups)

  • 박성옥;노경주;이문근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.522-524
    • /
    • 1999
  • 절차지향 소프트웨어를 객체지향 소프트웨어로 변환하는 여러 가지 방법이 존재한다. 프로그램을 변환하기 위하여 일반적으로 함수, 변수와 자료형들 간의 관계를 이용한다. 이들간의 관계성을 이용하면 결과로서 객체 후보가 생성된다. 생성된 객체 후보와 영역 전문가에 의하여 생성된 영역 모델을 비교하여 두 모델간의 유사성을 측정하여야 한다. 본 논문에서는 클래스의 시그너처(클래스 이름, 속성의 이름, 속성의 자료형, 메소드 이름, 메소드의 리턴형, 메소드 파라미터의 자료형)을 이용하여 클래스와 객체 후보의 유사도를 측정하고, 측정된 유사도의 평균값을 이용하여 객체 후보군의 유사도를 측정한다. 기존의 연구 방법과는 다르게 n개의 클래스와 m개의 객체 후보사이의 구문적 측면의 유사도 측정뿐만이 아니라 의미적 측면의 유사도를 측정하는 방법을 제시하여 최적합 객체 후보군을 추출하도록 하였다.

  • PDF

2006년 유사량 측정 성과 분석 (Sediment Measurement Characteristics Analysis in 2006)

  • 한명선;권동석;송인열;이연길;강규상;정성원
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1689-1695
    • /
    • 2007
  • 본 연구는 2006년 전국 4대 권역, 6개 지점에 대한 유사량 측정성과에 대한 분석을 실시하였다. 6개 지점에 대해 살펴보면 한강권역은 적성(임진강수계) 및 여주 지점, 낙동강 권역은 왜관 및 낙동 지점, 금강 권역은 공주 지점, 영산강 권역은 구례(섬진강수계) 지점이다. 이들 지점에 대해 유사량 측정 실시하였고, 그 결과를 바탕으로 현장에 적합한 유사량 측정 기준, 부유사 및 하상토 입경 분포 곡선 분석, 부유사량 산정, 향후 개선사항에 대해 정리하였다. 유사량 분석 결과는 다음과 같다. 전반적으로 측선별 농도의 편차는 크지 않는 것으로 나타났으며, 6개지점의 모두 유량 및 유사량 관계를 기존의 단순 지수함수로 표현하기에는 측정성과의 분산이 너무 큰 것으로 나타났다. 이는 기존 보고서에도 알려진 바와 같이 수위 상승시와 하강시의 유사량 특성이 너무 상이하기 때문이다. 향후 정밀한 측정 및 분석으로 유량 및 유사량 관계를 적절히 표현하는 방식이 필요하다고 판단된다. 그리고, 향후 전문인력에 의한 정밀 유사량 관측과 장기관측을 통해 보다 신뢰성 있는 유사량 특성을 분석할 수 있을 것이며, 홍수 방재를 위한 기반을 마련할 수 있을 것이다.

  • PDF

퍼지 유사도 척도 (Fuzzy Similarity Measure)

  • 이광형
    • 한국지능시스템학회논문지
    • /
    • 제8권6호
    • /
    • pp.119-121
    • /
    • 1998
  • 퍼지 시스템의 퍼지 하이퍼그래프에 의해서 표현되었다고 할때, 퍼지 집합을 나타내는 퍼지 에지사이의 유사도를 측정할 필요가 있다. 또한 원소들 사이의 유사도를 측정할 필요가 있다. 본 논문은 이런 필요성에 따라서 퍼지 유사도를 측정하는 척도를 제안한다. 하나는 퍼지 집합 사이의 유사도를 측정하고, 또 하나는 원소 사이의 퍼지 유사도를 측정해 준다. 이 척도는 퍼지집합과 원소 개개의 유사성을 중시하고 시스템 분석 분야에서 이용될 수 있다.

  • PDF

텍스트 유사성을 위한 파라미터 및 비 파라미터 측정 (Parametric and Non Parametric Measures for Text Similarity)

  • 존 믈랴히루;김종남
    • 융합신호처리학회논문지
    • /
    • 제20권4호
    • /
    • pp.193-198
    • /
    • 2019
  • 인터넷상에서의 진짜 및 가짜 정보의 범람이 수많은 텍스트 분석에 대한 연구를 이끌었다. 문헌 표기 없이 타인의 저작물을 무단 복제 및 관련 없는 연구결과 조작 등이 한동안 세간의 주목을 이끌었다. 연구 분야에서 표절과 이의 대항 및 감소를 위해 다양한 도구들이 개발되었다. Pearson Spearman 본 연구에서는 코사인 유사성과 및 상관관계를 이용하는 파라미터 및 비 파라미터 방법을 이용하여 문장 유사성을 측정한다. Pearson 코사인 유사성과 상관관계는 가장 높은 유사성 계수를 얻었으나 Spearman 상관관계는 낮은 유사성 계수를 보여주었다. 본 논문에서는 정상성 가정과 편향성에 의존하는 파라미터 방법들에 반하도록 비정상성 가정으로 인한 문장 유사도를 측정하는 데 있어 비 파라미터 방법들을 사용하는 것을 제안한다.

컬러 보정을 위한 컬러 간의 유사성 측정 기법 (Method of Measuring Color Similarity for Color Correction)

  • 황영배;김제우;최병호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.420-423
    • /
    • 2011
  • 두 카메라 혹은 다수의 카메라에서의 컬러 보정은 알고리즘의 성능 향상 및 양안식 3D 카메라에서 매우 중요한 기술이다. 최근 컬러 보정 방법들이 다수 제안되었지만 이 방법들의 결과에 대한 정확한 측정 방법이 많지 않으며 기존의 측정 방법은 두 영상이 카메라의 위치에 따른 서로 다른 장면을 가지고 있을 경우에 적합하지 않을 수 있다. 본 논문에서는 컬러 보정을 위한 컬러 간의 유사성 측정 기법을 제안한다. 이 기법은 대상이 되는 두 영상의 장면이 일치하지 않는 경우를 고려하여 대응점 검색을 통해 두 장면 간의 같은 컬러를 가져야 하는 대응점을 찾고 이 대응점 주위의 영역으로부터 통계치를 계산하여 컬러의 유사성을 비교한다. 이 경우 두 영상의 위치 변화에 따른 장면 변화와 대응점의 약간의 어긋남에 대해서 고려할 수 있다. 또한 대응점들이 영상의 모든 영역을 포함하지 않을 수 있기 때문에 전체 영상의 통계치를 계산하여 컬러의 유사성을 비교도 동시에 수행하여 결과적인 컬러의 유사성은 대응점 기반과 전체 영상 기반의 유사성의 가중치의 합으로 결정되며 이 가중치는 대응점 기반의 컬러 비교가 영상 내의 얼마만큼의 영역을 포함하는지에 따라서 결정된다.

  • PDF

웹상의 이질적 이미지 데이터베이스를 선택하기 위한 복합 추정 방법 (Hybrid Estimation Method for Selecting Heterogeneous Image Databases on the Web)

  • 김덕환;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권5호
    • /
    • pp.464-475
    • /
    • 2003
  • 웹상의 이미지 데이타베이스들은 자치성과 이질성이라는 두 가지 다른 특성을 갖고 있다. 즉 독립적으로 만들어지고 유지되며 질의 처리 방법이 서로 다르다. 분산된 이미지 데이타베이스들에 대한 내용기반 검색에서, 메타 서버의 유사성 측정함수에 대하여 서로 다른 지역 유사성 측정 함수를 갖는 데이터베이스들로부터 주어진 질의 객체와 유사한 객체들을 찾는 능력을 갖는 것은 중요하다. 현재까지, 동일한 유사성 측정 함수들을 사용하는 이미지 데이타베이스들을 선택하는 방법에 대하여 많은 연구가 진행되었으나 이미지 데이타베이스들이 다른 유사성 측정함수를 사용하는 경우에 대한 연구는 없었다. 본 논문에서는 웹상의 많은 이질적인 이미지 데이타베이스들 중 질의에 유사한 객체들을 보다 많이 가지고 있는 데이타베이스들을 찾는 문제를 다룬다. 데이타베이스들의 순위는 이미지 데이타베이스들의 압축된 히스토그램 정보와 적은 수의 표본 객체들을 사용하는 복합 추정에 기반을 두고 있다. 구형 영역 질의에 대한 선택률을 추정하기 위하여 히스토그램 정보를 사용하며, 유사성 측정 함수의 차이로 인한 선택률 오차를 보정하기 위하여 표본 객체들을 이용한다. 많은 수의 이미지 데이타에 대한 상세한 실험은 제안된 방법이 이질적인 분산 환경에서 효율적임을 보여준다.