• 제목/요약/키워드: 유사도측정

검색결과 1,381건 처리시간 0.037초

트리 유사도: 상호운용성 평가도구 (Tree Similarity: Interoperability Evaluation Tool)

  • 정성훈;배재학
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.276-280
    • /
    • 2017
  • 현대사회에 존재하는 다양한 시스템들이 병합될 때는 병합을 위해서 여러 가지 방법을 사용해 볼 수 있다. 이때 시스템의 성격에 따라 더 적절한 병합 방법론이 존재할 수 있지만, 어떤 방법이 해당 시스템을 통합하는데 더 적절한지를 판단하기는 쉽지 않다. 본 논문에서는 서로 다른 시스템을 통합할 때, 그 상호 운용성을 평가하기 위한 수단으로 트리의 유사도를 측정하는 방안을 제시한다. 이렇게 측정된 유사도는 0이상 1이하의 값을 가지며, 정확한 수치로 제시되기 때문에 서로 다른 통합 방법론을 평가하기 위한 계량적 근거로 사용될 수 있다. 다만 트리 구조로 나타낼 수 없는 일부 시스템들에 대해서는 적용할 수 없는 한계를 가진다.

  • PDF

음악콘텐츠 표절분석시스템 설계 및 구현에 관한 연구 (A Study on the Design and Implementation of Plagiarism Analysis System of Music Contents)

  • 신미해;김의정
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.279-282
    • /
    • 2013
  • 본 논문에서는 사람의 감성에 의해 판단되는 음악의 표절에 대한 논란을 IT 기술을 이용해 표절 판단의 근거를 제공할 수 있는 음악콘텐츠 표절분석시스템을 설계하고 구현하였다. 이를 위해 음악콘텐츠의 요소 파악을 기초로 유사한 서로 다른 두 음원의 표절분석을 수행하여 유사도를 측정하는 시스템을 개발하고자 하였다.

  • PDF

최적합 객체 선정을 위한 선 클러스터링 알고리즘 (Pre-Clustering Algorithm for Selecting Optimal Objects)

  • 장주현;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.901-903
    • /
    • 2005
  • 본 논문에서는 절차 중심 소프트웨어를 객체 지향 소프트웨어로 재/역공학기 위한 다단계 절차 중 객체 추출 단계에서 선 클러스터링을 통해 불필요한 정제 결합단계를 축소하고, 영역 전문가의 선택으로 영역모델링에 가장 가까운 객체 후보군을 제시하는 알고리즘을 제안하고자 한다. 기존의 연구에서는 영역 모델링과 다중 객체 후보군과의 유사도를 측정하여 영역 전문가에게 최적합 후보를 선택할 수 있는 측정 결과를 제시하였다. 하지만 영역 전문가가 제시하는 영역 모델링이 존재한다면 정제 결합단계이전에 최대한의 선 클러스터링을 통해서 영역 모델링과 가장 유사한 통합 객체를 제시할 수 있고, 정제 결합 단계를 선 클러스터링을 통해서 축소할 수 있으며 이를 통해서 객체 후보군과 영역모델링의 유사도를 향상 시키며 클러스터링에 따른 시간과 공간을 절약할 수 있다. 따라서 본 논문에서는 영역 모델링과 사용자의 함수, 전역변수의 선택을 통해 영역 모델링에 가장 유사한 객체 후보군을 찾는 선 클러스터링 알고리즘 제안 하고자 한다.

  • PDF

문서구조 정보 기반의 유사도 측정 (A Similarity Evaluation using Structural Information of Documents)

  • 신미해;고방원;김영철;정진영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.499-502
    • /
    • 2010
  • 인터넷의 발달로 인한 수많은 정보의 공유는 지식 정보사회의 발전을 가져왔다. 이러한 정보사회의 발전과 동시에 표절과 같은 새로운 지식 범죄도 급증하고 있다. 표절은 연구의 정직성과 창의성을 떨어뜨리고 학문의 발전을 저해하는 요소이다. 이러한 표절을 근절하기 위해서 그동안 많은 방법들과 시스템들이 제시되었다. 이중 자연어로 구성된 구조가 없는 일반 문서의 표절을 검사하는 방법은 지문법을 이용하였다. 지문법과 같이 통계적인 방법을 이용한 유사도 검사 방법은 문서 대 문서 전체를 비교하기 때문에 부분적 유사성, 즉 문장이나 문단 단위의 비교를 할 수 없는 단점이 있다. 본 논문에서 제시하는 시스템은 자연어로 이루어진 일반문서 중 특별한 문서의 구조 정보를 가질 수 있는 일반 텍스트 문서를 대상으로 유사도를 측정하였다. 즉 텍스트 문서 구조를 AST 형태의 자료구조로 표시하고 이를 이용하여 사용자가 원하는 부분 또는 전체 유사도 측정 방법을 제시한다.

  • PDF

코사인 유사도를 기반의 온톨로지를 이용한 문장유사도 분석 (Sentence Similarity Analysis using Ontology Based on Cosine Similarity)

  • 황치곤;윤창표;윤대열
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.441-443
    • /
    • 2021
  • 문장 또는 텍스트 유사도란 두 가지 문장의 유사한 정도를 나타내는 척도이다. 텍스트의 유사도를 측정하는 기법으로 자카드 유사도, 코사인 유사도, 유클리디언 유사도, 맨하탄 유사도 등과 같이 있다. 현재 코사인 유사도 기법을 가장 많이 사용하고 있으나 이는 문장에서 단어의 출현 여부와 빈도수에 따른 분석이기 때문에, 의미적 관계에 대한 분석이 부족하다. 이에 우리는 온톨로지를 이용하여 단어 간의 관계를 부여하고, 두 문장에서 공통으로 포함된 단어를 추출할 때 의미적 유사성을 포함함으로써 문장의 유사도에 분석의 효율을 향상하고자 한다.

  • PDF

다차원 명암도 증감 기반 효율적인 영상정합 (An Efficient Image Registration Based on Multidimensional Intensity Fluctuation)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제22권3호
    • /
    • pp.287-293
    • /
    • 2012
  • 본 논문에서는 영상의 다차원 명암도 증감에 기반을 둔 유사도 측정에 의한 효율적인 영상정합 방법을 제안하였다. 여기서 다차원 명암도는 영상의 4방향을 고려한 유사성 판정으로 영상이 가지는 속성을 더욱 더 많이 반영하기 위함이고, 명암도 증감은 인접 픽셀간의 밝기변화를 고려함으로써 좀 더 포괄적으로 유사성을 측정하기 위함이다. 또한 측정된 4방향 각각의 명암도 증감에 대한 정규상호상관계수를 구하고, 그 각각에 바탕을 둔 전체 정규상호상관계수, 각 방향의 상관계수에 대한 산술평균과 단순 곱 및 최대값으로 정규화된 상관계수의 산술평균과 단순 곱으로 정의된 유사도 계수로 각각 정합을 측정하였다. 제안된 방법을 22개의 243*243 픽셀 얼굴영상과 9개의 500*500 픽셀 인물영상을 대상으로 각각 실험한 결과, 영상의 속성을 잘 반영한 우수한 정합성능이 있음을 확인하였다. 특히 각 방향의 상관계수에 대한 산술평균 유사도가 가장 우수한 신뢰성을 가지는 정합척도임을 알 수 있었다.

이웃 선정 조건에 따른 협력 필터링의 성능 향상 분석 (Analysis of Performance Improvement of Collaborative Filtering based on Neighbor Selection Criteria)

  • 이수정
    • 컴퓨터교육학회논문지
    • /
    • 제18권4호
    • /
    • pp.55-62
    • /
    • 2015
  • 협력 필터링을 통한 추천 시스템은 정보 검색 편의성을 제공함으로써 다방면에서 성공적으로 활용되어왔다. 유사도 측정은 추천인들의 범위를 결정하는 기준이 되기 때문에 이러한 시스템의 성능을 좌우하는 결정적 요소이다. 본 연구에서는 기존의 유사도 측정 공식에서 산출되는 유사도값의 분포를 분석하고, 유사도값과 공통평가항목수와의 관계를 조사하였다. 이를 통해 발견된 문제점을 보완하기 위하여 유사도값의 제한을 통하여 신뢰할 만한 추천인들을 선정하는 방법을 제시하였다. 실험 결과, 유사도의 상한값과 하한값을 동시에 제한하는 방법이 기존보다 월등한 성능 향상을 가져왔다. 특히 적은 수의 최인접이웃을 참조했을 때 두드러졌는데, 코사인 유사도에 대해서는 최대 0.047, 피어슨에 대해서는 최대 0.03의 추천 성능 향상을 보였다. 이 결과는 피어슨과 코사인 유사도를 이용하는 협력필터링 시스템에서 매우 높거나 낮은 유사도의 이웃의 평가 등급은 참조하지 않는 것이 바람직함을 암시한다.

저니키 모멘트 서술자를 이용한 M:N 면 객체 쌍의 형상 유사도 측정 (Shape similarity measure for M:N areal object pairs using the Zernike moment descriptor)

  • 허용;유기윤
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.153-162
    • /
    • 2012
  • 본 연구는 저니키 모멘트 서술자를 이용하여 객체 쌍의 기수성에 영향을 받지 않고 M:N 면 객체 쌍의 형상 유사도를 측정할 수 있는 방법을 제안한다. 제안된 형상 유사도는 저니키 기저함수에 객체 집합의 공간적 분포 영역을 투영하여 얻어지는 모멘트를 이용하기 때문에 형상을 구성하는 객체들의 기수성에 영향을 받지 않는다. 또한 낮은 차수의 기저함수에 대응되는 모멘트는 전역적인 형상을 표현하고, 높은 차수의 기저함수에 대응되는 모멘트는 지역적인 형상을 표현하기 때문에 원형상과 유사한 수준으로 형상을 복원할 수 있는 차수까지의 모멘트를 이용함으로써 효과적으로 형상을 서술하고 비교하는 것이 가능하다. 제안된 방법은 서울시 지역의 도로명주소 지도와 차량용 항법 지도의 건물 객체를 대상으로 적용 및 평가하였다. 기존 중첩면적비를 이용한 유사도에 비하여 제안된 유사도는 기수성의 변화에 강건함을 확인할 수 있었다.

러프 집합과 퍼지 집합에 기반한 프로그램 재사용 가능도 측정 (Program Reuse Possibility Measurement Based on Rough and Fuzzy Sets)

  • 김혜경;김미경;최완규;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 1998년도 추계학술대회 학술발표 논문집
    • /
    • pp.145-149
    • /
    • 1998
  • 소프트웨어의 유지보수면에서, 재사용이 매우 중요시되고 있는 가운데, 사용자가 최소 노력으로 필요한 컴포넌트들을 선택 및 유사 컴포넌트들을 평가할 수 있는 방법이 필요하다. 따라서, 본 논문에서는 현업에서의 많은 연구와 실험을 통해서 그 타당성이 검증된 척도들을 측정 인자로 설정, 여기에 러프 집합으로써 각 측정 인자들의 중요도를 측정하고, 이러한 측정값들을 Sugeno의 퍼지 적분으로써 종합하여 컴포넌트의 재사용 가능도를 평가하여 재사용이 용이한 컴포넌트 순으로 사용자에게 제공할 수 있는 재사용 가능도 평가 방법을 제안한다.

  • PDF

도로 네트워크에서 이동 객체를 위한 시공간 유사 궤적 검색 알고리즘 (Trajectory Search Algorithm for Spatio-temporal Similarity of Moving Objects on Road Network)

  • 김영창;라빈드라 비스타;장재우
    • 한국공간정보시스템학회 논문지
    • /
    • 제9권1호
    • /
    • pp.59-77
    • /
    • 2007
  • 모바일 환경의 대중화와 이를 위한 기반 기술의 발전으로 인하여 이동 객체들을 효과적으로 표현하고 분석하는 것이 중요한 문제로 대두되고 있다. 이러한 환경에서 이동 객체 궤적의 유사성 검색은 궤적에 대한 데이터 마이닝의 일부분으로 중요한 연구 분야중의 하나이다. 본 논문에서는 도로 네트워크상의 이동 객체 궤적을 위한 시공간 유사 궤적 검색 알고리즘을 제안한다. 이를 위하여 도로 네트워크상에서 두 이동 객체 궤적 사이의 시공간 거리를 정의하고, 이를 기반으로 궤적 사이의 시공간 유사도 측정 방법을 제안한다. 유사 궤적 알고리즘은 효율적인 검색을 위하여 시그니쳐 파일 기법을 이용하여 궤적을 검색한다. 마지막으로, 본 논문에서 제안하는 시공간 유사 궤적 검색 알고리즘을 구현하고, 성능 분석을 통해 제안하는 알고리즘의 효율성을 입증한다.

  • PDF