• Title/Summary/Keyword: 유사도 비교

Search Result 9,954, Processing Time 0.054 seconds

A Sequence Similarity Algorithm Irrelevant to Sequence Length (서열의 길이에 무관한 유사도 측정 알고리즘)

  • Kim, Jae-Kwang;Lee, Jee-Hyong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.13-16
    • /
    • 2008
  • Dynamic Programming (DP)을 이용한 서열 비교 알고리즘은 DNA, RNA, 단백질 서열의 비교와 프로그래밍 소스 코드 유사도를 측정하는 곳 등에 널리 사용되어 왔다. 이 알고리즘은 DP를 이용하여 행렬을 구성한 후, 행렬의 가장 마지막 생성 값을 이용해 두 서열의 유사도를 측정하는 방법이다. 그러나 이 알고리즘에서 사용하는 마지막 생성 값은 비교 서열이 길이에 따라 크게 좌우되기 때문에 다양한 서열들의 유사도를 알아내기에는 부적합하다. 본 논문에서는 서열의 길이에 무관한 유사도 측정 (S2) 알고리즘을 제안한다. 제안된 알고리즘을 이용하면 비교 서열의 길이에 영향을 받지 않고 정당한 서열 비교를 할 수 있다. 제안된 알고리즘의 검증을 위해 본 논문에서는 프로그램 소스 코드의 유사도 측정을 수행한다.

  • PDF

Similar Shape Matching Technique Using Interest Points (우세점을 이용한 유사한 모양 매칭 기법)

  • 김선규;엄기현
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.477-482
    • /
    • 2001
  • 이미지 데이터베이스에서 특성 객체를 가지고 있는 이미지를 효율적으로 검색하는 각 객체의 모양 특징을 질의 이미지의 질의 객체의 특징과 비교해야 한다. 올바른 모양 비교 기준은 사람이 보기에 같거나 유사하다고 판단하는 방법을 기준으로 삼는다. 본 논문에서는 질의 객체를 가진 이미지의 유사 검색에서 모양 비교의 정확도를 높이기 위한 매칭 기법을 제안한다. 이를 위해 질의 객체와 대상 객체에 비교를 시작할 근사한 우세점을 찾고 올바른 모양 비교를 위한 매칭 알고리즘을 제안한다. 또한 질의 중심의 유사도를 비교하기 위해 유사함수를 설정한다. 유사성 검색을 위해 사용되는 객체의 모양 특징은 객체의 윤곽선상의 점들 중 결정된 지역 특징을 지닌 (거리 ${\gamma}$, 각도$\theta$)의 우세점 집합으로 표현한다.

  • PDF

Method of Image Similarity Analysis Using Sequence Alignment of Colors (색상 서열 비교를 통한 영상의 유사도 분석 기법)

  • Jung, In-Joon;Woo, Gyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.426-429
    • /
    • 2011
  • 영상처리를 이용한 영상간의 유사도 비교 기법은 영상의 검색 및 영상의 자동 인식 등을 위한 연구로 최근 각광받고 있다. 최근 영상 처리 기법은 화소의 질적 향상 및 처리시간 최적화, 효율적인 특정 요소의 추출 등 다양한 방법으로 시도되고 있다. 특히, 영상의 유사도 비교는 유사 영상 검색과 같은 경우에 많이 쓰인다. 영상의 유사도를 비교하기 위한 기법으로는 영상 데이터의 특징에 따라 대상 영역을 여러 영역으로 나누는 영역분할 기법과 군집화, 퍼지, 유전자 알고리즘 등이 있다. 본 논문에서는 영상을 HSV 색공간으로 변환한 후 색상 값에 대하여 전역 정렬 기법을 사용하는 유사도 측정 방법을 제시한다. 전역 정렬 기법은 유전자 서열 비교 기법 중 하나로서 두 유전체의 유사도를 측정하는데 사용된다. 유사도 측정 효율을 높이기 위해 색상 값을 8단계로 양자화하여 영상의 서열을 생성하였다. 실험결과 제시한 방법을 영상 회전이나 대칭, 글자 삽입 등의 간단한 연산에 크게 영향을 받지 않는 것으로 드러났다.

Modeling of Semantic Similarity for Scene Segmentation (장면 분할 기법을 위한 의미적 유사도의 모델링)

  • Jung, Eui-Son;Jeon, Seong-Jun;Cho, Dong-Hwi;Geum, Yong-Ho;Ham, Dong-gyun;Kim, Eun-Ji;Park, Seung-Bo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.225-228
    • /
    • 2022
  • 본 논문에서는 의미적 유사도 기반의 장면 분할 방법을 제안한다. 이 방법은 의미적 접근을 통해 기존 연구에서 가졌던 한계를 극복하고 정확한 장면 분할이 가능할 것으로 기대한다. 의미적 유사도 비교를 Class 종류 비교, Class별 객체의 개수 비교, 샷 간의 Histogram비교, 객체의 관심영역(ROI) Histogram비교 총 4가지 규칙으로 정의했고 이때 도출된 4가지 유사도는 전처리를 거쳐 종합 유사도를 계산한다. 또한 의미적 접근을 통해 연속되는 Shot의 유사도를 비교하고 기준값에 따라 Shot을 묶어서 최종적으로 의미적 유사도(Semantic Similarity)에 기반한 장면의 경계(Scene Boundary) 분할 방법을 제시한다.

  • PDF

a new distance weighted correlation method to evaluate reconstructed brain sources (복원된 뇌신호원의 국지화 정확도 평가를 위한 거리 가중치 유사도 비교법)

  • Choi, Jong-Ho;Park, Sun-Ae;Jung, Hyun-Kyo
    • Proceedings of the KIEE Conference
    • /
    • 2011.07a
    • /
    • pp.2027-2028
    • /
    • 2011
  • 이 논문에서는 복원된 뇌신호원을 평가하는 방법 중의 하나로 거리 가중치 유사도 비교법을 제안한다. 의료영상처리 분야에서 시공간적인 뇌신경신호원의 변화를 비교 및 분석하기 위해서 여러 방법이 적용되고 있는데 가장 널리 사용되고 있는 것이 유사도 비교법이다. 본 논문에서는 1차원 기준으로 구성된 기존의 유사도 비교법을 3차원 뇌신호원 평가에 적합하도록 거리 가중치를 고려한 새로운 유사도 비교법을 제시한다. 또한 3차원 뇌신경신호원의 시뮬레이션을 통해 새로운 기법의 타당성을 검증한다.

  • PDF

A Tree-Compare Algorithm for Similarity Evaluation (유사도 평가를 위한 트리 비교 알고리즘)

  • Kim, Young-Chul;Yoo, Chae-Woo
    • The KIPS Transactions:PartA
    • /
    • v.11A no.2
    • /
    • pp.159-164
    • /
    • 2004
  • In the previous researches, tree comparison methods are almost studied in comparing weighted or labeled tree(decorated tree). But in this paper, we propose a tree comparison and similarity evaluation algorithm can be applied to comparison of two normal trees. The algorithm converts two trees into node string using unparser, evaluates similarity and finally return similarity value from 0.0 to 1.0. In the experiment part of this paper, we visually presented matched nodes and unmatched nodes between two trees. By using this tree similarity algorithm, we can not only evaluate similarity between two specific programs or documents but also detect duplicated code.

Android plagiarism detection through Dalvik instruction similarity comparison (Dalvik명령어 유사도 비교를 통한 안드로이드 표절 탐지 기법)

  • Choi, Sung-ha;Hwang, Na-hyun;Park, Heewan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.796-799
    • /
    • 2012
  • 스마트폰 애플리케이션 중에서 안드로이드 앱은 자바를 기반으로 한다. 따라서 자바 프로그램과 마찬가지로 디컴파일러 도구를 활용하여 원본 소스 코드를 얻어낼 수 있기 때문에 코드 도용에 대해서 매우 취약하다. 본 논문에서는 안드로이드에 대한 코드 도용과 표절을 막기 위한 기법을 제안한다. 효과적인 코드 도용 및 표절 여부를 탐지하기 위한 방법으로서, 안드로이드 달빅(Dalvik) 코드에 대해서 요약 단계를 거친 후 유사도를 측정하는 방법을 사용한다. 기존의 안드로이드 유사도 비교 연구에서는 달빅 코드가 정확하게 일치해야만 유사도가 높게 측정될 수 있었지만, 요약 단계를 통해서 변환된 달빅 코드를 비교하면 코드 도용시 일부 코드의 의도적인 수정이 있더라도 유사도가 높게 측정된다. 그 결과, 본 논문에서 제안하는 표절 탐지 기법이 기존 연구와 비교하여 표절에 대한 탐지 능력이 우수함을 확인하였다.

API Similarity Comparison Tool Development for Detecting Theft of Android Application (안드로이드 앱 도용 탐지를 위한 API 유사도 비교 도구 구현)

  • Choi, Sung-Ha;Lee, Hyun-Young;Cho, Seung-Min;Park, Heewan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.792-795
    • /
    • 2012
  • 최근 오픈 소스 커뮤니티가 활성화되고 수많은 오픈 소스들이 공개되고 있어서 많은 개발자들이 오픈 소스를 활용하고 있다. 그러나 오픈 소스도 정해진 라이선스 기반으로 공개되므로 오픈 소스를 사용할 때는 반드시 라이선스를 확인해야 한다. 본 논문에서는 안드로이드 앱의 라이선스 위반이나 코드 도용을 확인할 수 있는 방법으로서 안드로이드 앱 사이의 API 메소드 호출 유사도를 측정하는 방법을 제안한다. 원본 프로그램과 도용된 프로그램은 유사한 API 메소드를 사용할 것임을 예상할 수 있기 때문에 API 메소드 호출이 유사한 것을 확인하면 간접적으로 코드 도용을 확인할 수 있다. 본 논문에서 개발한 API 유사도 측정 도구는 안드로이드 앱의 소스 코드를 필요로 하지 않고, 안드로이드 달빅(Dalvik) 바이트 코드로부터 직접 API 호출 명령어를 분석하여 유사도를 측정한다는 특징이 있다. 본 논문에서 구현한 도구의 평가를 위해서 API 호출 유사도 비교 실험을 수행하였다. 그 결과, 실제로 API 호출 유사도가 높았던 두 앱이 서로 공통된 모듈을 포함하고 있음을 밝혀내었다. 그리고 선행 연구에서 제안했었던 안드로이드 달빅 코드 전체에 대한 유사도 비교 도구보다 비교 속도가 35% 정도 향상된 것을 확인하였다.

Similarity Computation between Music Motifs Using Cosine Measure (Cosine Measure를 이용한 음악 동기간 유사도 계산)

  • Lim, Sang-Hyuk;Ku, Kyong-I;Kim, Yoo-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1603-1606
    • /
    • 2003
  • 음악에서 동기는 독립성을 지니는 최소 단위이며, 저작권 검사의 단위로 이용된다 따라서, 한 음악에서 약간의 변화를 가지고 반복되는 주제선율을 추출하거나, 다른 음악간의 유사도를 측정하는데 유사도 계산은 필요하다. 본 논문에서는 비교되는 동기의 선율정보를 음 길이와 음높이가 함께 고려되는 시계열 데이타로 변환하고, cosine measure를 이용하여 동기간의 유사도를 계산한다. 시계열 데이타에서 유사도 계산으로 사용되는 유클리드 거리함수 대신 cosine measure를 이용한 경우, 공간상의 거리 합대신 변화 방향이 반영됨으로써 비교되는 동기간의 유사도를 정확하게 계산한다. 본 논문에서 제안된 동기간의 유사도 계산은 내용 기반 음악 검색에서 색인으로 사용되는 주제선율을 추출하거나, 다른 음악의 동기간의 유사성을 비교하는데 이용될 수 있다.

  • PDF

Measuring Similarity of Korean Sentences based on BERT (BERT 기반 한국어 문장의 유사도 측정 방법)

  • Hyeon, Jonghwan;Choi, Ho-Jin
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.383-387
    • /
    • 2019
  • 자연어 문장의 자동 평가는 생성된 문장과 정답 문장을 자동으로 비교 및 평가하여, 두 문장 사이의 의미 유사도를 측정하는 기술이다. 이러한 자연어 문장 자동 평가는 기계 번역, 자연어 요약, 패러프레이징 등의 분야에서 자연어 생성 모델의 성능을 평가하는데 활용될 수 있다. 기존 자연어 문장의 유사도 측정 방법은 n-gram 기반의 문자열 비교를 수행하여 유사도를 산출한다. 이러한 방식은 계산 과정이 매우 간단하지만, 자연어의 다양한 특성을 반영할 수 없다. 본 논문에서는 BERT를 활용한 한국어 문장의 유사도 측정 방법을 제안하며, 이를 위해 ETRI에서 한국어 말뭉치를 대상으로 사전 학습하여 공개한 어절 단위의 KorBERT를 활용한다. 그 결과, 기존 자연어 문장의 유사도 평가 방법과 비교했을 때, 약 13%의 성능 향상을 확인할 수 있었다.

  • PDF