• 제목/요약/키워드: Similarity Measures

검색결과 304건 처리시간 0.024초

Normalized cut을 이용한 Image segmentation에 대한 연구 (A study of a image segmentation by the normalized cut)

  • 이규한;정진현
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1998년도 하계학술대회 논문집 G
    • /
    • pp.2243-2245
    • /
    • 1998
  • In this paper, we treat image segmentation as a graph partitioning problem. and use the normalized cut for segmenting the graph. The normalized cut criterion measures both the total dissimilarity between the different graphs as well as the total similarity within the groups. The minimization of this criterion can formulated as a generalized eigenvalues problem. We have applied this approach to segment static image. This criterion can be shown to be computed efficiently by a generalized eigenvalues problem

  • PDF

번들상품추천시스템 개발을 위한 객체지향 사례베이스 설계와 유사도 측정에 관한 연구 (An Object-Oriented Case-Base Design and Similarity Measures for Bundle Products Recommendation Systems)

  • 정대율
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.23-51
    • /
    • 2003
  • 인터넷 쇼핑몰에서 사례기반추론기법을 통한 유사상품의 탐색과 사용자 요구에 적합한 상품추천을 위해서는 다양한 요구에 부응할 수 있는 사례베이스의 구축이 우선되어야 한다. 그리고 구축된 사례베이스로부터 유사한 사례를 검색하여 재 사용하거나 필요시 수정하고, 그 결과를 다시 저장하는 기능이 요구된다. 사례기반 상품추천시스템 개발에 있어 가장 중요한 요소는 사례의 표현문제이다. 본 연구에서는 인터넷 수산물 쇼핑몰의 상품추천시스템에서 번들상품 구성문제(집안 이벤트 시 필요한 수산물의 집합)를 표현하는데 적합한 사례표현기법을 개발하며, 유사사례를 추출하기 위한 유사도 척도의 개발에 연구의 첫 번째 주안점을 둔다. 본 논문에서는 번들상품추천을 위한 사례표현기법으로 객체모델링(OMT)기법을 사용하고 있다. 또한 다양한 사례 속성 유사도 측정방법을 적용하며, 유사도 측정에서 분류법(taxonomy)의 의미와 그 적용방법을 제시한다.

  • PDF

정적 주요 경로 API 시퀀스를 이용한 소프트웨어 유사성 검사 (Detecting Software Similarity Using API Sequences on Static Major Paths)

  • 박성수;한환수
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1007-1012
    • /
    • 2014
  • 소스코드가 없이 실행코드만으로 소프트웨어 간의 유사성을 비교하기위해 소프트웨어 버스마크를 이용한다. 소프트웨어 버스마크란 그 소프트웨어만의 고유한 특징으로 소프트웨어 식별에 사용된다. 본 논문에서는 정적 주요경로 상의 API 함수 시퀀스를 이용하여 소프트웨어 간의 유사성을 산정하는 방법을 제시한다. 바이너리코드에서 소프트웨어의 특성이 뚜렷하게 나타나는 API 함수만을 사용하여 소프트웨어 유사성 검사의 신뢰성을 높이고, 정적 분석 기법에 동적 분석 기법의 특징을 적용하여 강인성을 높이는 방법을 모색하였다. 정적 분석으로 바이너리코드의 주요경로를 추출하고, API 함수 시퀀스 간의 효과적인 유사성 측정을 위해 서열정렬 알고리즘인 Smith-Waterman 알고리즘을 이용한 유사성 척도를 제안한다. 버스마크의 신뢰성을 평가하기 위하여 같은 프로그램의 여러 버전을 대상으로 실험하였고, 강인성을 평가하기 위해 오픈소스 소프트웨어의 소스코드를 다양한 컴파일환경으로 바꾸어 실험하였다.

위키피디아를 이용한 분류자질 선정에 관한 연구 (An Experimental Study on Feature Selection Using Wikipedia for Text Categorization)

  • 김용환;정영미
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.155-171
    • /
    • 2012
  • 텍스트 범주화에 있어서 일반적인 문제는 문헌을 표현하는 핵심적인 용어라도 학습문헌 집합에 나타나지 않으면 이 용어는 분류자질로 선정되지 않는다는 것과 형태가 다른 동의어들은 서로 다른 자질로 사용된다는 점이다. 이 연구에서는 위키피디아를 활용하여 문헌에 나타나는 동의어들을 하나의 분류자질로 변환하고, 학습문헌 집합에 출현하지 않은 입력문헌의 용어를 가장 유사한 학습문헌의 용어로 대체함으로써 범주화 성능을 향상시키고자 하였다. 분류자질 선정 실험에서는 (1) 비학습용어 추출 시 범주 정보의 사용여부, (2) 용어의 유사도 측정 방법(위키피디아 문서의 제목과 본문, 카테고리 정보, 링크 정보), (3) 유사도 척도(단순 공기빈도, 정규화된 공기빈도) 등 세 가지 조건을 결합하여 실험을 수행하였다. 비학습용어를 유사도 임계치 이상의 최고 유사도를 갖는 학습용어로 대체하여 kNN 분류기로 분류할 경우 모든 조건 결합에서 범주화 성능이 0.35%~1.85% 향상되었다. 실험 결과 범주화 성능이 크게 향상되지는 못하였지만 위키피디아를 활용하여 분류자질을 선정하는 방법이 효과적인 것으로 확인되었다.

3차원 모델을 위한 형상 유사성 평가 (Evaluation of shape similarity for 3D models)

  • 김정식;최수미
    • 정보처리학회논문지A
    • /
    • 제10A권4호
    • /
    • pp.357-368
    • /
    • 2003
  • 3차원 모델의 형상 유사성 평가는 의학, 기계 공학, 분자 생물학 등의 많은 분야에서 매우 중요하다. 더욱이 3차원 모델이 웹 상에 보편화됨에 따라 3차원 모델들의 분류와 검색에 관한 연구들이 활발하게 이루어지고 있다. 본 논문에서는 3차원 형상 표현 방법들과 유사성 평가에 대한 주요 개념들을 기술하고, 최근의 형상 비교에 관한 연구들을 다해상도, 위상 기하학, 2차원 영상, 통계학 기반 방법들로 분류하여 그 특징들을 분석하였다. 또한 논문에서 채택한 유일성, 강인성, 불변성, 다해상도, 효율성, 비교범위와 같은 기준을 사용하여 그 성능을 비교 평가하였다. 다해상도 기반 방법은 비교를 위한 계산 시간은 감소시킨 반면 전처리 시간은 증가시켰다. 기하 및 위상 정보를 이용한 방법은 보다 다양한 형태의 모델들을 비교할 수 있었고 부분적인 형상 비교에도 강인하였다. 2차원 영상을 이용한 방법들은 시간 및 공간 복잡도가 높게 나타났다. 통계학 기반 방법들은 포즈 정규화 작업 없이 형상 비교가 가능하였고, 어파인 변환 및 잡음에도 강인한 결과를 보였다.

집합 유사 시퀀스 매칭의 성능 향상을 위한 인덱스 기반 검색 방법 (An Index-Based Search Method for Performance Improvement of Set-Based Similar Sequence Matching)

  • 이주원;임효상
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.507-520
    • /
    • 2017
  • 집합 유사 시퀀스 매칭 방법은 유사한 정도를 나타내는 척도로 교집합을 기반으로 한 유사도를 사용한다. 그러나 교집합 크기를 계산하는 과정에 시간이 오래 걸릴 뿐만 아니라, 유사한 시퀀스를 찾기 위해서 수많은 집합 간 교집합 크기를 구해야 하므로 수행 시간이 오래 걸리는 성능상의 문제가 있다. 본 논문에서는 이러한 성능상의 문제를 해결하기 위해 인덱스 기반의 검색 방법을 사용하여 집합 기반 유사 시퀀스 매칭을 빠르게 수행하는 방법을 제안한다. 제안하는 방법은 크게 두가지로 구분된다. 첫 번째로 집합 시퀀스 유사도 문제를 교집합의 크기 비교 문제로 정형적으로 변환하고, 교집합의 크기를 빠르게 찾을 수 있는 인덱스 구조를 제안한다. 두 번째로 제안한 인덱스 구조를 사용하여 집합 기반 유사 시퀀스 매칭을 효율적으로 수행할 수 있는 방법을 제안한다. 성능 평가 결과, 제안하는 방법이 기존 방법에 비해 최대 30배에서 50배의 수행 시간 단축이 있음을 보인다. 또한 데이터 시퀀스의 개수가 증가할수록 수행시간의 차이가 점점 커지므로, 대용량 데이터 처리에 적절함을 보인다.

다중선택 시험에서 부정행위자 발견을 위한 새로운 통계적 측도 (A New Statistical Index for Detecting Cheaters on Multiple Choice Tests)

  • 한은수;임요한;이경은
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.81-92
    • /
    • 2013
  • 학문적 진실성(academic integrity)을 위반하는 잠재적 부적행위를 판단할 때, 잘못된 결정을 피하기 위해서는 확고한 근거를 마련하는 것이 중요하다. 교육학 연구자들은 부정행위를 발견 혹은 확신 할 수 있는 많은 통계적인 방법들을 발전시켰다. 그러나, 대부분의 방법들은 단순히 상관계수를 기초로한 방법들이어서 종종 응답자들의 패턴을 설명하기가 어렵다. 이 논문에서는, 이런 어려움을 해결하기 해결하기 위하여 표준화된 부호 엔트로피 유사성 점수(Standardized Signed Entropy Similarity Score)라는 새로운 통계적인 측도를 제안한다. 또한, 이 제안한 방법을 실제 시험 자료를 이용 부정행위자를 발견하는데 적용하였고, 다른 기존의 방법들과 비교하였다.

유사도 측정 기법을 이용한 효율적인 요구 분석 지원 시스템의 구현 (Implementation of an Efficient Requirements Analysis supporting System using Similarity Measure Techniques)

  • 김학수;고영중;박수용;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.13-23
    • /
    • 2000
  • 소프트웨어가 점점 복잡해지고 대형화됨에 따라서 사용자의 요구가 매우 다양해지고 있으며, 제품에 대한 기대 수준도 높아지고 있다. 그러므로, 사용자의 요구 사항을 정확히 분석하여 효과적으로 개발 단계에 적용하는 것은 매우 중요하다. 본 논문에서는 자연어로 표현되는 요구 사항 문서의 분석 시에 나타나는 오류를 효과적으로 줄이고, 수정하는데 사용될 수 있는 요구 분석 시스템을 제안한다. 제안된 시스템은 문서간 유사도 측정에 의해서 문서간의 의존성(dependency) 분석을 지원하고 문장간 유사도 측정에 의해서 요구 사항간의 연계성(traceability), 중복성(redundancy), 불일치성(inconsistency), 그리고 불완전성(imcompleteness)을 발견하는 것을 지원한다. 또한 모호한 문장을 추출하여 요구사항의 불명확성 (ambiguity)을 발견하는 기능도 제공한다. 문서간 유사도 측정을 위해서 사용된 색인 방법은 슬라이딩 윈도우 모델과 의존 구조 모델을 결합한 것으로 각 모델이 가지는 단점을 효과적으로 보완할 수 있다. 본 논문에서는 문서간, 문장간 유사도 측정 기법의 효율성을 실험을 통해 검증하였으며 구현된 시스템을 통해 분석 처리되는 과정을 보여주고 있다.

  • PDF

Semantic Conceptual Relational Similarity Based Web Document Clustering for Efficient Information Retrieval Using Semantic Ontology

  • Selvalakshmi, B;Subramaniam, M;Sathiyasekar, K
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권9호
    • /
    • pp.3102-3119
    • /
    • 2021
  • In the modern rapid growing web era, the scope of web publication is about accessing the web resources. Due to the increased size of web, the search engines face many challenges, in indexing the web pages as well as producing result to the user query. Methodologies discussed in literatures towards clustering web documents suffer in producing higher clustering accuracy. Problem is mitigated using, the proposed scheme, Semantic Conceptual Relational Similarity (SCRS) based clustering algorithm which, considers the relationship of any document in two ways, to measure the similarity. One is with the number of semantic relations of any document class covered by the input document and the second is the number of conceptual relation the input document covers towards any document class. With a given data set Ds, the method estimates the SCRS measure for each document Di towards available class of documents. As a result, a class with maximum SCRS is identified and the document is indexed on the selected class. The SCRS measure is measured according to the semantic relevancy of input document towards each document of any class. Similarly, the input query has been measured for Query Relational Semantic Score (QRSS) towards each class of documents. Based on the value of QRSS measure, the document class is identified, retrieved and ranked based on the QRSS measure to produce final population. In both the way, the semantic measures are estimated based on the concepts available in semantic ontology. The proposed method had risen efficient result in indexing as well as search efficiency also has been improved.

Categorizing accident sequences in the external radiotherapy for risk analysis

  • Kim, Jonghyun
    • Radiation Oncology Journal
    • /
    • 제31권2호
    • /
    • pp.88-96
    • /
    • 2013
  • Purpose: This study identifies accident sequences from the past accidents in order to help the risk analysis application to the external radiotherapy. Materials and Methods: This study reviews 59 accidental cases in two retrospective safety analyses that have collected the incidents in the external radiotherapy extensively. Two accident analysis reports that accumulated past incidents are investigated to identify accident sequences including initiating events, failure of safety measures, and consequences. This study classifies the accidents by the treatments stages and sources of errors for initiating events, types of failures in the safety measures, and types of undesirable consequences and the number of affected patients. Then, the accident sequences are grouped into several categories on the basis of similarity of progression. As a result, these cases can be categorized into 14 groups of accident sequence. Results: The result indicates that risk analysis needs to pay attention to not only the planning stage, but also the calibration stage that is committed prior to the main treatment process. It also shows that human error is the largest contributor to initiating events as well as to the failure of safety measures. This study also illustrates an event tree analysis for an accident sequence initiated in the calibration. Conclusion: This study is expected to provide sights into the accident sequences for the prospective risk analysis through the review of experiences.