• 제목/요약/키워드: 유사성 분석

검색결과 7,132건 처리시간 0.041초

임베디드 시스템의 동일기능 소스코드 유사도 분석 요구사항 (Object Material Confirmation for Source Code Comparison on Embedded System)

  • 김도현;이규대
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권1호
    • /
    • pp.25-30
    • /
    • 2021
  • 임베디드 시스템 소스코드 감정목적물의 유사성을 판단하는 경우, 제공된 소스코드가 컴파일이 가능한 상태인지, 실행이 정상적으로 되는 것인지, 하드웨어와의 인터페이스가 일치하는지 등의 확인이 되지 않은 상태로 제공되는 경우가 지속적으로 발생하고 있다. 분쟁을 제기하는 측에서는 동작의 특성이 유사하고, 나타나는 기능의 효과가 유사한 이유로 소스코드의 많은 부분이 유사할 것으로 판단하고, 감정을 요청하게 되지만, 위의 여러 가지 상황으로 유사성 분석 결과가 기대와 다르게 나타나는 가능성이 우려된다. 본 연구에서는 감정사례를 통해 소스코드의 분석 과정과 검증되지 않은 소스코드의 유사성 도출의 개선방향을 제시한다.

인터넷에서의 데이터 트래픽 특성분석 (Analysis for Data Traffic Characteristics in Internet)

  • 임석구;이종규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1401-1404
    • /
    • 2003
  • 현재 제공되는 인터넷 서비스들의 동작 특성은 기존에 고려되던 트래픽 특성과는 완전히 다른 자기 유사성(Self·similarity)이라는 성질을 가진다는 것이 증명되었다. 자기 유사성은 장기간 의존성으로 표현되는데, 이것은 단기간 의존성 성질을 갖는 기존의 모델인 포아송(Poisson) 모델과는 상반되는 개념이다. 따라서 차세대 통신망의 설계 및 디멘져닝을 위해서는 무엇보다도 데이터 트래픽의 주요 특성인 버스트성(Burstiness)과 자기유사성이 반영된 트래픽 모델이 요구된다. 여기서 자기유사성은 허스트 파라미터(Hurst Parameter)로 특성화 될 수 있다. 이러한 관점에서 본 논문에서는 데이터 트래픽 특성이 서로 다른 다수의 데이터 트래픽의 통합되어 통신망에 입력되는 경우 주요 파라미터인 Hurst Parameter의 변화를 다양한 환경 하에서 분석하였고 이를 시뮬레이션 결과와도 비교하였다.

  • PDF

동시 비 발생 빈도를 고려한 유사성 측도의 연관성 규칙 평가 기준 활용 방안 (Association rule thresholds of similarity measures considering negative co-occurrence frequencies)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권6호
    • /
    • pp.1113-1121
    • /
    • 2011
  • 최근 여러 분야에서 다양한 데이터 마이닝 방법들을 현업에 적용하고 있는 추세이다. 가장 많이 활용되고 있는 데이터 마이닝 기법 중의 하나인 연관성 규칙은 대용량 데이터베이스에 내재되어 있는 항목들 간의 관련성을 수치화하여 그들 간의 연관 정도를 나타내는 기법이다. 의미 있는 연관성 규칙을 생성하기 위해 지지도, 신뢰도, 향상도 등의 측도가 가장 기본적으로 활용되고 있다. 본 논문에서는 군집 분석이나 다차원 분석법에서 많이 활용되고 있는 유사성 측도들 중에서 동시 비 발생 빈도를 고려한 유사성 측도를 연관성 평가 기준으로 제안한 후, 예제를 통하여 기존의 신뢰도 및 지지도와 비교함으로써 그 유용성을 알아보았다. 모의실험 결과를 종합해볼 때, 동시 발생 빈도 또는 동시 비 발생 빈도가 증가하면 본 논문에서 고려한 모든 유사성 측도들은 지지도 및 신뢰도와 마찬가지로 증가하며, 불일치 계수의 값이 증가하면 이 측도들은 감소하게 된다는 사실을 알 수 있었다. 또한 이들 유사성 측도들은 지지도 및 신뢰도와 매우 유의한 상관관계가 있는 것으로 나타났으며, 전항과 후항이 바뀌더라도 값의 변화가 없기 때문에 신뢰도 보다 더 바람직한 연관성 규칙 평가 기준이라고 할 수 있다.

상호정보량 기법을 이용한 군집분석의 적용성 연구 (Application of Cluster Analysis using Mutual Information)

  • 정영훈;김완수;정창삼;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.414-414
    • /
    • 2011
  • 우리나라 뿐만 아니라 전 세계적으로 기후변화로 인한 집중호우, 폭설 등이 빈번하게 일어나고 있으며 수공구조물 설계에 필요한 확률강우량도 증가하고 있다. 확률강우량을 산정하는 빈도해석의 경우 지점빈도해석의 문제점을 보완한 지역빈도해석에 대한 연구가 꾸준히 진행되고 있다. 지역빈도해석을 적용하기 위해서는 수문학적 동질성을 가지는 지역 구분이 무엇보다 중요하다. 군집 분석은 개체들이 지니고 있는 다양한 속성의 유사성을 동질적인 집단으로 군집화하는 방법을 말한다. 군집분석의 기본원리는 분석하고자 하는 여러 특성등을 유사성(similaruty) 거리(distance)로 환산하고 거리가 상대적으로 가까운 개체들을 동질적으로 군집화하는 것이다. 군집분석을 적용하기 위해서는 기상학적 인자와 지형학적 인자를 이용하여 군집분석을 실시한다. 군집분석을 실시할 때 가장 중요한 것은 입력변수의 선택으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 준다. 상호정보량(Mutual Information, MI) 기법은 두 무작위 변수간의 관련성을 측정하는 방법이며 (Cover and Tomas, 2006), 두 변수간의 독립성 구조에 관한 가정이 없고 데이터 변형이나 잡음(noise)에 대한 영향이 적어 다른 기법보다 신뢰도가 높다고 알려져 있다(Peng et al., 2005). 본 연구에서는 상호정보량 기법을 이용하여 군집된 지점들의 종속성과 독립성의 관계를 정량적으로 산정하여 비교하고자 한다.

  • PDF

예약어 시퀀스 탐색을 통한 소스코드 표절검사 (Source Codes Plagiarism Detection By Using Reserved Word Sequence Matching)

  • 이영주;김승;강석호
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집
    • /
    • pp.1198-1206
    • /
    • 2006
  • 프로그램 소스코드 표절 검사에 대한 기존 방법은 크게 지문(finger-print)법과 구조기반 검사법으로 나뉘며, 주로 단어의 유사성이나 발생빈도를 사용하거나 소스코드 구조상의 특징으로 두 소스간의 유사성을 비교한다. 본 연구에서는 프로그래밍 언어의 예약어 시퀀스를 사용하여 소스코드들 간의 유사성을 비교하고, 이 결과를 FCA(Formal Concept Analysis)를 통해 해석하고 시각화 하는 방법을 제시한다. 일반적인 VSM(Vector Space Model)과 같은 단일 단어 분석으로는 단어의 인접성을 구분할 수 없으므로 단어의 시퀀스 분석이 가능하도록 알고리즘을 구성하였으며 이러한 방식은 지문법의 단점인 소스코드의 부분적인 표절 탐지의 난점을 해결할 수 있고 함수의 호출 순서나 수행 순서에 상관없이 표절을 탐지할 수 있는 장점을 가진다. 마지막으로 유사도 측정결과는 FCA를 이용하여 격자(lattice)로 시각화됨으로써 이용자의 이해도를 높일 수 있다.

  • PDF

감정 대상 규격서의 수정 및 추가에 대한 분석 방법 (Analysis Method for Revision and Addition of the Specification to Appraisal)

  • 전병태
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제16권2호
    • /
    • pp.37-44
    • /
    • 2020
  • 정보화 사회가 발전함으로써 다양한 저작권 침해 사례가 발생하고 있다. 기업간의 여러 분쟁은 소프트웨어 유사도 감정이 대부분을 차지하고 있다. 본 논문은 감정 대상 규격서의 유사도 산정 방법에 관한 연구이다. 즉, 감정 대상 규격서의 수정 및 추가 분량이 어느 정도 인지 산정하는 연구이다. 감정 분석 방법은 양측의 규격서 목차 비교하고 동일 또는 유사 부분을 찾아낸다. 유사 정도에 따라 유사도 가중치를 결정한다. 가중치는 전문가의 전문적 지식과 규격서의 유사 정도를 파악하고 부여한다. 완전히 새로 추가된 경우 유사도 가중치는 1, 일부 수정한 경우 유사도 가중치는 0.4, 기존과 거의 동일한 경우 가중치 0.05를 주어 산정한다. 본 논문을 통하여 규격서에 대한 동일 유사성 산출 결과 21.2 페이지임을 알 수 있었다.

유전자의 기능분류를 위한 클러스터링 알고리즘 연구 (Research for clustering algorithm for the functional classification of genes)

  • 한석현;이강만
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1149-1151
    • /
    • 2015
  • 차세대 유전정보 분석기 시퀀서의 개발은 양질의 시퀀싱 데이터를 증가시켰다. 수많은 유전정보는 유전자 분석의 새로운 연구 방향을 제시하였다. 본 논문은 유전자 분석 중에서 기존의 유전정보를 활용하여 유전자의 기능예측을 하고자 한다. 클러스터링 알고리즘의 정확도를 높이기 위해서 본 논문에서는 데이터 유사성 조절이 가능한 클러스터링 알고리즘을 적용하였다. 그 결과 데이터 유사성 조절을 할 경우에 그렇지 않을 경우보다 유전자 기능 예측의 정확도가 높아졌다. 따라서 제안된 데이터 유사성 조절 기법은 유전자 기능을 예측하는 방법에 정확도를 높일 수 있을 것으로 기대된다.

지연시간과 손실율을 고려한 데이터 트래픽 분석 (An Analysis of Data Traffic Considering the Delay and Cell Loss Probability)

  • 임석구
    • 디지털콘텐츠학회 논문지
    • /
    • 제5권1호
    • /
    • pp.7-11
    • /
    • 2004
  • 차세대 고속 통신망을 구축하기 위해서는 해결해야 할 많은 문제들이 있는데, 이 중에서 기본적으로 고려해야 할 사항은 바로 망에 흐르는 트래픽의 특성 분석이다. 현재 제공되는 많은 인터넷 서비스들의 동작 특성은 자기 유사성(Self-similar)이라는 기존에 고려되던 트래픽 특성과는 완전히 다른 장기간 의존성의 성질들을 가진다는 것이 증명되었다 이러한 장기간 의존성 성질을 표현하기 위한 모델로는 자기유사 모델이 있는데, 이것은 단기간 의존성을 표현하는 기존의 모델인 포아송 모델과는 상반되는 개념이다. 따라서 차세대 통신망의 설계 및 디멘져닝을 위해서는 무엇보다도 데이터 트래픽의 주요 특성인 버스트성(Burstiness)과 자기유사성이 반영된 트래픽 모델이 요구된다. 여기서 자기유사성은 허스트 파라미터(Hurst Parameter)로 특성화 될 수 있다. 본 논문에서는 데이터 트래픽의 자기유사성 및 큐잉지연을 고려한 유효대역폭 산출식을 유도하여 시뮬레이션 결과와 비교 분석하였다.

  • PDF

점착성 유사의 침강속도, 크기, 밀도 측정 플랙탈 차원 분석 (Measurement of Settling Velocity, Size and Density and Analysis of Fractal Dimension of Cohesive sediment)

  • 손민우
    • 생태와환경
    • /
    • 제44권1호
    • /
    • pp.58-65
    • /
    • 2011
  • 본 연구는 간단한 실험실 실험을 통하여 점착성 유사의 덩어리인 플럭의 침강속도를 측정하고 이를 이용하여 플럭의 밀도와 프랙탈 차원을 결정하는 것이 목적이다. 이를 위하여 상업용 고해상도 카메라를 이용하여 플럭이 침강되는 모습을 촬영하였고, 이후 이미지 분석을 통해 플럭의 침강속도를 결정하였다. 본 연구를 통해 유기물의 많이 포함된 Lake Apopka 정착성 유사는 플럭의 크기와 침강속도가 비례하는 관계를 가지는 것에 비해 무기질인 카올리나이트는 반비례하거나 거의 상관성을 가지지 않는 것이 확인되었다. 플럭 밀도의 경우 Lake Apopka는 거의 일정한 데 비해 카올리나이트는 플럭의 크기 증가에 반비례하여 밀도가 감소하는 경향이 확인되었고 프랙탈 차원도 유사한 관계를 가지는 것으로 판단된다. Lake Apopka 점착성 유사와 카올리나이트 사이에서 나타나는 이러한 차이점은 유기물 함유에 따라 자기유사성올 가지는 프랙탈 구조체를 구성하는지 여부에 따른 것으로 이해된다. 즉 프랙탈 이론을 따르는 카올리나이트의 경우는 플럭의 크기가 증가하는 동시에 밀도가 감소하여 반비례 관계를 보이는 반면 Lake Apopka의 유기질 점착성 유사는 이러한 경향성을 띠지 않는 것으로 판단된다. 그리고 이 경향성에 따라 플럭의 크기가 증가함에 따라 밀도가 감소하는 카올리나이트의 침강속도에 비해 플럭의 크기 증가할 때 일정한 밀도가 유지되는 Lake Apopka의 점착성 유사가 침강속도와 플럭 크기 사이의 상관관계를 가지는 것으로 고려된다. 이러한 침강속도와 유사 크기 사이의 상관관계를 통해서 고령토 등의 무기질 점착성 유사가 지배적인 자연환경에서는 모래 등의 비점착성 유사의 경우와 다른 관점에서 침강속도를 고려하고 이 특성이 유사의 이송 및 확산에 미치는 영향을 판단할 필요가 있는 사실을 알 수 있다.

K-평균법을 이용한 고속도로 사고분석구간 분할기법 개발 (Selecting Technique of Accident Sections using K-mean Method)

  • 이기영;장명순
    • 한국도로학회논문집
    • /
    • 제7권4호
    • /
    • pp.211-219
    • /
    • 2005
  • 교통사고 분석구간 선정은 유사한 사고유형을 하나의 동일집단으로 처리함으로써 분석의 효율성을 높이고, 효과적인 개선 사업을 위해 그 순위를 결정하는데 필요한 작업이다. 기존에는 도로이정에 기초하여 균등하게 분할하는 방법을 주로 사용하여 왔는데 사고간의 유사성을 전혀 고려하지 못하는 단점이 있다. 따라서 최근 도로이정보다는 사고간의 유사성을 고려하여 구간을 선정하는 방식인 Slider length 적용기법이 사용되고 있다. 본 연구에서는 Slider length 적용기법의 한 방법론으로써, 군집분석에 사용되는 비계층적 분류기법인 K-평균법을 사용하여 가장 인근거리에 발생된 사고들이 최대한 하나의 집단으로 분류될 수 있는 기법을 제시하고자 한다. 또한 이의 검증을 위해 경부고속도로 부산방향으로 총연장 25.6km구간에 대하여 균일간격에 의한 분할방식과 K-평균법을 이용한 분할방식에 대해 상호 비교를 통해 그 효율성을 검토하였으며, K-평균법이 사고의 유사성이나 인접성을 감안하여 효율적으로 분석구간 선정에 적용될 수 있음을 검증하였다.

  • PDF