• 제목/요약/키워드: 적응적 지역정렬

검색결과 6건 처리시간 0.023초

제한된 프로그램 소스 집합에서 표절 탐색을 위한 적응적 알고리즘 (An Adaptive Algorithm for Plagiarism Detection in a Controlled Program Source Set)

  • 지정훈;우균;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권12호
    • /
    • pp.1090-1102
    • /
    • 2006
  • 본 논문에서는 대학생들의 프로그래밍 과제물이나 프로그래밍 경진대회에 제출된 프로그램과 같이 동일한 기능을 요구받는 프로그램 소스 집합들에서 표절행위가 있었는지를 탐색하는 새로운 알고리즘을 제시하고 있다. 지금까지 보편적으로 사용되어 온 대표적인 알고리즘은 부분 스트링간의 완전 일치를 통한 Greedy-String-Tiling이나 두 스트링간의 지역정렬(local alignment)을 이용한 유사도 분석이 주된 방법론이었다. 본 논문에서는 해당 프로그램 소스의 집합에서 추출된 키워드들의 빈도수에 기반한 로그 확률값을 가중치로 하는 적응적(adaptive) 유사도 행렬을 만들어 이를 기반으로 주어진 프로그램의 유사구간을 탐색하는 새로운 방법을 소개한다. 우리는 10여개 이상의 프로그래밍 대회에서 제출된 실제 프로그램으로 본 방법론을 실험해 보았다. 실험결과 이 방법은 이전의 고정적 유사도 행렬(match이면 +1, mismatch이면 -1, gap이면 -2)에 의한 유사구간 탐색에 비하여 여러 장점이 있음을 알 수 있었으며, 제시한 적응적 유사도 행렬을 보다 다양한 표절탐색 목적으로 사용할 수 있음을 알 수 있었다.

제한된 프로그램 소스 집합에서 표절 탐색을 위한 적응적 알고리즘 (An Adaptive Algorithm for Plagiarism Detection in a Controlled Program Source Set)

  • 지정훈;우균;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.580-585
    • /
    • 2006
  • 본 논문에서는 대학생들의 프로그래밍 과제물이나 프로그래밍 경진대회에 제출된 프로그램과 같이 동일한 기능을 요구받는 프로그램 소스 집합들에서 표절 행위가 있었는지를 탐색하는 새로운 알고리즘을 제시한다. 본 논문에서는 프로그램의 소스 집합에서 추출된 키워드들의 빈도수에 기반한 로그 확률값을 가중치로 하는 적응적(adaptive) 유사도 행렬을 만들어 이를 기반으로 주어진 프로그램의 유사구간을 탐색하는 지역정렬(local alignment) 방법을 소개한다. 우리는 10여개 이상의 프로그래밍 대회에 제출된 실제 프로그램으로 본 방법론을 실험하였다. 실험결과 이 방법은 이전의 고정적 유사도 행렬(일치 +1, 불일치 -1, 갭(gap)을 이용한 일치 -2)에 의한 유사구간 탐색에 비하여 여러 장점이 있음을 알 수 있었으며, 보다 다양한 표절탐색 목적으로 제시한 적응적 유사도 행렬이 응용될 수 있음을 알 수 있었다.

  • PDF

바이트코드 분석을 이용한 자바 프로그램 표절검사기법 (A Plagiarism Detection Technique for Java Program Using Bytecode Analysis)

  • 지정훈;우균;조환규
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권7호
    • /
    • pp.442-451
    • /
    • 2008
  • 대부분의 표절검사 시스템들은 소스코드를 이용해 유사도를 계산하고 표절 프로그램을 찾아낸다. 소스코드를 이용하여 표절검사를 수행할 경우, 소스코드 보안문제가 발생할 수 있다. 목적 코드를 이용한 표절검사는 소스코드 보안문제에 대한 좋은 대안이 될 수 있다. 본 논문에서는 자바 프로그램의 표절검사에 대하여 소스코드 없이 바이트코드를 이용해 표절검사를 수행하는 방법을 제시한다. 바이트코드를 이용한 표절검사는 크게 두 단계로 진행된다 먼저, 자바 클래스 파일로부터 메소드의 코드영역을 분석해 토큰 시퀀스를 생성한 다음 적응적 지역정렬을 이용해 유사도를 계산한다. 실험 결과, 소스코드와 바이트코드의 유사도는 비슷한 분포를 보였다. 또한, 소스코드 쌍과 바이트코드 쌍의 유사도 상관관계가 충분히 높게 측정되었다. 본 논문에서 제안한 바이트코드 표절검사 시스템은 소스코드를 이용해 직접 표절을 검사하기 전 단계에서 1차적인 검증도구로 활용할 수 있다.

올리고뉴클레오타이드 제작을 위해 효율적이고 차별적인 시드를 고르는 방법에 대한 고찰 (A Study of Choosing Efficient Discriminative Seeds for Oligonucleotide Design)

  • 정원형;박성배
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제36권1호
    • /
    • pp.1-8
    • /
    • 2009
  • 생물정보분야에서 올리고뉴클레오타이드(oligonucleotide)를 제작하는 문제는 시간을 많이 소모하는 문제이다. 이 문제를 해결하기 위하여 해시를 이용한 가속계산이 주로 쓰이고 있고 BLAST란 프로그램이 대표적으로 생물정보분야에서 사용되고 있다. BLAST류의 프로그램들은 DNA서열의 특성에 따라 시드를 변형하여 해시를 개선하는 알고리즘을 적응하여 서열간의 유사도가 높은 부분을 찾는다. 그러나 이 프로그램들은 원래 올리고뉴클레오타이드 제작을 위해서가 아닌 지역정렬 문제를 해결하기 위한 방법들로써 발전하여 왔으므로 본 문제에 효율적인가에 대한 검증이 아직까지 이루어지지 않았다. 우리는 BLAST류의 프로그램에서 사용된 시드(seed)들이 올리고뉴클레오타이드 제작에 효과적인가를 판단할 수 있는 효율적이고 차별적인 잣대를 제시하고 이에 따라 다섯 종류의 대표적인 시드를 평가하였다. 평가에서 spaced seed라는 시드가 가장 좋은 결과를 보임을 정량적으로 계산할 수 있었다.

컬러이미지 대상 고용량 적응형 LSB 스테가노그라피 (Adaptive LSB Steganography for High Capacity in Spatial Color Images)

  • 이혜영
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제24권1호
    • /
    • pp.27-33
    • /
    • 2018
  • 본 논문은 컬러 이미지대상 고용량 데이터 은닉을 위한 새로운 적응형 least-significant-bit(LSB) 스테가노그라피 알고리즘을 제시한다. 은닉할 데이터 비트와 교체하기 위한 컬러 이미지 픽셀의 빨강, 초록, 파랑 (RGB) 컴포넌트의 LSB 비트 수는 peak signal noise ratio (PSNR) 최저값 분석을 통해 결정하였다. 은닉 데이터의 70%는 픽셀의 두 색상 컴포넌트 LSB 3비트를, 나머지 컴포넌트 LSB 2 비트를 교체하고, 30%는 모든 RGB 컴포넌트 LSB 4비트를 교체하는 조합을 제안한다. 또한, 데이터를 은닉할 에지영역 픽셀 선택을 위하여 지역적인 정렬방법도 제안한다. 본 방법은 픽셀 당 9.2 비트(9.2bpp)의 고용량 은닉이 가능하다. 30K - 60K바이트 데이터 은닉 실험결과 512x512 컬러 이미지의 평균 PSNR값은 43.9db이고 자연스러운 히스토그램도 도출되었다.

금강 하구에서의 화학적, 생물학적 제과정에 관한 연구 II. Chlorlphyll-a 분포 결정 요인에 관하여 (Studies on Chemical and Biological Processes in the Keum River Estuary, Korea 2. Factors controlling chlorophyll-a distribution)

  • 기준학;김정렬
    • 한국해양학회지
    • /
    • 제22권3호
    • /
    • pp.207-215
    • /
    • 1987
  • 금강 하구(Keum River Estuary)에서의 chlorophyll-a의 분포를 규제하는 제 과정등을 이해하기 위하여, 1986년 4월과 7월 두차례에 걸쳐 현장 조사를 실시하고, chlorophyll-a, 영양염, ph, SPM, 용존산소, 수온, 염분 등의 분포 양상을 조사하였 다 갈수기인 4월은 방조제에서 약 35km 상류의 강경까지 염수의 침입이 있었으나, 풍수기였던 7월은 약 3km 상류역까지만 염수의 영향이 관측되었다. 4월의 경우 전 강하구 (estuary)에 걸쳐 평균 $500m{\ell}/{\ell}$이상의 높은 SPM분포를 보인 반면, 7월은 증가된 담수의 영향으로 SPM의 농도가 평균 $10m{\ell}/{\ell}$정도 밖에 이르지 않았다. chlorophyll-a의 분포는 시기, 위치에 따라 많은 변화를 보여, 7월의 경우 4월에 비 하여 매우 높은 chlorophyll-a의 분포를 보였으며, 두 시기 모두 담수-해수 경계역 에서 급격한 감소를 보였다. (4월 평균:담수역 $6.5\mu\textrm{g}/{\ell}$, 강하구 $1.4{\;}\mu\textrm{g}/{\ell}$; 7월 평균: 담수역 $35{\;}\mu\textrm{g}/{\ell}E, 강후구 $6.8\mu\textrm{g}/{\ell}$). 영양염이 항상 충분히 존재하는 금강 하구에 있 어서, 두 시기간의 chlorophyll-a농도에 큰 차이를 보인 것은, 주로 SPM 농도의 현 격한 차이에 의한 빛 에너지 효용성의 차이에 기인된 것으로 생각된다. 담수-해수 경계지역에서의 chlorophyll-a의 급격한 감소는, 주로 ionic strength의 증가로 야기 된 삼투압의 변화에 적응하지 못한 식물 plankton들의 대소멸(mass mortality)에 기인된 현상으로 생각된다. 초기혼합지역에서 AOU, ammonia의 증가를 보인 4월, ph의 급격한 감소를 보인 4월 및 7월의 자료들은, 식물 plankton의 죽음으로 인하여 공급된 유기물들의 분해과정을 통하여 나타날 수 있는 현상들로서, 위의 결론을 뒷 받침하여 주고 있다.

  • PDF