• 제목/요약/키워드: clone detection

검색결과 58건 처리시간 0.028초

Domain Analysis of Device Drivers Using Code Clone Detection Method

  • Ma, Yu-Seung;Woo, Duk-Kyun
    • ETRI Journal
    • /
    • 제30권3호
    • /
    • pp.394-402
    • /
    • 2008
  • Domain analysis is the process of analyzing related software systems in a domain to find their common and variable parts. In the case of device drivers, they are highly suitable for domain analysis because device drivers of the same domain are implemented similarly for each device and each system that they support. Considering this characteristic, this paper introduces a new approach to the domain analysis of device drivers. Our method uses a code clone detection technique to extract similarity among device drivers of the same domain. To examine the applicability of our method, we investigated whole device drivers of a Linux source. Results showed that many reusable similar codes can be discerned by the code clone detection method. We also investigated if our method is applicable to other kernel sources. However, the results show that the code clone detection method is not useful for the domain analysis of all kernel sources. That is, the applicability of the code clone detection method to domain analysis is a peculiar feature of device drivers.

  • PDF

Tree-Pattern-Based Clone Detection with High Precision and Recall

  • Lee, Hyo-Sub;Choi, Myung-Ryul;Doh, Kyung-Goo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.1932-1950
    • /
    • 2018
  • The paper proposes a code-clone detection method that gives the highest possible precision and recall, without giving much attention to efficiency and scalability. The goal is to automatically create a reliable reference corpus that can be used as a basis for evaluating the precision and recall of clone detection tools. The algorithm takes an abstract-syntax-tree representation of source code and thoroughly examines every possible pair of all duplicate tree patterns in the tree, while avoiding unnecessary and duplicated comparisons wherever possible. The largest possible duplicate patterns are then collected in the set of pattern clusters that are used to identify code clones. The method is implemented and evaluated for a standard set of open-source Java applications. The experimental result shows very high precision and recall. False-negative clones missed by our method are all non-contiguous clones. Finally, the concept of neighbor patterns, which can be used to improve recall by detecting non-contiguous clones and intertwined clones, is proposed.

항만 물류 환경에서의 복제된 CSD 탐지를 위한 정책 기반 복제 탐지 매커니즘 (Policy Based Cloned CSD Detection Mechanism in Logistics)

  • 황아름;서화정;김호원
    • 한국정보통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.98-106
    • /
    • 2012
  • 컨테이너 보안 장치(CSD)는 컨테이너의 문 안에 장착되어 센서를 통해 컨테이너의 문이 비정상적으로 열리는 것을 탐지하는 장치다. 이러한 CSD 장치는 컨테이너의 보안성을 제공하는 장치이기 때문에 도청이나 위조와 같은 공격에 안전해야할 뿐만 아니라 복제 되어서도 안된다. 만약 복제된 CSD를 탐지할 수 없다면, CSD는 공격자에 의해 불법적으로 복제되어 정상적인 목적과는 다른 용도로 사용되어 질 수 있다. 본 논문에서는 이러한 복제된 CSD를 탐지하기 위한 정책 기반 복제 탐지 메커니즘을 제안한다. 또한 실제 구현 결과를 통해 제안하는 기법을 검증 및 평가한다.

트리 기반 컨볼루션 신경망을 이용한 BigCloneBench 개선 (Improvement of BigCloneBench Using Tree-Based Convolutional Neural Network)

  • 박건우;홍성문;김현하;도경구
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제15권1호
    • /
    • pp.43-53
    • /
    • 2019
  • 기계 학습을 이용하여 의미가 유사한 코드 클론을 탐지하는 도구의 성능 평가에 빅클론벤치를 많이 활용한다. 하지만 빅클론벤치는 기계 학습에 최적화된 벤치마크가 아니기 때문에 그대로 기계 학습에 사용하면 잘못된 학습 데이터가 만들어질 수 있다. 본 연구에서는 빅클론벤치에서 제공하고 있는 코드 클론 데이터에서 누락된 타입-4 클론을 기계 학습을 이용하여 추가로 찾아 보완함으로써 빅클론벤치를 개선할 수 있음을 실험적으로 밝힌다. 트리 기반 컨볼루션 신경망을 이용한 기계 학습 모델을 사용해서 개선된 데이터를 학습했을 때, 기존의 데이터를 학습했을 때에 비해 기계 학습의 정확도 및 성능이 향상되었음을 확인하였다.

코드클론 표본 집합체 자동 생성기 (Automatic Generation of Code-clone Reference Corpus)

  • 이효섭;도경구
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제7권1호
    • /
    • pp.29-39
    • /
    • 2011
  • 프로그램 내의 코드클론을 찾아주는 도구나 기술들을 평가하기 위해서는 해당 도구가 탐지하는 못하는 클론이 있는지 확인해야 한다. 이를 위해서 샘플 소스코드에 대해서 코드클론을 모두 모아놓은 표준 표본 집합체가 필요하다. 그런데 기존의 코드클론 표본 집합체는 여러 클론탐지 도구의 결과들을 참조해 수작업으로 구축하지만 평가 기준으로 사용하기에는 빠져있는 표본이 많다. 본 연구에서는 자동으로 코드클론 표본 집합체를 생성하는 방법을 제안하고 도구를 구현하였다. 이 도구는 프로그램 소스를 핵심구문트리로 변환한 뒤, 트리를 샅샅이 비교하여 클론 패턴을 찾아낸다. 본 도구는 오탐이 없으며, 특정한 패턴을 제외하고 미탐도 없어서 코드클론 표본 집합체를 자동으로 생성하기 적합하다. 실험결과 상용도구인 CloneDR에서 찾아낸 클론을 모두 포함하면서 2-3배 더 많은 클론들을 찾아내었고, Bellon의 기존 표본 집합체의 클론들을 거의 대부분 포함(93-100%)하면서 자동 구축한 표본 집합체의 크기가 훨씬 크다.

공통 토큰에 기반한 서로 다른 언어의 유사성 검사 (Cross-Language Clone Detection based on Common Token)

  • 홍성문;김현하;이제형;박성우;모지환;도경구
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제14권2호
    • /
    • pp.35-44
    • /
    • 2018
  • 서로 다른 언어로 작성된 소스코드의 유사성 검사는 주로 요약구문트리를 기반으로 비교를 수행한다. 하지만 대규모의 소스코드를 실용적인 수준으로 비교하려면 토큰수준 기반에서 작동하는 유사성 검사 기술이 필요하다. 본 연구에서는 서로 다른 언어에서 생성되었지만 같은 의미를 지닌 토큰을 표현할 수 있는 공통 토큰을 정의하고, 소스코드에서 언어별 처리 과정을 거쳐 생성한 공통 토큰의 나열을 입력으로 소스코드의 유사성 검사를 수행하는 방법을 제안한다. 한국저작권위원회의 표절검사 도구 exEyes를 사용해서 서로 다른 언어로 작성된 동일한 코드를 대상으로 실험한 결과, 제안한 방법을 사용했을 때, 유사성 평가 성능이 향상됨을 보였다.

면역화학적 방법에 의한 Acetobacter turbidans의 $\alpha$-Acylamino-$\beta$-lactam Acylhydrolase의 유전자 클론화 (Molecular Cloning of the Gene for $\alpha$-Acylamino-$\beta$-lactam Acylhydrolase from Acetobacter turbidans by Immunochemical Detection Method)

  • Nam, Doo-Hyun;Dewey D.Y. Ryu
    • 한국미생물·생명공학회지
    • /
    • 제16권5호
    • /
    • pp.363-368
    • /
    • 1988
  • 반합성 베타 락탐 항생물질의 가수분해 및 합성을 촉매하는 효소인 $\alpha$-acylamino-$\beta$-lactam acylhydrolase(ALAH)의 유전자를 Acetobacfer turbidans로부터 클론화하기 위한 연구를 수행하였다. 우선 순수 분리 정제된 효소에 대한 항혈청 (폴리클론 항체)을 제조한 다음 이를 probe로 하여 면역화학적 방법으로 유전자의 선별을 시도하였다. 이러한 용도로 개발된 운반체인 λ gtll에다 A. turbidans의 유전자 단편들을 삽입하여 genomic library를 제조한 후 이 library에서 유전자를 선별한 결과 두개의 positive clone을 얻을 수 있었다. 그러나. 이 두 clone들은 면역화학적으로 서로 다른 반응을 나타내었는데, 그 중 하나는 효소의 항혈청과는 잘 결합하나 융합되어진 베타 갈락토시다아제에 대한 항체와는 잘 결합하지 못하였고(λ gtll dn1), 또 다른 clone 은 이와 반대의 양상을 보여주었다(λ gtll dn2). 더구나 이들 clone을 여러 제한효소들로 분석해본 결과, 유전자가 삽입된 부분인 Eco RI 부위중 하나가 없어진 것을 알 수 있었다. 따라서 A. turbidans의 효소에 대한 유전자가 λ gtll에 클론화 되었으나 이 유전자와 베타 갈락토시다아제의 유전자(lacZ)간에 염기배열상 동위성이 있은 부위가 존재하여 재조합된 λ gtll 파지의 복제과정에서 삭제되어진 것으로 간주되어진다.

  • PDF

Lifetime Escalation and Clone Detection in Wireless Sensor Networks using Snowball Endurance Algorithm(SBEA)

  • Sathya, V.;Kannan, Dr. S.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권4호
    • /
    • pp.1224-1248
    • /
    • 2022
  • In various sensor network applications, such as climate observation organizations, sensor nodes need to collect information from time to time and pass it on to the recipient of information through multiple bounces. According to field tests, this information corresponds to most of the energy use of the sensor hub. Decreasing the measurement of information transmission in sensor networks becomes an important issue.Compression sensing (CS) can reduce the amount of information delivered to the network and reduce traffic load. However, the total number of classification of information delivered using pure CS is still enormous. The hybrid technique for utilizing CS was proposed to diminish the quantity of transmissions in sensor networks.Further the energy productivity is a test task for the sensor nodes. However, in previous studies, a clustering approach using hybrid CS for a sensor network and an explanatory model was used to investigate the relationship between beam size and number of transmissions of hybrid CS technology. It uses efficient data integration techniques for large networks, but leads to clone attacks or attacks. Here, a new algorithm called SBEA (Snowball Endurance Algorithm) was proposed and tested with a bow. Thus, you can extend the battery life of your WSN by running effective copy detection. Often, multiple nodes, called observers, are selected to verify the reliability of the nodes within the network. Personal data from the source centre (e.g. personality and geographical data) is provided to the observer at the optional witness stage. The trust and reputation system is used to find the reliability of data aggregation across the cluster head and cluster nodes. It is also possible to obtain a mechanism to perform sleep and standby procedures to improve the life of the sensor node. The sniffers have been implemented to monitor the energy of the sensor nodes periodically in the sink. The proposed algorithm SBEA (Snowball Endurance Algorithm) is a combination of ERCD protocol and a combined mobility and routing algorithm that can identify the cluster head and adjacent cluster head nodes.This algorithm is used to yield the network life time and the performance of the sensor nodes can be increased.

복제를 통한 우수한 암탐지 능력의 보존 (Preservation through Cloning of Superior Canine Scent Detection Ability for Cancer Screening)

  • 김민정;박정은;오현주;홍소군;강정택;임상현;이동원;라정찬;이병천
    • 한국임상수의학회지
    • /
    • 제32권4호
    • /
    • pp.352-355
    • /
    • 2015
  • 본 연구는 암탐지에 우수한 능력을 보유하고 있는 공여견의 냄새 탐지 능력이 복제를 통하여 보존될 수 있을지를 알아보기 위하여 설계되었다. 직장암 탐지에 특화되어 훈련된 개를 복제하였고, 복제된 개는 환자와 건강한 지원자들로부터 채취된 호흡 샘플을 사용하여 유방암을 탐지하도록 훈련 되었다. 복제개의 암탐지 민감도는 93.3%, 특이도는 99.5%로 공여견의 암탐지 민감도 및 특이도 (91% 및 99%)와 유사하였다. 게다가 복제개는 유방암의 초기 단계까지 성공적으로 탐지할 수 있었다. 따라서 우수한 암탐지 능력은 복제를 통해서 보존될 수 있을 것이다.

Microbial Floral Dynamics of Chinese Traditional Soybean Paste (Doujiang) and Commercial Soybean Paste

  • Gao, Xiuzhi;Liu, Hui;Yi, Xinxin;Liu, Yiqian;Wang, Xiaodong;Xu, Wensheng;Tong, Qigen;Cui, Zongjun
    • Journal of Microbiology and Biotechnology
    • /
    • 제23권12호
    • /
    • pp.1717-1725
    • /
    • 2013
  • Traditional soybean paste from Shandong Liangshan and Tianyuan Jiangyuan commercial soybean paste were chosen for analysis and comparison of their bacterial and fungal dynamics using denaturing gel gradient electrophoresis and 16S rRNA gene clone libraries. The bacterial diversity results showed that more than 20 types of bacteria were present in traditional Shandong soybean paste during its fermentation process, whereas only six types of bacteria were present in the commercial soybean paste. The predominant bacteria in the Shandong soybean paste were most closely related to Leuconostoc spp., an uncultured bacterium, Lactococcus lactis, Bacillus licheniformis, Bacillus spp., and Citrobacter freundii. The predominant bacteria in the Tianyuan Jiangyuan soybean paste were most closely related to an uncultured bacterium, Bacillus licheniformis, and an uncultured Leuconostoc spp. The fungal diversity results showed that 10 types of fungi were present in the Shandong soybean paste during the fermentation process, with the predominant fungi being most closely related to Geotrichum spp., an uncultured fungal clone, Aspergillus oryzae, and yeast species. The predominant fungus in the commercial soybean paste was Aspergillus oryzae.