Program Plagiarism Detection Using Parse Tree Kernels

Parse Tree Kernel을 이용한 소스코드 표절 검출

  • Son Jeong-Woo (Dept of Computer Engineering, Kyungpook National University) ;
  • Park Seong-Bae (Dept of Computer Engineering, Kyungpook National University) ;
  • Lee Sang-Jo (Dept of Computer Engineering, Kyungpook National University) ;
  • Park Se-Young (Dept of Computer Engineering, Kyungpook National University)
  • 손정우 (경북대학교 컴퓨터공학과) ;
  • 박성배 (경북대학교 컴퓨터공학과) ;
  • 이상조 (경북대학교 컴퓨터공학과) ;
  • 박세영 (경북대학교 컴퓨터공학과)
  • Published : 2006.06.01

Abstract

표절이란 원작자의 허락 없이 저작물의 일부분 혹은 전체를 사용하는 것이다. 이는 특히 대학의 프로그래밍 코스에서 심각한 문제가 된다. 이를 해결하기 위해 많은 표절 검출 시스템이 연구되어 왔으나 복사된 소스코드에 필요 없는 코드를 첨가할 경우, 성능이 낮아지는 문제가 있었다. 이 문제는 기존 시스템이 소스코드의 구조적인 정보를 효율적으로 다루지 않았기 때문이다. 본 논문에서는 Parse Tree Kernels를 이용한 소스 코드 표절 검출 시스템을 제안한다. 제안한 시스템은 Parse Tree Kernels를 이용하여 소스코드의 구조적 정보를 효과적으로 다룬다. 이를 보이기 위한 실험에서는 기존의 표절 검출 시스템인 SID, JPlag와 비교하여 제안한 시스템이 소스 코드의 구조적 정보를 기존 시스템에 비해 효율적으로 이용하고 있음을 보였다.

Keywords