Similarity Measurement System of Korean Documents Using the Specified Particles and High Frequency Words

특정 조사와 빈도수 높은 단어를 이용한 한글 논문의 유사도 측정 시스템 구현

  • Yoo, Seung-Hee (Dept. of Computer science and Engineering, Ewha Womans Univ.) ;
  • Han, So-Hee (Dept. of Computer science and Engineering, Ewha Womans Univ.) ;
  • Cho, Dong-Sub (Dept. of Computer science and Engineering, Ewha Womans Univ.)
  • 유승희 (이화여자대학교 컴퓨터정보통신학과) ;
  • 한소희 (이화여자대학교 컴퓨터정보통신학과) ;
  • 조동섭 (이화여자대학교 컴퓨터정보통신학과)
  • Published : 2007.07.18

Abstract

인터넷의 발달로 대량의 전자문서들을 손쉽게 구할 수 있는 정보의 바다라 불리는 현대사회에서 논문 표절은 심각한 문제를 안게 되었다. 표절여부를 검사하는 방법에는 여러 가지가 있지만 보다 정확하고 빠르게 검출할 수 있는 기법이 요구된다. 외국에서는 표절을 검사하기 위한 시스템적인 접근이 이루어지고 있지만 국내에서의 표절 검사에 대한 연구는 아직 초기 단계에 있다. 본 논문에서는 논문 표절 검사 시스템에 사용되는 기법 중 지문법을 바탕으로 하지만 기존의 단어, 문장 등을 사용하는 방법과 차별을 두어 몇몇 주요 단어와 특정 조사의 비교를 이용해 유사성을 측정하여 보다 빠르고 정확하게 검출할 수 있는 시스템을 구현해 보았다.

Keywords