• 제목/요약/키워드: 표절

검색결과 166건 처리시간 0.024초

한글 말뭉치를 이용한 한글 표절 탐색 모델 개발 (Developing of Text Plagiarism Detection Model using Korean Corpus Data)

  • 류창건;김형준;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권2호
    • /
    • pp.231-235
    • /
    • 2008
  • 최근 들어 각종 창작물에 대한 표절 사건이 빈번하게 발생하고 있다. 특히 문서들 간의 표절은 현재 많은 이슈가 되고 있다. 영어에 관한 표절연구는 서양에서 오래전부터 이뤄져 왔지만 한글은 구조적인 어려움으로 인해 아직 많은 연구가 이뤄지지 않고 있다. 한글은 영어와 구조적인 특징이 많이 다르기 때문에 영어기반의 탐색 기법을 한글 문서에 적용하기는 어렵다. 본 논문에서는 한글의 특성에 맞는 새로운 표절 탐색 기법을 소개하고 한글 말뭉치를 이용하여 그 성능을 실험해본다. 제안된 기법은 "k-mer"와 "지역정렬" 방법을 기반으로, 문서들 간의 표절구간을 매우 빠르고 정확하게 찾아낸다. 또한 우리는 천만어절 이상의 크기를 가진 한글 말뭉치를 이용하여 표절이 일어나지 않은 일반적인 문서에서 우연히 나타나게 될 유사 확률에 관한 모형을 만들었다. 시스템을 이용하여 성능을 측정해 본 결과, 표절 문서를 매우 정확하게 찾는 것을 알 수 있었다.

한국 애니메이션의 표절요인과 유형분석 (An analysis on the factor and types of plagiarism of Korean animation)

  • 이현석
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.327-335
    • /
    • 2019
  • 1970년대는 많은 애니메이션 영화가 활발히 제작되었던 한국 애니메이션의 전성기라 불린다. 하지만, 당시 해외 애니메이션의 수입 방영과 해외 제작사의 하청작업 또한 많았으며, 자체 제작된 많은 애니메이션이 해외 원작을 모방하였다는 표절 논란이 꾸준히 제기되고 있다. 특히, 일본 애니메이션의 캐릭터 디자인에 대한 도용이 여전히 많은 애니메이션 마니아로부터 비판받고 있는 실정이다. 이에, 본 논문은 1970년대와 1980년대 한국 애니메이션 중 표절이 의심되는 작품을 중심으로 그 요인과 유형에 대해 분석하는 것을 목적으로 한다. 이를 위한 연구의 전개는 첫째, 예술창작에 있어서 표절의 정의 및 구성요건에 대해 문헌을 중심으로 고찰하고, 둘째, 1970년에서 1980년대 까지 표절애니메이션의 요인에 대해 정치 이념, 산업 정책, 제작 구조, 저작권 인식 측면을 중심으로 살펴본다. 셋째, 당시 제작된 한국 애니메이션 중 28편을 대상으로 캐릭터의 형상과 색상을 중심으로 한 여섯 가지 항목으로 디자인의 도용과 표절의 정도에 대해 전문가 설문을 통한 사례비교 분석을 진행한다. 한국 애니메이션의 표절에 대한 사회 문화 산업적 요인과 그 유형을 종합적으로 분석한 본 연구는 한국 애니메이션에 대한 성찰적 관점을 제시하는 연구로 그 학술적 가치가 있으리라 사료된다.

문장 및 어절 유사도를 이용한 표절 탐지 시스템 구현 (Implementation of A Plagiarism Detecting System with Sentence and Syntactic Word Similarities)

  • 맹주수;박지수;손진곤
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권3호
    • /
    • pp.109-114
    • /
    • 2019
  • 기존 표절 탐지 시스템은 형태소 분석을 기반으로 공통 단어의 빈도수를 이용해 문서의 유사도를 측정한다. 그러나 주제가 같아 유사 단어가 많이 쓰인 경우, 문장 단위로 일부만 발췌 표절한 경우, 그리고 조사와 어미의 유사성이 있는 경우는 공통 단어의 빈도수만으로는 정확한 유사도를 측정하는데 한계가 있다. 따라서 본 논문에서는 공통 단어 빈도수 기반의 유사도 측정 외에 문장 유사도와 어절 유사도를 추가적으로 측정해 유사도의 정확성을 높일 수 있는 표절 탐지 시스템을 설계하고 구현하였다. 실험 결과, 문장 유사도를 측정함으로써 문장 단위로 표절이 이루어진 경우를 발견할 수 있었고, 어절 유사도를 추가로 측정함으로써 부분표절이 일어난 경우라도 조사나 어미까지 그대로 사용한 표절의 경우 등을 발견할 수 있었다.

디지털저작물 저작권보호시스템 (A Study on Systems to Protect Copyright of Digital Contents)

  • 김용;남궁황
    • 한국비블리아학회지
    • /
    • 제11권2호
    • /
    • pp.49-64
    • /
    • 2000
  • 디지털기술의 급속한 발전으로 인해 현재 대부분의 문서가 디지털화된 형태를 이루고 있으며 이러한 정보는 지속적으로 증가하고 있는 상황이다. 웹 및 문서저작도구의 발전과 함께, 정보의 생성과 공유가 쉬워지면서 중복적으로 존재하는 정보의 비율이 갈수록 높아지고 있으며 일부를 표절하여 자신의 정보로 사용하는 문서의 불법적인 복제문제가 발생할 수 있다. 현재 온라인 상에서 제공되고 있는 수많은 정보는 그것을 접하는 사용자들에게 유용하게 사용될 수도 있지만 불법복제 (illegal copy)나 표절(plagiarism)과 같은 형태로 이용될 수 있는 가능성도 높다. 두 경우에 있어서 원문의 부분 또는 전체를 그대로 사용하는 경우가 있으며, 특히, 표절의 경우에 있어서는 문장의 재구성, 유사단어로 대체하는 것처럼 원문과는 다른 형태로 나타날 수 있다. 그러나 표절에 있어서 엄청난 양의 정보중에서 일부를 표절한 사실을 알아내기란 쉽지가 않다 왜냐하면 표절을 판별하기 위해서는 기존에 존재하는 모든 정보를 알고 있어야 하는데 이것은 이론상으로 사람의 힘으로는 불가능하기 때문이다. 또한 저작자의 동의 없이 이루어지는 불법적인 복제는 디지털콘텐츠의 유통을 위한 커다란 걸림돌이 되고 있다. 따라서 기존의 문서와의 유사성 판별을 통해서 자동적으로 표절의 가능성을 제시해 줄 수 있는 기술과 함께 근본적으로 디지털 저작물에 대한 불법적인 복제를 막을 수 있는 방법이 필요하다.

  • PDF

부분표절구간 검출을 위한 질의문서의 분할 및 탐색 기법 (A Fragmentation and Search Method of Query Document for Partially Plagiarized Section Detection)

  • 옥창석;서종규;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.586-589
    • /
    • 2012
  • 표절과 관련된 이슈가 주목받고 있는 상황에서 표절을 검출하는 방법에 대한 연구가 활발히 진행되고 있다. 일반적으로 표절구간 검출을 위해 복잡한 자연어처리와 같은 의미론적 접근방법이 아닌 비교적 단순한 어휘기반의 문자열 처리 방법을 사용한다. 대표적인 방법으로는 지문법 (Fingerprinting)과 서열정렬 (Sequence alignment) 등이 있다. 하지만 이 방법들을 이용하여 대용량 문서에 대한 표절검사를 수행하기에는 시공간적 복잡도의 문제가 발생한다. 본 논문에서는 이러한 단점을 극복하기 위해 NGS (Next Generation Sequencing)에서 사용하는 BWT (Burrows-Wheeler Transform)[1]를 이용한 탐색방법을 응용한다. 또한 부분표절구간을 검출하고 정확도를 향상시키기 위해 질의문서를 분할하여 작은 조각으로 만든 뒤, 조각들에 대한 질의탐색을 수행한다. 본 논문에서는 질의문서를 분할하는 두 가지 방법을 소개한다. 두 가지 방법은 k-mer analysis를 이용한 방법과 random-split analysis를 이용한 방법으로, 각 방법의 장단점을 실험을 통해 분석하고 실제 부분표절구간의 검출 정확도를 측정하였다.

웹 검색과 문서 유사도를 활용한 2 단계 신문 기사 표절 탐지 시스템 (A Two Phases Plagiarism Detection System for the Newspaper Articles by using a Web Search and a Document Similarity Estimation)

  • 조정현;정현기;김유섭
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.181-194
    • /
    • 2009
  • 최근 문서 저작권에 대한 관심과 중요도가 높아지고 있어 문서 표절에 관한 연구가 지속적으로 이루어지고 있다. 이러한 표절 문제는 신문기사의 경우에서도 큰 관심을 끌고 있는데, 이는 상업적 가치가 큰 기사의 표절 또는 무단도용 문제가 적지 않게 발생하고 있기 때문이다. 현재까지의 문서 표절 관련 연구는 실시간 특성이 매우 강한 신문 기사의 표절 문제에 적용하기 어려웠다. 따라서 현재는 이러한 표절 기사를 가려내기 위해 수백 개의 신문사에서 하루 수천 건씩 올라오는 기사들을 눈으로 일일이 가려내는 상황이다. 본 논문에서는 이러한 시간과 비용의 문제를 줄이기 위해 네이버와 다음에서 제공하는 웹 검색 OpenAPI를 활용해 표절 가능성이 있는 기사들을 1차적으로 선별한 다음, 선별된 기사들과 원본 기사와의 문서 유사도를 측정하여 선별된 기사들의 표절 여부를 자동으로 판정할 수 있도록 하였다. 본 연구에서는 실험을 위하여 연합뉴스에서 제공되는 기사를 원본 기사로 활용하였고, 표절 가능성이 있는 기사는 네이버 및 다음의 뉴스 서비스에서 제공되는 모든 기사 중에서 선별하도록 하였다.

문화콘텐츠의 저작권 보호를 위한 표절 및 위작 감정 지원 시스템의 개발 (Development of Plagiarism Inspection Supporting System for Protecting Culture Contents Properties)

  • 조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.641-644
    • /
    • 2004
  • 본 논문에서는 각종 문화콘텐츠의 진위와 표절을 검출하는 방법론에 대해 제안하고자 한다. 이를 위해 기존의 문화콘텐츠에 대한 표절과 위작 감정이 어떤 방법으로 되어 왔는가에 대해 살펴보고 본 방법과의 비교,고찰을 행하고자 한다. 실험 대상은 우선적으로 미술품등에 대해 수행하였으며 이를 토대로 개발하고 있는 시스템이 표절 감정 및 위작 감정에 유용하게 도움을 줄수 있는 방법임을 밝히고자 한다. 끝으로 현재까지 실험이 수행된 부분에 대해 서 실험 결과를 제시하고자 한다.

  • PDF

스마트 환경에서 대학생들의 표절과 저작권 침해 실태 및 대응 방안 (Plagiarism and Copyright Infringement Status and Countermeasures of Undergraduate Students in Smart Environments)

  • 김태희;강문설
    • 한국정보통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.2180-2188
    • /
    • 2015
  • 타인의 저작물 일부 또는 전부를 마치 자기의 창작물인 것처럼 몰래 사용하는 표절과 스마트 환경에서 다양한 형태로 발생하고 있는 저작권 침해 행위는 우리나라가 문화 선진국으로 도약하기 위해 최우선적으로 해결해야 할 과제로 부상하고 있다. 본 논문에서는 스마트 환경에서 다양한 스마트 기기들을 가장 많이 이용하고 있는 대학생들을 대상으로 표절과 저작권 침해 실태를 조사하여 분석하고, 표절과 저작권 침해를 예방하기 위한 기본적인 교육 방안을 고찰하였다. 대학생들의 표절과 저작권에 대한 인식이 매우 낮고, 초중등학교를 거쳐 대학생활을 하는 과정에서 진행되어 온 표절과 저작권 침해 실태도 매우 심각한 것으로 나타났다. 이러한 문제를 해결하기 위해 본 논문에서 제안한 대응 방안을 통해 표절과 저작권 침해에 대한 인식의 개선과 각종 부작용의 예방이 가능할 것으로 확인되었다.

음악 표절 분석을 위한 디지털 음악 요소에 대한 연구 (A Study of Digital Music Element for Music Plagiarism Analysis)

  • 신미해;조진완;이혜승;김영철
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권8호
    • /
    • pp.43-52
    • /
    • 2013
  • 본 연구는 서로 다른 두 음원에 대한 표절 여부를 분석하기 위한 음악 요소에 대해서 연구한다. 따라서 본 연구에서는 먼저 음원 분석을 위해서 디지털 음악 요소에 대해서 알아보고, 이 음악 요소를 컴파일러 기법을 활용하여 어떻게 표절 분석에 이용할 것인지 살펴본다. 또한 복잡한 미디 음악 데이터를 간단하게 처리 할 수 있도록 지원하는 오픈소스 자바 API인 JFugue를 활용한다. 따라서 본 논문에서는 JFugue에서 지원하는 포맷인 뮤직스트링 (MusicString)을 이용하여 음악 표절 분석 시스템을 설계하고 음악 표절 분석을 효율적으로 처리하기 위하여 뮤직스트링 문법 처리 요소를 살펴보고 추상구문트리(AST)를 구축하는 하고자 한다. 따라서 본 논문은 지금까지 감성적이고 주관적으로 평가해왔던 두 음원의 표절 분석을 시스템적으로 구축하기 위한 첫걸음이 될 것이며, 이 연구가 잘 활용된다면 차후에 두 음원의 표절 여부를 시스템적으로 정형화할 수 있다는 점에 큰 의의를 둘 수 있다고 판단된다.

code2vec을 이용한 유사도 감정 도구의 성능 개선 (Enhancing the performance of code-clone detection tools using code2vec)

  • 엄태호;홍성문;양준혁;장효석;도경구
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권1호
    • /
    • pp.31-40
    • /
    • 2021
  • 소스코드 표절은 원본 자료의 출처를 분명히 밝히지 않고 자신의 것처럼 사용하는 행위를 말한다. 소스코드 표절로 인한 문제는 법적인 분쟁을 다투는 경우까지 다양한 문제를 일으킨다. 소스코드의 표절 여부는 일반적으로 비교 대상 소프트웨어 프로젝트 내의 각 소스코드를 전수 비교하여 유사도를 측정하여 결정한다. 전수 비교는 표절 가능성이 전혀 없는 코드도 비교 대상에 포함하기 때문에 그만큼의 시간을 헛되이 소모한다. 소스코드 표절로 의심되는 비교 쌍만 선별하여 비교할 수 있으면 그만큼 비교 횟수는 줄어들게 되어 탐지 도구의 실행 속도를 향상시킬 수 있을 뿐만 아니라, 표절 가능성이 높은 부분만을 대상으로 탐지의 정확도를 높이는데 집중할 수도 있다. 본 논문에서는 code2vec 이라는 기계학습 모델을 활용하여 코드 클론으로 의심되는 소스코드들을 미리 분류하여 비교 횟수를 줄임으로써 소스코드 표절 탐지의 성능을 개선할 수 있음을 보인다.