DOI QR코드

DOI QR Code

A Study On YouTube Fake News Detection System Using Sentence-BERT

Sentence-BERT를 활용한 YouTube 가짜뉴스 탐지 시스템 연구

  • Beom Jung Kim (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
  • Ji Hye Huh (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
  • Hyeopgeon Lee (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
  • Young Woon Kim (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College)
  • 김범중 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
  • 허지혜 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
  • 이협건 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
  • 김영운 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과)
  • Published : 2023.11.02

Abstract

IT 기술의 발달로 인해 뉴스를 제공하는 플랫폼들이 다양해 졌고 최근 해외 인터뷰 영상, 해외 뉴스를 Youtube Shorts형태로 제작하여 화자의 의도와는 다른 자막을 달며 가짜 뉴스가 생성되는 문제가 대두되고 있다. 이에 본 논문에서는 Sentence-BERT를 활용한 YouTube 가짜 뉴스 탐지 시스템을 제안한다. 제안하는 시스템은 Python 라이브러리를 사용해 유튜브 영상에서 음성과 영상 데이터를 분류하고 분류된 영상 데이터는 EasyOCR을 사용해 자막 데이터를 텍스트로 추출 후 Sentence-BERT를 활용해 문자 유사도를 분석한다. 분석결과 음성 데이터와 영상 자막 데이터가 일치한 경우 일치하지 않은 경우보다 약 62% 더 높은 문장 유사도를 보였다.

Keywords