DOI QR코드

DOI QR Code

Sentence-BERT를 활용한 YouTube 가짜뉴스 탐지 시스템 연구

A Study On YouTube Fake News Detection System Using Sentence-BERT

  • 김범중 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
  • 허지혜 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
  • 이협건 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과) ;
  • 김영운 (한국폴리텍대학교 서울강서캠퍼스 빅데이터과)
  • Beom Jung Kim (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
  • Ji Hye Huh (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
  • Hyeopgeon Lee (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College) ;
  • Young Woon Kim (Department of Big Data, Seoul Gangseo Campus of Korea Polytechnics College)
  • 발행 : 2023.11.02

초록

IT 기술의 발달로 인해 뉴스를 제공하는 플랫폼들이 다양해 졌고 최근 해외 인터뷰 영상, 해외 뉴스를 Youtube Shorts형태로 제작하여 화자의 의도와는 다른 자막을 달며 가짜 뉴스가 생성되는 문제가 대두되고 있다. 이에 본 논문에서는 Sentence-BERT를 활용한 YouTube 가짜 뉴스 탐지 시스템을 제안한다. 제안하는 시스템은 Python 라이브러리를 사용해 유튜브 영상에서 음성과 영상 데이터를 분류하고 분류된 영상 데이터는 EasyOCR을 사용해 자막 데이터를 텍스트로 추출 후 Sentence-BERT를 활용해 문자 유사도를 분석한다. 분석결과 음성 데이터와 영상 자막 데이터가 일치한 경우 일치하지 않은 경우보다 약 62% 더 높은 문장 유사도를 보였다.

키워드