• Title/Summary/Keyword: 루머확산 모델

Search Result 3, Processing Time 0.017 seconds

COVID-19 Korean Fake News Detection using Named Entity and User Reproliferation Information (개체명 및 사용자 재확산 정보를 이용한 한국어 COVID-19 가짜 뉴스 검출)

  • Park, Chaewon;Kang, Jiwon;Lee, Daeun;Lee, Munyoung;Han, Jinyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.85-90
    • /
    • 2021
  • 코로나바이러스감염증-19로 인한 팬데믹 상황이 지속되면서 감염증 정보의 불확실성으로 인해 코로나 관련 루머가 온라인상에서 빠르게 전파되고 있다. 이러한 코로나 관련 가짜 뉴스를 사전에 탐지하기 위해, 본 연구에서는 한국어 코로나 가짜 뉴스 데이터셋을 구축하고, 개체명과 사용자 재확산 정보를 이용한 한국어 가짜 뉴스 탐지 모델을 제안한다. 가짜 뉴스 팩트체킹 언론인 서울대팩트체크센터에서 코로나 관련 루머 및 가짜 뉴스에 대한 검증 기사를 수집한 후, 기사로부터 개체명 추출 모델을 통해 주제 키워드를 추출하고, 이를 이용해 유튜브 상의 사용자 재확산 정보를 수집하여 데이터셋을 구성하였다. BERT 기반의 제안 모델을 다양한 비교군과 비교하였고, 특성 조합에 따른 실험을 통해 각 특성 정보(기사 텍스트, 개체명 데이터, 유튜브 데이터)가 가짜 뉴스 탐지 성능에 미치는 영향을 알아보았다.

  • PDF

Estimating the Rumor Source by Rumor Centrality Based Query in Networks (네트워크에서 루머 중심성 기반 질의를 통한 루머의 근원 추정)

  • Choi, Jaeyoung
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.8 no.7
    • /
    • pp.275-288
    • /
    • 2019
  • In this paper, we consider a rumor source inference problem when sufficiently many nodes heard the rumor in the network. This is an important problem because information spread in networks is fast in many real-world phenomena such as diffusion of a new technology, computer virus/spam infection in the internet, and tweeting and retweeting of popular topics and some of this information is harmful to other nodes. This problem has been much studied, where it has been shown that the detection probability cannot be beyond 31% even for regular trees if the number of infected nodes is sufficiently large. Motivated by this, we study the impact of query that is asking some additional question to the candidate nodes of the source and propose budget assignment algorithms of a query when the network administrator has a finite budget. We perform various simulations for the proposed method and obtain the detection probability that outperforms to the existing prior works.

A Study on Information Source Estimation under Diffusion Decaying Models (정보확산 감쇠모델에서 정보근원 추정방법 연구)

  • Choi, Jaeyoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.380-383
    • /
    • 2019
  • 인터넷의 급속한 발전은 네트워크를 통해 많은 정보를 흘러가도록 만들었다. 그 정보들 중에는 다른 시스템이나 사용자에게 루머나 바이러스와 같은 좋지 않은 정보를 포함하는 경우도 있는데, 이에 대비해서 이런 악성정보가 더 많이 퍼져나가지 않도록 다양한 보안방법들이 제안되었다. 본 논문에서는 이를 위해 정보를 처음 퍼뜨린 근원을 추정해 나가는 문제를 고려한다. 특히, 기존의 이 문제를 다룬 많은 연구에서와는 다르게 본 연구에서는 정보가 시간이 지남에 따라, 혹은 근원으로부터 멀어짐에 따라 그 전파력이 감쇠되는 여러 가지 정보확산 모델을 고려한 후, 각각의 모델에서 트리기반 추정법을 사용하여 정보의 근원을 얼마나 잘 탐지해 내는지에 대해 살펴본다.