DOI QR코드

DOI QR Code

Analysis of public opinion in the 20th presidential election using YouTube data

유튜브 데이터를 활용한 20대 대선 여론분석

  • Kang, Eunkyung (Department of Big Data Analytics, Kyung Hee University) ;
  • Yang, Seonuk (Department of Big Data Analytics, Kyung Hee University) ;
  • Kwon, Jiyoon (Department of Big Data Analytics, Kyung Hee University) ;
  • Yang, Sung-Byung (Department of Business Administration/Big Data Analytics, Kyung Hee University)
  • 강은경 (경희대학교 일반대학원 빅데이터응용학과) ;
  • 양선욱 (경희대학교 일반대학원 빅데이터응용학과) ;
  • 권지윤 (경희대학교 일반대학원 빅데이터응용학과) ;
  • 양성병 (경희대학교 경영대학 경영학과 & 빅데이터응용학과)
  • Received : 2022.08.29
  • Accepted : 2022.09.13
  • Published : 2022.09.30

Abstract

Opinion polls have become a powerful means for election campaigns and one of the most important subjects in the media in that they predict the actual election results and influence people's voting behavior. However, the more active the polls, the more often they fail to properly reflect the voters' minds in measuring the effectiveness of election campaigns, such as repeatedly conducting polls on the likelihood of winning or support rather than verifying the pledges and policies of candidates. Even if the poor predictions of the election results of the polls have undermined the authority of the press, people cannot easily let go of their interest in polls because there is no clear alternative to answer the instinctive question of which candidate will ultimately win. In this regard, we attempt to retrospectively grasp public opinion on the 20th presidential election by applying the 'YouTube Analysis' function of Sometrend, which provides an environment for discovering insights through online big data. Through this study, it is confirmed that a result close to the actual public opinion (or opinion poll results) can be easily derived with simple YouTube data results, and a high-performance public opinion prediction model can be built.

여론조사는 유권자들의 투표행위를 예측하고, 그 행위에 영향을 준다는 점에서 선거운동의 강력한 수단이자, 언론의 가장 중요한 기사거리로 자리잡고 있다. 하지만, 여론조사가 활발할수록 후보자들의 공약과 정책을 검증하기 보다 당선 가능성이나 지지도에 관한 조사만 반복적으로 실시하는 등 선거 캠페인에 관한 효과 측정에서 유권자들의 마음을 제대로 반영하지 못하는 경우가 많다. 여론조사의 선거 결과에 대한 부실한 예측이 언론사의 권위를 실추시켰다 하더라도, 어느 후보가 최종 승리할지에 대해 인간의 본능적인 궁금증을 풀어줄 명백한 대안이 없기 때문에 사람들은 여론조사에 대한 관심을 쉽게 놓지 못한다. 이에, 온라인 빅데이터를 통해 인사이트를 발굴하는 환경을 제공하는 썸트렌드의 '유튜브 분석' 기능을 활용하여 20대 대선에 대한 여론을 회고적으로 파악해 보고자 한다. 본 연구를 통해 간단한 유튜브 데이터 분석 결과만으로도 실제 여론(혹은 여론조사 결과)에 근접한 결과를 쉽게 도출하고, 성능이 좋은 여론 예측모형을 구축할 수 있음을 확인하였다.

Keywords

Acknowledgement

본 연구는 (주)바이브컴퍼니의 지원을 받아 데이터를 수집하였음. 이 논문은 2020년 대한민국 교육부와 한국연구재단의 지원을 받아 수행된 연구임(NRF-2020S1A5B8103855).

References

  1. 강은경, 정연식, 양선욱, 권지윤, 양성병. (2022). MIS Quarterly 연구동향 탐색: 토픽모델링 및 키워드 네트워크 분석 활용. 지능정보연구, 28(2), 207-235. https://doi.org/10.13088/JIIS.2022.28.2.207
  2. 고정애, 안철수 지지층 38.3%는 이재명, 37.7%는 윤석열 찍었다, 중아일보, 2022, Available at https://www.joongang.co.kr/article/25058749.
  3. 공윤엽, 김동하, 최현성, 황재호. (2022). 소셜 빅데이터 기반의 20 대 대선후보 키워드 분석을 통한 선거전략 수립. 인문사회 21, 13(1), 3191-3206.
  4. 권혁남. (2001). 16 대 총선 여론조사의 문제점 및 개선방안: 출구조사와 무응답률 문제를 중심으로. 언론과학연구, 1(1), 46-74.
  5. 김가현, '깜깜이 기간' 尹으로 기운 포심... 지지격차는 0.9%~5.2%P 요동, 서울신문, 2022, Available at https://www.seoul.co.kr/news/newsView.php?id=20220310006005.
  6. 김양원, 송경재, [열린라디오 YTN] 여론조사 과잉시대...대선후보 여론조사 믿어도 될까, YTN 라디오 FM 94.5(20:20~21:00), 2021, Available at https://www.ytn.co.kr/_ln/0101_202111150859285538. 101_202111150859285538
  7. 김종훈, 연령불문 인기 1위 '유튜브' 50대 증가하는 까닭은?, 조선일보, 2019, Available at http://www.dizzotv.com/site/data/html_dir/2019/05/16/2019051680230.html.
  8. 김찬우, 박효찬, 박한우. (2017). 2017 년 대통령 후보수락 연설 유튜브 동영상의 댓글망과 의미망 분석. Journal of The Korean Data Analysis Society (JKDAS), 19, 1379-1390. https://doi.org/10.37727/jkdas.2017.19.3.1379
  9. 김형수. (2020). Step by Step 비즈니스 머신러닝 in 파이썬. 서울: 프레딕스.
  10. 바이브컴퍼니. Sometrend Biz, 2022, Available at https://biz.some.co.kr/intro.
  11. 박병언, 임규건. (2015). 일반영향요인과 댓글기반 콘텐츠 네트워크 분석을 통합한 유튜브 (Youtube) 상의 콘텐츠 확산 영향요인 연구. 지능정보연구, 21(3), 19-36. https://doi.org/10.13088/JIIS.2015.21.3.19
  12. 박상현, 김성훈, 정승화. (2020). 유튜브 정치.시사 채널 이용이 정치사회화에 미치는 영향. 한국콘텐츠학회논문지, 20(9), 224-237. https://doi.org/10.5392/JKCA.2020.20.09.224
  13. 박석봉, 정주호. (2021). 빅데이터 분석기술을 활용한 병역제도 여론 연구: 인터넷 뉴스, SNS를 중심으로. 한국국가안보국민안전학회지, 13, 7-30.
  14. 박영석, [그래픽] 역대 대선 여론조사 및 득표율, 연합뉴스, 2021, Available at https://www.yna.co.kr/view/GYH20211127000600044.
  15. 박중현, 유튜브의 인기 비결... 무엇이 현대인을 사로잡았나, 똑똑, 2021, Available at https://www.dokdok.co/post/youtube-3.
  16. 배정환, 손지은, 송민. (2013). 텍스트 마이닝을 이용한 2012 년 한국대선 관련 트위터 분석. 지능정보연구, 19(3), 141-156. https://doi.org/10.13088/JIIS.2013.19.3.141
  17. 송화영, 박세정, 박한우. (2020). 2020 년 국회의원 선거 기간의 유튜브 빅데이터 분석. Journal of The Korean Data Analysis Society, 22(5), 2063-2074. https://doi.org/10.37727/jkdas.2020.22.5.2063
  18. 안지현, '오락가락' 여론조사 결과 왜?.. '정치 저관여층'에 달렸다, JTBC, 2022, Available at https://news.v.daum.net/v/20220223190803040?s=print_news.
  19. 이광춘, 유튜브에 쌓인 데이터들... 대선 결과를 예측할까, 오마이뉴스, 2022, Available at http://www.ohmynews.com/NWS_Web/View/at_pg_w.aspx?CNTN_CD=A0002816615.
  20. 이서영, 권상집. (2019). 트위터 메시지 분석을 통한 선거 결과 예측 고찰: 18 대 대선을 중심으로. 한국콘텐츠학회논문지, 19(4), 174-186. https://doi.org/10.5392/JKCA.2019.19.04.174
  21. 이수범, 강연곤. (2013). 국내 일간지의 트위터 이슈에 관한 보도 프레임 분석: 정치적 소통과 여론 형성이라는 관점을 중심으로. 한국언론학보, 57(1), 28-53.
  22. 이승종, [심층출구조사 분석]①49.3% "후보 만족스럽지 않지만 투표", KBS뉴스, 2022, Available at https://news.kbs.co.kr/news/view.do?ncd=5412126.
  23. 이예나, 최은정, 김명주. (2018). 대선후보의 SNS 평판이 선거결과에 미치는 영향 분석-19 대대선을 중심으로. 디지털융복합연구, 16(2), 195-201. https://doi.org/10.14400/JDC.2018.16.2.195
  24. 임예인, "2022 대선, 여론조사의 패배를 묻다: 괴골 인터뷰 2/2", ㅍㅍㅅㅅ, 2022.05.11., Available at https://ppss.kr/archives/254019.
  25. 전창훈, 선거 100일전 웃은 후보가 결국 이겼다, 부산일보, 2021, Available at http://www.busan.com/view/bstoday/view.php?code=2021112817571734900.
  26. 정일권, 김상연. (2021). 해석적 선거 여론조사 보도: 기사 작성과 취재 실천 방안. 방송문화연구, 33(2), 9-46. https://doi.org/10.22854/SBC.2021.33.2.9
  27. 정지선, 김동성, 김종우. (2015). 온라인 언급이 기업 성과에 미치는 영향 분석: 뉴스 감성 분석을 통한 기업별 주가 예측. 지능정보연구, 21(4), 37-51. https://doi.org/10.13088/JIIS.2015.21.4.037
  28. 중앙선거관리위원회, 제20대 대통령선거(재보궐 포함) 투표구별 개표결과, 중앙선거관리위원회 선거1과, 2022, Available at https://www.nec.go.kr/site/nec/ex/bbs/View.do?cbIdx=1129&bcIdx=175508.
  29. 중앙선거관리위원회, 공직선거법 제108조(여론 조사의 결과공표금지 등), 중앙선거관리위원회 법제과, 2017, Available at https://www.law.go.kr/%EB%B2%95%EB%A0%B9/%EA%B3%B5%EC%A7%81%EC%84%A0%EA%B1%B0%EB%B2%95/%E7%AC%AC108%E6%A2%9D.
  30. 최문열, [이슈 따라잡기] 3일부터 여론조사 공표 금지, 배경과 이유, UPDOWNNEWS, 2022, Available at http://www.updownnews.co.kr/news/articleView.html?idxno=300555.
  31. 최필선, 민인식. (2013). 18 대 대통령 선거 여론 조사의 기관별 정확성 측정 및 비교. 조사연구, 14(2), 1-18.
  32. 하상현, 노태협. (2020). SNS 기반 여론 감성 분석. The Journal of the Convergence on Culture Technology (JCCT), 6(1), 111-120.
  33. 하승태. (2012). 선거여론조사와 후보별 보도량 분석: USA Today의 미대선 경선 보도를 중심으로. 지역과 커뮤니케이션, 16(2), 115-140.
  34. 홍원식, 한균태, 서영남. (2009). 대선보도와 여론 조사-여론조사 공표 금지 조항 개정을 중심으로. 정치커뮤니케이션 연구, 12, 245-277.
  35. MBC. [여론M] 여론조사를 조사하다, 2022, Available at http://poll-mbc.co.kr/.
  36. Chen, Y., & Wang, L. (2022). Misleading political advertising fuels incivility online: A social network analysis of 2020 US presidential election campaign video comments on YouTube. Computers in Human Behavior, 131, 107202. https://doi.org/10.1016/j.chb.2022.107202
  37. Krishna, A., Zambreno, J., & Krishnan, S. (2013, December). Polarity trend analysis of public sentiment on YouTube. In Proceedings of the 19th international conference on management of data (pp. 125-128).
  38. Lee, K., 9 Informative Infographics To Guide Your Visual Content Marketing, Buffer, 2014, Available at https://buffer.com/resources/infographics-visual-content-marketing/.
  39. Mehrabian, A. (1981). Silent messages: Implicit communication of emotions and attitudes, Wadsworth Pub.
  40. Patterson, T. E. (2005). Of polls, mountains: US journalists and their use of election surveys. Public Opinion Quarterly, 69(5), 716-724. https://doi.org/10.1093/poq/nfi065
  41. Ridout, T. N., Franklin Fowler, E., & Branstetter, J. (2010, August). Political advertising in the 21st century: The rise of the YouTube ad. In APSA 2010 Annual Meeting Paper.
  42. Shevtsov, A., Oikonomidou, M., Antonakaki, D., Pratikakis, P., & Ioannidis, S. (2020). Analysis of Twitter and YouTube during USelections 2020. arXiv preprint arXiv:2010.08183.
  43. Zolghadr, M., Niaki, S. A. A., & Niaki, S. T. A. (2018). Modeling and forecasting US presidential election using learning algorithms. Journal of Industrial Engineering International, 14(3), 491-500 https://doi.org/10.1007/s40092-017-0238-2