DOI QR코드

DOI QR Code

Social Issue Risk Type Classification based on Social Bigdata

소셜 빅데이터 기반 사회적 이슈 리스크 유형 분류

  • 오효정 (전북대학교 대학원 기록관리학과) ;
  • 안승권 ((주)바른교육) ;
  • 김용 (전북대학교 문헌정보학과)
  • Received : 2016.02.04
  • Accepted : 2016.05.02
  • Published : 2016.08.28

Abstract

In accordance with the increased political and social utilization of social media, demands on online trend analysis and monitoring technologies based on social bigdata are also increasing rapidly. In this paper, we define 'risk' as issues which have probability of turn to negative public opinion among big social issues and classify their types in details. To define risk types, we conduct a complete survey on news documents and analyzed characteristics according to issue domains. We also investigate cross-medias analysis to find out how different public media and personalized social media. At the result, we define 58 risk types for 6 domains and developed automatic classification model based on machine learning algorithm. Based on empirical experiments, we prove the possibility of automatic detection for social issue risk in social media.

소셜미디어의 정치사회적인 활용도가 높아짐에 따라 소셜빅데이터 기반 온라인 동향분석 및 모니터링 기술에 대한 수요 역시 급증하고 있다. 본 논문에서는 이러한 요구에 부합, 특히 여론 형성의 악영향을 끼치는 부정적 이슈 탐지를 위해 사회적으로 파장이 큰 이슈 중 공공여론이 부정적으로 형성될 이슈를 '리스크'로 정의하고 세부 유형을 분류한다. 리스크 유형 정의를 위해 뉴스 문서집합을 대상으로 전수조사를 실시하였으며, 이슈 분야 즉 도메인별 특성을 파악하여 세부 유형을 정의한다. 또한 뉴스와 같은 공적미디어를 통해 정의된 리스크 유형이 개인화된 소셜 미디어에 나타난 리스크 유형과 어떤 차이가 있는지를 알아보기 위해 교차분석을 수행한다. 조사 결과에 따라 6개의 도메인별로 58개의 세부 유형을 정의하고 기계학습 방법을 통해 자동 분류 학습 모델을 구축한다. 실험 결과를 통해 소셜 미디어에 나타난 사회적 이슈 리스크를 자동으로 탐지, 분류가 가능함을 보인다.

Keywords

References

  1. 이지영, "'빅데이터 분석 = 소셜 분석'이 된 까닭," bloter.net, 2012.
  2. 이병엽, 임종태, 유재수, "빅 데이터를 이용한 소셜 미디어 분석 기법의 활용," 한국콘텐츠학회논문지, 제13권, 제2호, pp.211-219, 2013. https://doi.org/10.5392/JKCA.2013.13.02.211
  3. 윤미영, 권정은, "빅데이터로 진화하는 세상," 한국정보화진흥원 IT & Future Strategy, 2012-제6호, 2012.
  4. 백인수, 데이터 강국을 위한 국가정보화사업 추진 방향, 한국정보화진흥원, 2013.05.
  5. G. H. Kim, S. Trimi, and J. H. Chung, "Big-data applications in the government sector," Communications of the ACM, Vol.57, No.3, pp.78-85, 2014.
  6. W. J. Sutherland, M. J. Bailey, I. P. Bainbridge, T. Brereton, J. T. Dick, J. Drewitt, and P. M Gilder, "Future novel threats and opportunities facing UK biodiversity identified by horizon scanning," Journal of Applied Ecology, Vol.45, No.3, pp.821-833, 2008. https://doi.org/10.1111/j.1365-2664.2008.01474.x
  7. 한국정보화진흥원, "이슈 스캐닝(Horizon Scanning) 기반 국가미래전략 수립방향," 한국정보화진흥원 IT & Future Strategy, 2013-제5호, 2013.
  8. 이충희, 허정, 오효정, 김현진, 류법모, 김현기, "소셜 빅데이터 이슈 탐지 및 예측분석 기술 동향," 전자통신동향분석, 제28권, 제1호, pp.62-71, 2013. https://doi.org/10.22648/ETRI.2013.J.280107
  9. 이상지, 장동혁, 박성운, 조원희, 이기철, "객체식별아이디 이포지션 기반의 LBSNS 앱이 19대 총선 후보 지지율의 변화에 미친 영향," 한국콘텐츠학회논문지, 제13권, 제8호, pp.171-179, 2013. https://doi.org/10.5392/JKCA.2013.13.08.171
  10. 허정, 이충희, 오효정, 윤여찬 김현기, 조요한, 옥철영, "소셜 빅데이터 마이닝 기반 이슈 분석보고서 자동 생성," 정보처리학회논문지/소프트웨어 및 데이터 공학, 제3권, 제12호, pp.553-564, 2014(12). https://doi.org/10.3745/KTSDE.2014.3.12.553
  11. Y. J Choi, H. K Kim, and C. K. Lee, "Balanced Korean word spacing with structural SVM," Proc. of Empirical Methods in Natural Language Processing(EMNLP), pp.875-879, 2014.