DOI QR코드

DOI QR Code

Storm-Based Dynamic Tag Cloud for Real-Time SNS Data

실시간 SNS 데이터를 위한 Storm 기반 동적 태그 클라우드

  • 손시운 (강원대학교 컴퓨터과학과) ;
  • 김다솔 (강원대학교 컴퓨터과학과) ;
  • 이수정 (강원대학교 컴퓨터과학과) ;
  • 길명선 (강원대학교 컴퓨터과학과) ;
  • 문양세 (강원대학교 컴퓨터과학과)
  • Received : 2016.11.10
  • Accepted : 2016.12.01
  • Published : 2017.06.30

Abstract

In general, there are many difficulties in collecting, storing, and analyzing SNS (social network service) data, since those data have big data characteristics, which occurs very fast with the mixture form of structured and unstructured data. In this paper, we propose a new data visualization framework that works on Apache Storm, and it can be useful for real-time and dynamic analysis of SNS data. Apache Storm is a representative big data software platform that processes and analyzes real-time streaming data in the distributed environment. Using Storm, in this paper we collect and aggregate the real-time Twitter data and dynamically visualize the aggregated results through the tag cloud. In addition to Storm-based collection and aggregation functionalities, we also design and implement a Web interface that a user gives his/her interesting keywords and confirms the visualization result of tag cloud related to the given keywords. We finally empirically show that this study makes users be able to intuitively figure out the change of the interested subject on SNS data and the visualized results be applied to many other services such as thematic trend analysis, product recommendation, and customer needs identification.

일반적으로 SNS (social network service) 데이터는 정형, 비정형 데이터가 섞여 빠르게 생성되는 빅데이터의 특성을 갖기 때문에 실시간 수집/저장/분석에 많은 어려움이 있다. 본 논문에서는 이러한 SNS 데이터의 분석에 활용할 수 있는 Apache Storm 기반 실시간 동적 데이터 시각화 기술을 제안한다. Storm은 대표적인 빅데이터 기술 중 하나로, 실시간으로 수집되는 데이터를 분산 환경에서 처리 및 분석하는 소프트웨어 플랫폼이다. 본 논문은 Storm을 사용하여 빠르게 발생하는 트위터(Twitter) 데이터를 수집 및 집계하고, 태그 클라우드를 통해 그 결과를 동적으로 표현하고자 한다. 이를 위해, 사용자가 요구하는 키워드를 입력받고 해당 키워드를 통한 시각화 결과를 실시간으로 확인할 수 있는 웹 인터페이스를 설계 및 구현한다. 또한, 각각의 태그 클라우드 결과를 비교하여 올바로 시각화되었는지 확인한다. 본 연구를 통해, 사용자는 관심있는 주제가 SNS에서 어떻게 변화하고 있는지 직관적으로 판단할 수 있게 되며, 시각화 결과는 주제별 트렌드 분석, 고객 니즈 파악 등 다른 서비스에도 활용이 가능하다.

Keywords

References

  1. Social Networking Service [Internet], https://en.wikipedia.org /wiki/Social_networking_service.
  2. Social Mining Part 1: How Big Data is transforming customer insights [Internet], http://www.incite-group.com/data-and-insights/social-mining-part-1-how-big-data-transforming-customer-insights.
  3. J. Manyika, M. Chui, B. Brown, J. Bughin, R. Dobbs, C. Roxburgh, and A. Byers, "Big Data: The Next Frontier for Innovation, Competition, and Productivity," Technical Report, McKinsey Global Institute, 2011.
  4. M. A. Hearst and D. Rosner, "Tag Clouds: Data Analysis Tool or Social Signaller?," In Proc. of the 41st Int'l Conf. on System Sciences, pp.1-10, Jan., 2008.
  5. Example of Tag Cloud [Internet], https://www.nngroup.com/articles/tag-cloud-examples/.
  6. Apache Storm [Internet], http://storm.apache.org/.
  7. A. Toshniwal, S. Taneja, A. Shukla, K. Ramasamy, J. M. Patel, S. Kulkarni, J. Jackson, K. Gade, M. Fu, J. Donham, N. Bhagat, S. Mittal, and D. Ryaboy, "Storm@Twitter," In Proc. of the Int'l Conf. on Management of Data, ACM SIGMOD, pp.147-156, June, 2014.
  8. Apache Hadoop [Internet], http://hadoop.apache.org/.
  9. Apache Spark [Internet], http://spark.apache.org/.
  10. EsperTech Esper [Internet], http://www.espertech.com/esper/.
  11. Apache Storm Trident Tutorial [Internet], http://storm.apach e.org/relea ses/current/Trident-tutorial.html.
  12. Y. Hassan-Montero and V. Herrero-Solana, "Improving Tag-Clouds as Visual Information Retrieval Interfaces," In Proc. of the Int'l Conf. on Multidisciplinary Information Sciences and Technologies, Oct., 2006.
  13. M. A. Hearst and D. Rosner, "Tag Clouds: Data Analysis Tool or Social Signaller?," In Proc. of the Hawaii Int'l Conf. on System Sciences, Jan., 2008.
  14. O. kaser and D. Lemire, "Tag-Cloud Drawing: Algorithms for Cloud Visualization," In Proc. of World Wide Web Workshop on Taggings and Metadata for Social Information Organization, Mar., 2007.
  15. D3.js [Internet], https://d3js.org/.
  16. Twitter4j [Internet], http://twitter4j.org/en/index.html.