• 제목/요약/키워드: Big data analytics

검색결과 279건 처리시간 0.027초

유튜브 데이터를 활용한 20대 대선 여론분석 (Analysis of public opinion in the 20th presidential election using YouTube data)

  • 강은경;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.161-183
    • /
    • 2022
  • 여론조사는 유권자들의 투표행위를 예측하고, 그 행위에 영향을 준다는 점에서 선거운동의 강력한 수단이자, 언론의 가장 중요한 기사거리로 자리잡고 있다. 하지만, 여론조사가 활발할수록 후보자들의 공약과 정책을 검증하기 보다 당선 가능성이나 지지도에 관한 조사만 반복적으로 실시하는 등 선거 캠페인에 관한 효과 측정에서 유권자들의 마음을 제대로 반영하지 못하는 경우가 많다. 여론조사의 선거 결과에 대한 부실한 예측이 언론사의 권위를 실추시켰다 하더라도, 어느 후보가 최종 승리할지에 대해 인간의 본능적인 궁금증을 풀어줄 명백한 대안이 없기 때문에 사람들은 여론조사에 대한 관심을 쉽게 놓지 못한다. 이에, 온라인 빅데이터를 통해 인사이트를 발굴하는 환경을 제공하는 썸트렌드의 '유튜브 분석' 기능을 활용하여 20대 대선에 대한 여론을 회고적으로 파악해 보고자 한다. 본 연구를 통해 간단한 유튜브 데이터 분석 결과만으로도 실제 여론(혹은 여론조사 결과)에 근접한 결과를 쉽게 도출하고, 성능이 좋은 여론 예측모형을 구축할 수 있음을 확인하였다.

교육 빅데이터 관련 연구 동향 (Current Status of Educational Big Data Research)

  • 이은경;박도영;최인봉
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.175-176
    • /
    • 2014
  • 본고에서는 교육 빅데이터의 개념, 가치, 처리 기술 및 분석 방법 등을 탐색하였다. '온라인과 오프라인 교수 학습 활동의 투입, 과정, 산출을 통해 생산되는 국가, 지역, 학교, 교사, 학생 수준의 자료'로 정의할 수 있는 교육 빅데이터는 Hadoop으로 대표되는 분산 컴퓨팅 기술을 통해 효율적으로 처리할 수 있다. 대규모 교육 자료에서 의미있고 유용한 결과를 도출하기 위해 주로 사용되는 분석 방법에는 교육 데이터 마이닝, 학습 분석학과 시각 자료 분석학이 있다. 교육 데이터 마이닝은 학생과 교사, 학교의 다양한 수준에서 자료를 폭넓게 분석하는 측면이 강한 반면에 학습 분석학은 학생 수준에서의 자료 분석에 더 초점을 맞추는 경향이 있으며, 시각 자료 분석학은 자료에 대한 분석 자체보다는 분석 결과를 효과적으로 표현하는 방식에 초점이 주어져 있다.

  • PDF

A Study on Big Data Analytics Services and Standardization for Smart Manufacturing Innovation

  • Kim, Cheolrim;Kim, Seungcheon
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제14권3호
    • /
    • pp.91-100
    • /
    • 2022
  • Major developed countries are seriously considering smart factories to increase their manufacturing competitiveness. Smart factory is a customized factory that incorporates ICT in the entire process from product planning to design, distribution and sales. This can reduce production costs and respond flexibly to the consumer market. The smart factory converts physical signals into digital signals, connects machines, parts, factories, manufacturing processes, people, and supply chain partners in the factory to each other, and uses the collected data to enable the smart factory platform to operate intelligently. Enhancing personalized value is the key. Therefore, it can be said that the success or failure of a smart factory depends on whether big data is secured and utilized. Standardized communication and collaboration are required to smoothly acquire big data inside and outside the factory in the smart factory, and the use of big data can be maximized through big data analysis. This study examines big data analysis and standardization in smart factory. Manufacturing innovation by country, smart factory construction framework, smart factory implementation key elements, big data analysis and visualization, etc. will be reviewed first. Through this, we propose services such as big data infrastructure construction process, big data platform components, big data modeling, big data quality management components, big data standardization, and big data implementation consulting that can be suggested when building big data infrastructure in smart factories. It is expected that this proposal can be a guide for building big data infrastructure for companies that want to introduce a smart factory.

Cloud Computing Platforms for Big Data Adoption and Analytics

  • Hussain, Mohammad Jabed;Alsadie, Deafallah
    • International Journal of Computer Science & Network Security
    • /
    • 제22권2호
    • /
    • pp.290-296
    • /
    • 2022
  • Big Data is a data analysis technology empowered by late advances in innovations and engineering. In any case, big data involves a colossal responsibility of equipment and handling assets, making reception expenses of big data innovation restrictive to little and medium estimated organizations. Cloud computing offers the guarantee of big data execution to little and medium measured organizations. Big Data preparing is performed through a programming worldview known as MapReduce. Normally, execution of the MapReduce worldview requires organized joined stockpiling and equal preparing. The computing needs of MapReduce writing computer programs are frequently past what little and medium measured business can submit. Cloud computing is on-request network admittance to computing assets, given by an external element. Normal arrangement models for cloud computing incorporate platform as a service (PaaS), software as a service (SaaS), framework as a service (IaaS), and equipment as a service (HaaS).

BigCrawler: 엣지 서버 컴퓨팅·스토리지 모듈의 동적 구성을 통한 효율적인 빅데이터 처리 시스템 구현 및 성능 분석 (Implementation and Performance Aanalysis of Efficient Big Data Processing System Through Dynamic Configuration of Edge Server Computing and Storage Modules)

  • 김용연;전재호;강성주
    • 대한임베디드공학회논문지
    • /
    • 제16권6호
    • /
    • pp.259-266
    • /
    • 2021
  • Edge Computing enables real-time big data processing by performing computing close to the physical location of the user or data source. However, in an edge computing environment, various situations that affect big data processing performance may occur depending on temporary service requirements or changes of physical resources in the field. In this paper, we proposed a BigCrawler system that dynamically configures the computing module and storage module according to the big data collection status and computing resource usage status in the edge computing environment. And the feature of big data processing workload according to the arrangement of computing module and storage module were analyzed.

전화통화 빅데이터 분석에 관한 연구 (A Study on Phon Call Big Data Analytics)

  • 김정래;정찬기
    • 정보화연구
    • /
    • 제10권3호
    • /
    • pp.387-397
    • /
    • 2013
  • 본 연구는 전화통화에 의해 생성된 데이터에 대한 빅데이터 분석 접근을 제안한다. 전화통화 데이터의 분석모형은 자연어의 어휘식별을 위한 PVPF(Parallel Variable-length Phrase Finding) 알고리즘과 키워드의 사용빈도 측정을 위한 워드 카운트 알고리즘으로 구성된다. 제안한 분석모형에서는 먼저 PVPF 알고리즘에 의해 연계 단어 추출을 통해 어휘를 식별하며, MapReduce의 워드 카운트 알고리즘을 사용하여 식별된 어휘 및 단어의 사용빈도를 측정한다. 그 결과는 다양한 관점에서 해석될 수 있다. 제안 분석모형의 효과성을 보이기 위해 HDFS(Hadoop Distributed File System)를 기반으로 분석모형을 설계 구현하였으며, 전화통화 데이터를 실험 적용한다. 실험결과, 키워드 상관관계 분석 및 사용빈도 변화 분석을 통해 유의미한 결과를 도출한다.

빅데이터 연구동향 분석: 토픽 모델링을 중심으로 (Research Trends Analysis of Big Data: Focused on the Topic Modeling)

  • 박종순;김창식
    • 디지털산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.1-7
    • /
    • 2019
  • The objective of this study is to examine the trends in big data. Research abstracts were extracted from 4,019 articles, published between 1995 and 2018, on Web of Science and were analyzed using topic modeling and time series analysis. The 20 single-term topics that appeared most frequently were as follows: model, technology, algorithm, problem, performance, network, framework, analytics, management, process, value, user, knowledge, dataset, resource, service, cloud, storage, business, and health. The 20 multi-term topics were as follows: sense technology architecture (T10), decision system (T18), classification algorithm (T03), data analytics (T17), system performance (T09), data science (T06), distribution method (T20), service dataset (T19), network communication (T05), customer & business (T16), cloud computing (T02), health care (T14), smart city (T11), patient & disease (T04), privacy & security (T08), research design (T01), social media (T12), student & education (T13), energy consumption (T07), supply chain management (T15). The time series data indicated that the 40 single-term topics and multi-term topics were hot topics. This study provides suggestions for future research.

The Big Data Analytics Regarding the Cadastral Resurvey News Articles

  • Joo, Yong-Jin;Kim, Duck-Ho
    • 한국측량학회지
    • /
    • 제32권6호
    • /
    • pp.651-659
    • /
    • 2014
  • With the popularization of big data environment, big data have been highlighted as a key information strategy to establish national spatial data infrastructure for a scientific land policy and the extension of the creative economy. Especially interesting from our point of view is the cadastral information is a core national information source that forms the basis of spatial information that leads to people's daily life including the production and consumption of information related to real estate. The purpose of our paper is to suggest the scheme of big data analytics with respect to the articles of cadastral resurvey project in order to approach cadastral information in terms of spatial data integration. As specific research method, the TM (Text Mining) package from R was used to read various formats of news reports as texts, and nouns were extracted by using the KoNLP package. That is, we searched the main keywords regarding cadastral resurvey, performing extraction of compound noun and data mining analysis. And visualization of the results was presented. In addition, new reports related to cadastral resurvey between 2012 and 2014 were searched in newspapers, and nouns were extracted from the searched data for the data mining analysis of cadastral information. Furthermore, the approval rating, reliability, and improvement of rules were presented through correlation analyses among the extracted compound nouns. As a result of the correlation analysis among the most frequently used ones of the extracted nouns, five groups of data consisting of 133 keywords were generated. The most frequently appeared words were "cadastral resurvey," "civil complaint," "dispute," "cadastral survey," "lawsuit," "settlement," "mediation," "discrepant land," and "parcel." In Conclusions, the cadastral resurvey performed in some local governments has been proceeding smoothly as positive results. On the other hands, disputes from owner of land have been provoking a stream of complaints from parcel surveying for the cadastral resurvey. Through such keyword analysis, various public opinion and the types of civil complaints related to the cadastral resurvey project can be identified to prevent them through pre-emptive responses for direct call centre on the cadastral surveying, Electronic civil service and customer counseling, and high quality services about cadastral information can be provided. This study, therefore, provides a stepping stones for developing an account of big data analytics which is able to comprehensively examine and visualize a variety of news report and opinions in cadastral resurvey project promotion. Henceforth, this will contribute to establish the foundation for a framework of the information utilization, enabling scientific decision making with speediness and correctness.

상표의 소비자 인식 판단을 위한 빅데이터 활용 방안 (Big Data Application for Judgment on Consumer's Awareness of the Trademark)

  • 유현우;이환수
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제6권8호
    • /
    • pp.399-408
    • /
    • 2016
  • 빅데이터의 시대가 도래 하면서 지식재산권 영역에서도 빅데이터의 활용이 늘고 있는 추세이다. 한편 상표는 본질적으로 자타 상품을 식별하는 표지로서 그 목적이 소비자에게 인식되도록 하는 데 있다. 최근 이슈가 되고 있는 빅데이터 분석 기술은 상표에 있어서 이러한 소비자의 인식을 판단하는 도구로 활용될 수 있다. 그동안의 전통적인 방법으로는 소비자의 인식에 해당하는 식별력을 증명하는 것은 쉽지 않은 일이었다. 최근 상표의 식별력을 판단하기 위한 방안으로 설문조사에 대한 관심이 높아지면서 우리 상표법 시행규칙에도 설문조사가 도입되었지만 비용과 시간, 객관성, 공정성 측면에서 오류와 많은 문제가 있는 것으로 드러났다. 이에 대한 보완책으로 본 연구는 빅데이터 분석 기법을 활용하여 상표에 대한 소비자 인식을 판단할 수 있는 방안을 제시하고자 한다. 빅데이터 분석을 활용한 경우 상표 식별력 판단의 객관성을 높이는 것은 물론 상표와 관련된 다른 법률적 판단에 도움을 주는 보조 자료로 활용될 수 있을 것이다.

유튜브 실시간 방송 시청자의 지속시청 및 유료후원 의도에 영향을 미치는 요인: S-O-R 프레임워크를 기반으로 (Factors Influencing the Continuous Watching and Paid Sponsorship Intentions of YouTube Real-Time Broadcast Viewers: Based on the S-O-R Framework)

  • 권지윤;양선욱;양성병
    • 지식경영연구
    • /
    • 제23권3호
    • /
    • pp.285-311
    • /
    • 2022
  • 본 연구에서는 S-O-R 프레임워크를 기반으로 개인에 대한 자극(유튜브 채널의 영상 특성, 유튜버 특성, 실시간 방송 특성)이 어떻게 유기체(지각된 유용성, 지각된 즐거움, 사회적 존재감)를 형성하고, 이것이 시청자 반응(지속시청의도, 유료후원의도)에 영향을 미치는지를 유튜브 실시간 방송 환경에서 검증해 보고자 한다. 이를 위해 연구모형 및 가설을 구성하였고, 유튜브 플랫폼의 실시간 방송 채널 서비스 이용자를 대상으로 수집한 369부의 설문자료를 분석하였다. 분석결과, 일부 영상 특성, 유튜버 특성, 실시간 방송 특성이 시청자의 지각된 유용성, 지각된 즐거움, 사회적 존재감에, 더 나아가 지속시청의도, 유료후원의도에 유의한 영향을 미치는 것을 확인하였다. 결론에서 연구결과의 이론적 및 실무적 시사점을 논의하였다.