• 제목/요약/키워드: Veracity of Data

검색결과 22건 처리시간 0.023초

A Study on Veracity of Raw Data based on Value Creation -Focused on YouTube Monetization

  • CHOI, Seoyeon;SHIN, Seung-Jung
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권2호
    • /
    • pp.218-223
    • /
    • 2021
  • The five elements of big data are said to be Volume, Variety, Velocity, Veracity, and Value. Among them, data lacking the Veracity of the data or fake data not only makes an error in decision making, but also hinders the creation of value. This study analyzed YouTube's revenue structure to focus the effect of data integrity on data valuation among these five factors. YouTube is one of the OTT service platforms, and due to COVID-19 in 2020, YouTube creators have emerged as a new profession. Among the revenue-generating models provided by YouTube, the process of generating advertising revenue based on click-based playback was analyzed. And, analyzed the process of subtracting the profits generated from invalid activities that not the clicks due to viewers' pure interests, then paying the final revenue. The invalid activity in YouTube's revenue structure is Raw Data, not pure viewing activity of viewers, and it was confirmed a direct impact on revenue generation. Through the analysis of this process, the new Data Value Chain was proposed.

빅데이터 분석 교육의 문제점과 개선 방안 -학생 과제 보고서를 중심으로 (Problems of Big Data Analysis Education and Their Solutions)

  • 최도식
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.265-274
    • /
    • 2017
  • 본 논문은 빅데이터 분석 교육의 문제점을 고찰해 그 개선 방안을 제시한다. 빅데이터의 특성은 V3에서 V5로 진화하고 있다. 이에 빅데이터 분석 교육도 V5를 감안한 데이터 분석 교육이 되어야 한다. 작금 불확실성의 증대는 데이터 분석의 리스크를 증가시키기에 내적 외적 구조화/비구조화 데이터를 비롯해 교란 요인마저 분석할 때 데이터의 신뢰성은 증가될 수 있다. 그리고 평판분석을 활용할 때 범하기 쉬운 오류가 가변성과 불확실성에 대한 상황 인식이다. 가변성의 측면을 고려해, 다양한 변수와 옵션에 의한 불확실성의 상황을 인식하고 대비한 데이터 분석이 이뤄질 때 데이터에 대한 신뢰성과 정확성은 증가할 수 있다. 사회관계망 분석에서 학생들과 일반 연구자들이 주로 활용하는 것이 텍스톰과 노드엑셀의 노드 분석이다. 사화관계망 분석은 매개중심성에 의한 상황 분석을 통해 다크 데이터를 찾아 이상 현상을 감지하고 현 상황을 분석하여 유용한 의미를 얻고 미래를 예측할 수 있어야 한다.

빅 데이터와 클라우드 컴퓨팅 기반의 수자원 정보 관리 방안에 관한 검토 (A Review on the Management of Water Resources Information based on Big Data and Cloud Computing)

  • 김연수;강나래;정재원;김형수
    • 한국습지학회지
    • /
    • 제18권1호
    • /
    • pp.100-112
    • /
    • 2016
  • 최근 국내 외 수자원 정책의 방향은 전통적인 이 치수 부문과 함께 삶의 질을 향상을 위해 지속가능한 물 관리에 대한 필요가 강조되면서 수자원 정보의 수집, 관리 및 제공의 중요성이 증대되고 있다. 과거 수자원 정보는 제공하고자 하는 목적을 이미 정하고 거기에 맞도록 데이터를 효과적으로 분석하는 기술에 초점이 맞추어져 있었다. 그러나 최근에는 정형 데이터뿐만 아니라 비정형 데이터를 연계함으로써 새로운 가치를 도출할 수 있는 빅 데이터와 클라우드 컴퓨팅에 대한 관심이 부각되면서 수자원 정보에도 변화를 가져오고 있다. 이에 본 논문에서는 수자원 정보 관리의 패러다임 변화에 능동적으로 대처하고, 수자원 정보의 효율적인 관리 및 이용을 위해 수자원 분야에서 빅 데이터와 클라우드 컴퓨팅의 적용 방안을 검토 및 제언하고자 하였다. 국내외 수자원 정보 관리의 현황과 방향을 살펴보고, 빅 데이터의 3대 요소인 크기(Volume), 속도(Velocity), 다양성(Variety)과 함께 추가적으로 언급되고 있는 정확성(Veracity), 가치(Value)개념을 연계하였다. 그리고 클라우드 컴퓨팅을 통해 증가하는 수자원 관련 빅 데이터와 수요자의 변화에 대해 신속하고 유연한 대처방안에 대하여 논의하였다. 앞으로의 수자원 정보 관리는 정보의 크기(Volume), 속도(Velocity), 다양성(Variety) 등의 빅 데이터와 클라우드 컴퓨팅 적용을 통한 인명과 재산의 보호 등 공공의 목적, 물 관리 및 재난의 예방과 대응에 필요한 정확한(Veracity) 정보의 생산, 그리고 다른 분야와의 융합 등에 적극적으로 활용함으로써 수자원 정보의 가치(Value)를 높이는 방행으로 나아가야 한다.

RDNN: Rumor Detection Neural Network for Veracity Analysis in Social Media Text

  • SuthanthiraDevi, P;Karthika, S
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.3868-3888
    • /
    • 2022
  • A widely used social networking service like Twitter has the ability to disseminate information to large groups of people even during a pandemic. At the same time, it is a convenient medium to share irrelevant and unverified information online and poses a potential threat to society. In this research, conventional machine learning algorithms are analyzed to classify the data as either non-rumor data or rumor data. Machine learning techniques have limited tuning capability and make decisions based on their learning. To tackle this problem the authors propose a deep learning-based Rumor Detection Neural Network model to predict the rumor tweet in real-world events. This model comprises three layers, AttCNN layer is used to extract local and position invariant features from the data, AttBi-LSTM layer to extract important semantic or contextual information and HPOOL to combine the down sampling patches of the input feature maps from the average and maximum pooling layers. A dataset from Kaggle and ground dataset #gaja are used to train the proposed Rumor Detection Neural Network to determine the veracity of the rumor. The experimental results of the RDNN Classifier demonstrate an accuracy of 93.24% and 95.41% in identifying rumor tweets in real-time events.

스마트기기 활용역량과 프라이버시 우려: 온라인 사회참여 활동과 정보 사실성 판단 능력의 매개효과 및 프라이버시의 조절효과 (How Does Smart-device Literacy Shape Privacy Concerns: The Moderation of Privacy and the Mediation of Online Social Participation and Information Veracity)

  • 김현정;김범수
    • 지식경영연구
    • /
    • 제24권1호
    • /
    • pp.51-72
    • /
    • 2023
  • 지능정보사회에서 디지털 리터러시는 필수사항이며, 리터러시 교육이 활발히 시행되고 있다. 디지털 리터러시 수준이 올라갈수록 프라이버시 우려가 증가하는데, 이는 디지털 서비스 이용을 저해할 수 있다. 이 연구에서는 스마트기기 활용 역량과 프라이버시 우려와의 관계에서 온라인 사회참여 활동과 정보 사실성 판단 능력의 매개효과와 프라이버시 리터러시의 조절효과를 검증하였다. 스마트기기를 사용하고 온라인 활동을 하는 13세 이상의 동일 패널 7,737명의 2020년과 2021년 실시한 한국미디어패널 조사 자료를 활용하였다. 주요 변인의 비교 및 분석을 위해 SPSS(v26.0)와 PROCESS Macro(v4.1, Model 15)를 이용하였다. 2020년과 2021년의 비교에서 스마트기기 활용역량과 프라이버시 리터러시는 증가 하였지만, 프라이버시 우려와 정보 사실성 판단 능력, 온라인 사회참여 활동은 감소하였음을 보았다. 분석 대상 전체와 통제 집단에서 프라이버시 우려와 정보 사실성 판단 능력의 평균간 차이가 상대적으로 크게 감소하였으며, 통계적으로도 그 차이가 유의미하다. 연구모형 검증 결과, 스마트기기 활용역량이 프라이버시 우려에 미치는 영향은 2020년과 2021년 모두 증가하는 유의적인 효과를 확인하였으며, 온라인 사회참여 활동의 매개효과와 프라이버시 리터러시의 조절된 매개효과도 확인되었다. 정보 신뢰성 판단 능력은 2020년에 유의적이지 않지만, 2021년에는 유의한 매개효과와 조절된 매개효과도 확인되었다.

중한 도서관 빅데이터의 비교 (Big data comparison between Chinese and Korean Libraries)

  • 동정문
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.413-414
    • /
    • 2019
  • 빅데이터는 초기에는 개념적인 접근으로 대용량의 데이터로 정의하기도 하였으나 지금은 데이터를 수집, 저장, 처리, 분석하여 가치 창출까지의 개념으로 확산되고, 최근에는 정확성(Veracity), 가변성(Variability), 시각화(Visualization) 개념까지 새롭게 추가되어 7V로 제시되기도 한다.

  • PDF

공간 빅데이터의 개념 및 서비스 프레임워크 구상에 관한 연구 (A Study on Concept and Services Framework of Geo-Spatial Big Data)

  • 유선철;최원욱;신동빈;안종욱
    • Spatial Information Research
    • /
    • 제22권6호
    • /
    • pp.13-21
    • /
    • 2014
  • 본 연구는 수요 및 관심이 증대되고 있는 공간 빅데이터의 개념설정과 이를 기반으로 공간 빅데이터 기술을 활용할 수 있는 서비스 프레임워크를 개념적으로 제시하는데 목적이 있다. 공간 빅데이터는 정형 반정형 비정형 공간 빅데이터를 효율적으로 수집 저장 관리하는 동시에 공간정보와 융합된 다양한 속성정보에 대해 실시간 통합 분석을 수행하여 의미 있는 정보를 추출함으로써 미래에 대응할 수 있는 기술이라 할 수 있다. 또한 공간 빅데이터는 기존 빅데이터가 가지는 3V(Volume, Variety, Velocity) 특성에 4V(Veracity, Visualization, Versatile, Value)가 추가된 특성을 가지며, 저장 관리, 분석, 서비스로 구분하여 활용범위를 설정할 수 있다. 그리고 공간 빅데이터를 활용하기 위한 서비스 측면에서의 프레임워크를 제시하였다. 구체적으로 서비스 관리, 서비스 콘테이너, 서비스 모니터링의 구성요소로 구상안을 제시하였다. 이러한 연구결과를 참조로 새로운 기술 및 기법들을 적용하여 수정 보완하고, 향후 개발예정인 저장 관리, 분석 기술개발과 연계하여 구체적인 서비스 제공방안에 대한 연구가 지속적으로 이루어져야 할 것이다.

공간빅데이터를 위한 정보 시각화 방법 (Information Visualization Process for Spatial Big Data)

  • 서양모;김원균
    • Spatial Information Research
    • /
    • 제23권6호
    • /
    • pp.109-116
    • /
    • 2015
  • 본 연구에서는 공간빅데이터의 개념과 특징을 정의하고 데이터에 대한 통찰력을 높일 수 있는 정보 시각화 방법론을 조사하였다. 또한 시각화 과정에서 발생할 수 있는 문제점 및 해결방법을 제시하였다. 공간빅데이터를 공간정보의 정량적인 확장의 결과와 빅데이터의 정성적인 확장의 결과로 정의하였다. 공간빅데이터는 6V(Volume, Variety, Velocity, Value, Veracity, Visualization)의 특징을 갖고 있으며, 최근 활용 서비스 측면이 이슈화 되면서 공간빅데이터에 대한 통찰력을 제공하여 데이터의 활용 가치를 높이기 위해 공간빅데이터의 시각화가 주목받고 있다. 정보 시각화의 방법은 Matthias, Ben, 정보디자인교과서 등을 통하여 다양한 방법으로 정의 되어 있으나 공간빅데이터의 시각화는 방대한 양의 원시 데이터를 대상으로 하기 때문에 데이터의 조직화 과정을 거쳐야 하며 이를 통해 사용자에게 전달하려는 정보를 추출해야 하는 차이점이 있다. 추출된 정보는 특성에 따른 적합한 시각적 표현 방법을 사용해야 하며, 많은 양의 데이터를 시각적으로 표현하는 것은 사용자에게 정확한 정보를 제공 할 수 없으므로 필터링, 샘플링, 데이터 비닝, 클러스터링 등을 이용하여 데이터를 축소하여 표현하는 방법이 필요하다.

공간빅데이터 개념 및 체계 구축방안 연구 (Study for Spatial Big Data Concept and System Building)

  • 안종욱;이미숙;신동빈
    • Spatial Information Research
    • /
    • 제21권5호
    • /
    • pp.43-51
    • /
    • 2013
  • 본 연구에서는 최근 이슈가 되고 있는 공간빅데이터에 대한 개념과 효과적으로 공간빅데이터체계를 구축하기 위한 방안을 제시하였다. 공간빅데이터는 3V(volume, variety, velocity)로 정의되고 있는 빅데이터를 6V(volume, variety, velocity, value, veracity, visualization)의 빅데이터로 진화시키는 기반이라 할 수 있다. 공간빅데이터를 효과적으로 구축하기 위해서는 공간빅데이터체계 구축으로 추진되어야 하며, 공간빅데이터체계는 국가공간정보기반, 융합플랫폼, 서비스제공자, 생산요소제공자로서의 역할을 수행해야 한다. 이러한 공간빅데이터체계의 구성요소는 인프라(하드웨어), 기술(소프트웨어), 공간빅데이터(데이터), 인력, 법 제도 등이며, 공간빅데이터체계 구축을 위한 목표로 공간기반 정책수립 지원, 공간빅데이터 플랫폼 기반 산업활성화, 공간 빅데이터 융합기반 조성, 공간관련 사회현안의 적극적 해결로 제시하였다. 그리고 목표에 대한 추진전략은 범정부적 협력체계 구축, 신산업 창출 및 활용 활성화, 성과활용 중심의 공간빅데이터 플랫폼 구축, 공간빅데이터 관련 기술경쟁력 확보로 제시하였다.

Squall: 실시간 이벤트와 마이크로-배치의 동시 처리 지원을 위한 TMO 모델 기반의 실시간 빅데이터 처리 프레임워크 (Squall: A Real-time Big Data Processing Framework based on TMO Model for Real-time Events and Micro-batch Processing)

  • 손재기;김정국
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.84-94
    • /
    • 2017
  • 최근 다양하고 방대한 양의 데이터를 처리하기 위해 빅데이터의 특성인 5V(Volume, Variety, Velocity, Veracity, Value) 중에서도 속도(Velocity)의 중요성이 강조되면서 대량의 데이터를 빠르고 정확하게 처리하는 기술인 실시간 스트림 처리(Real-time Stream processing)를 위해 많은 연구가 진행되고 있다. 본 논문에서는 실시간 빅데이터 처리를 위해 대표적인 실시간 객체 모델인 TMO(Time-triggered Message-triggered Object) 개념을 도입한 Squall 프레임워크를 제시하고, 단일 노드에서 동작하는 Squall 프레임워크와 그 동작들에 대해 기술한다. TMO는 작업을 수행할 때, 특정 조건에 대해 실시간으로 처리하는 비주기적인 처리방법과 일정 시간 간격동안 주기적인 처리를 지원하는 객체 모델이다. 따라서 Squall 프레임워크는 실시간 빅데이터의 실시간 이벤트 스트림 및 마이크로-배치 처리를 동시에 지원하고, 기존 아파치 스톰과 스파크 스트리밍 대비 상대적으로 우수한 성능을 제공한다. 하지만 Squall은 대부분의 프레임워크에서 제공되는 다중 노드에서의 실시간 분산처리를 위한 추가적인 개발이 필요하다. 결론적으로, TMO 모델의 장점은 실시간 빅데이터 처리시 기존 아파치의 스톰이나 스파크 스트리밍의 단점들을 극복할 수 있다. 이러한 TMO 모델은 실시간 빅데이터 처리에 있어 유용한 모델로서의 가능성을 가지고 있다.