• Title/Summary/Keyword: 빅데이터 처리

Search Result 1,117, Processing Time 0.028 seconds

MapReduce-Based Partitioner Big Data Analysis Scheme for Processing Rate of Log Analysis (로그 분석 처리율 향상을 위한 맵리듀스 기반 분할 빅데이터 분석 기법)

  • Lee, Hyeopgeon;Kim, Young-Woon;Park, Jiyong;Lee, Jin-Woo
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.11 no.5
    • /
    • pp.593-600
    • /
    • 2018
  • Owing to the advancement of Internet and smart devices, access to various media such as social media became easy; thus, a large amount of big data is being produced. Particularly, the companies that provide various Internet services are analyzing the big data by using the MapReduce-based big data analysis techniques to investigate the customer preferences and patterns and strengthen the security. However, with MapReduce, when the big data is analyzed by defining the number of reducer objects generated in the reduce stage as one, the processing rate of big data analysis decreases. Therefore, in this paper, a MapReduce-based split big data analysis method is proposed to improve the log analysis processing rate. The proposed method separates the reducer partitioning stage and the analysis result combining stage and improves the big data processing rate by decreasing the bottleneck phenomenon by generating the number of reducer objects dynamically.

Multi-channel data connection and Real-time processing system designed for Big Data collection (빅데이터 수집을 위한 다채널 데이터 연계와 실시간 처리 시스템 설계)

  • Paik, Kyoung-Seok;Oh, Jae-Chel;Yang, Jae-Hyek
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2016.05a
    • /
    • pp.269-270
    • /
    • 2016
  • 빅데이터 분석을 통한 여러 산업 군과 융합으로 시너지를 발생시키기 위해서, 다양한 유형의 데이터 수집을 통해 빅데이터를 구성하는 것이 첫 번째 단계이며 기상, 교통, 인터넷 활동, 상권 등의 다양한 출처로부터 데이터 연계를 수행하고 사물인터넷과 같은 실시간으로 발생하는 로그 성 데이터 수집을 고려한 실시간 처리 시스템을 설계 하였다. 이를 통해 서로 다른 유형의 데이터가 빅데이터로 수집 되면 여러 산업 군에서 요구되는 인사이트 기반의 빅데이터 분석을 통해 B2B 또는 B2C 서비스에 응용 될 수 있다.

  • PDF

Construction of Hierarchical LOD Development Environment and Its Application of Medical Information (계층적 LOD 개발 환경 구축 및 의료 정보 적용)

  • Moon, Hee-Kyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.432-433
    • /
    • 2017
  • 최근 ICT 기술과 의료 빅데이터를 활용한 다양한 연구가 활발하게 진행되고 있다. 이질적인 의료데이터의 공유와 확산을 위해 표준화 데이터 모델로 온톨로지 기반의 Linked Open Data가 대안으로 급부상하고 있다. 특히 의료 빅데이터의 분석을 위한 데이터 셋은 프로토콜화하기 어려운 문제점을 갖고 있다. 본 논문에서는 이러한 문제점을 해결하기 개발된 계층적 LOD 개발 환경 시스템을 기반으로 의료정보를 적용하기 위한 모델링에 중점을 두고자 한다. 본 연구는 의료 빅데이터의 검색과 분석연구 분야에 큰 영향을 줄 것으로 기대하고 있다.

Big Data Conceptualization and Policy Design on Data Sovereignty (빅데이터의 개념적 논의와 데이터 주권에 대한 정책설계)

  • Moon, Hyejung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.911-914
    • /
    • 2013
  • 빅데이터가 이전의 대용량정보와 비교하여 어떠한 개념적인 의미를 지니는지 정책설계과정에 따라 이론적으로 논의하고, 이 시대 이슈가 되는 데이터 주권에 대하여 저작권과 CCL을 사례로 ICT정책의 설계방안을 제시한다. 사례분석의 결과 빅데이터 시대 데이터 주권에 대한 정책은 법, 시장, 기술, 규범 측면에서 균형 있게 설계되어야 하며 기술구조를 기초로 사회문제에 대한 규제구조를 설계하고 정책을 집행해야 한다.

A Study on Solutions for TCP Incast Problem (TCP Incast 문제 해결방안에 관한 연구)

  • Um, Jin-Yeong;Seok, Min-Su;Choi, Tae-Hwan;Ahn, Jong-Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.04a
    • /
    • pp.64-66
    • /
    • 2016
  • 대규모 데이터 센터는 클라우드 컴퓨팅을 가능하게 하고, 빅데이터 처리를 위해 널리 쓰이는 HDFS 혹은 MapReduce, Dryad와 같은 프레임워크는 분산 처리 환경에서 운영하는 것을 기반으로 설계되어 있어 일대일이 아닌 다대일 통신이 빈번히 발생한다. TCP Incast 문제는 다대일 통신에서 발생하는 문제로 단일 상위 서버에서 다수의 하위 서버로 일을 요청할 때, 요청된 결과가 단일 상위 서버로 동시에 응답할 때 발생한다. 기존의 분산 처리 환경에서는 작은 데이터를 처리하기 때문에 단일 상위 서버에서의 데이터 처리 부담이 적었다. 하지만 빅데이터를 처리하는 분산 처리 환경에서는 블록 단위의 큰 데이터를 처리하므로 데이터 처리 시간에 민감한 메시지 데이터에서 지연이 발생할 수 있다. 본 논문에서는 급격한 처리량 붕괴를 일으킬 수 있는 TCP Incast 문제 완화 알고리즘에 대하여 기술한다.

Time-series big data analytics software on IoT streaming data (빅데이터 기반 대용량 시계열 에너지 데이터 처리 시스템)

  • Kang, Jeonghoon;Yoo, June-Jae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.52-53
    • /
    • 2018
  • 본 논문은 에너지 빅데이터를 분석하기 위해 대용량의 시계열 데이터를 처리하는 시스템의 설계, 구축 방법을 제시한다. 이미 사용 중인 건물이나 공장의 에너지 효율화를 위해서 정부는 효율자원 시장 지원 사업을 수행하고 있다, 에너지 소비 설비에 따라 고효율 자원으로 변경 설치하는 데 필요한 자금의 일부를 지원하고 있다. 정부지원으로 고효율 설비로 변경함에 따라 실증 사이트에서는 측정 데이터를 수집하여, 효율화 정도를 파악하기 위한 에너지 데이터 분석 시스템을 구축하여 운영하였다. 해당 측정 정보는 IoT 전력량계를 통해 수집되며, 수집된 데이터는 클라우드 시스템에서 다양한 머신러닝 알고리즘에 적용되어, 에너지 소비 효율 평가에 필요한 성능 지표를 연산한다. 구현된 진단 시스템은 기축 건물의 에너지 효율향상 상황을 분석하는데 기여할 수 있다. 빅데이터 기반의 에너지 분석 기능을 사용하여 에너지 고효율 장비의 운영시간, 부하율 등의 효율성과 성능통계를 연산할 수 있다.

NoSQL-based Distributed Processing System for Processing BigData Security Events (빅데이터 보안이벤트 처리를 위한 NoSQL 기반 분산 처리 시스템)

  • Han, HyoJoon;Kang, JiWon;Jung, Yong-Hwan;Kim, Yangwoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.90-93
    • /
    • 2017
  • 인터넷과 클라우드 서비스 사용이 증가하면서 패킷의 양과 사이버 위협이 증가하였다. 본 논문에서는 빅데이터를 처리하기 위해 사용되는 NoSQL을 보안이벤트의 신속한 처리를 위한 침입탐지시스템에 적용하였다. 다양한 데이터 모델 유형의 NoSQL 데이터베이스 중에서 빅데이터 보안이벤트를 처리하는데 가장 적합한 시스템을 찾기 위해 세 가지 유형의 Snort 룰 기반 보안이벤트 분산 처리 프로토타입 시스템들을 구축하였고 각 시스템의 성능을 평가하였다. 그 결과로 MongoDB 기반의 보안이벤트 분산 처리 시스템이 가장 속도가 빠른 것을 확인하였다.

Managing Metadata of Big Data Sensing Objects (빅데이터 센싱 객체 메타데이터 관리)

  • Jeong, Dongwon;Lee, Seokhoon;Jung, Hyunjun;Jeon, Keun-Hwan;On, Byung-Won;Kim, Young-Gab
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.804-807
    • /
    • 2016
  • 빅데이터 분야에 대한 다양한 연구가 활발하게 진행됨에 따라 표준화에 대한 요구가 증가하고 있다. 이러한 요구를 충족하기 위해 최근 ISO/IEC JTC 1 산하 표준화 위원회를 중심으로 빅데이터 표준화에 대한 연구가 활발하게 진행되고 있다. 그러나 아직까지 구체적인 기술 측면에서의 표준화는 미비한 상황이다. 이 논문에서는 기존 표준화 연구 내용을 간략하게 조망하고 빅데이터 센싱 객체 관리 측면에서의 표준화 방안에 대하여 논의한다. 이 논문은 향후 빅데이터 분야, 특히 빅데이터를 생성하는 센싱 객체의 규범적인 관리를 위한 표준 개발에 기여할 것으로 기대된다.

해상교통관제 시스템의 빅데이터 처리 방안에 대한 고찰

  • Kim, Seok-Jae;Lee, Sang-Won
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2015.07a
    • /
    • pp.348-350
    • /
    • 2015
  • VTS 센터는 선박관제를 위해서 생성하는 실시간적인 해상교통정보를 생성하고 잇으며, 항만물류정보, 해양기상정보, 조선소 시운전 정보, 해상교통 환경정보, 선종별 운항정보, 사고 선박정보, 준사고 선박정보, 기타 정보 등을 수집하여 선박의 통항관제에 활용하고 있음에 따라 해상교통관제 시스템에 수집된 빅데이터의 처리방안에 대하여 고찰해 보았다.

  • PDF

A Big data platform through MBTI personality type classification (MBTI 성격유형 분류를 통한 빅데이터 플랫폼)

  • Jin, Kyung-Jae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.503-505
    • /
    • 2021
  • 정보통신 기술(ICT)의 발달로 이루어진 4 차 산업혁명으로 '빅데이터'의 시대가 도래하고 있다. 소셜 네트워크 서비스(SNS), 사물인터넷(IOT), 인공지능(AI) 등 다양한 장소에서 다양한 형태로 데이터들이 쌓이고 있다. 그중 MBTI 성격유형 검사를 통한 다양한 분석 시스템이 많아지고 있다. 사람들은 재미를 위해 자신의 성향을 입력하고 정해진 MBTI 검사 기준을 통해 결과를 받는다. 이러한 개개인의 성향 데이터를 모으면 거대한 빅데이터 플랫폼을 만들 수 있을 것이라 기대한다. 이에 본 논문은 구체적인 방안을 제시하고자 한다.