• 제목/요약/키워드: Distributed Data Analysis

검색결과 2,340건 처리시간 0.028초

빅데이터 처리시간 감소와 저장 효율성이 향상을 위한 맵리듀스 기반 빅데이터 처리 기법 구현 (Implement of MapReduce-based Big Data Processing Scheme for Reducing Big Data Processing Delay Time and Store Data)

  • 이협건;김영운;김기영
    • 한국융합학회논문지
    • /
    • 제9권10호
    • /
    • pp.13-19
    • /
    • 2018
  • 맵리듀스는 하둡의 필수 핵심 기술로 하둡 분산 파일 시스템을 기반으로 빅데이터를 처리하는 가장 보편화되어 사용되고 있다. 그러나 기존 맵리듀스 기반 빅데이터 처리 기법은 하둡 분산 파일 시스템에 정해진 블록의 크기대로 파일 나눠 저장되는 특징으로 인해 인프라 자원의 낭비가 극심하다. 이에 본 논문에서는 효율적인 맵리듀스 기반 빅데이터 처리기법을 제안한다. 제안하는 기법은 처리할 데이터를 사전에 맵리듀스에서 처리하기 적합한 데이터 형태로 변환 및 압축하여 빅데이터 인프라 환경의 저장 효율성을 증가시킨다. 또한 제안하는 기법은 저장 효율성을 중점으로 구현했을 때 발생할 수 있는 데이터 처리 시간의 지연 문제를 해결한다.

원자력 발전소 제어계통을 위한 네트워크의 해석과 사례 연구 (Analysis of a network for control systems in nuclear power plants and a case study)

  • 이성우;임한석
    • 제어로봇시스템학회논문지
    • /
    • 제5권6호
    • /
    • pp.734-743
    • /
    • 1999
  • In this paper, a real-time communication method using a PICNET-NP(Plant instrumentation and Control Network for Nuclear Power plant) is proposed with an analysis of the control network requirements of DCS(Distributed Control System) in nuclear power plants. The method satisfies deadline in case of worst data traffics by considering aperiodic and periodic real-time data and others. In addition, the method was used to analyze the data characteristics of the DCS in existing nuclear power plant. The result shows that use of this method meets the response time requirement(100ms).

  • PDF

최적화 기법과 분산 컴퓨팅을 이용한 재료 성형공정의 역문제에 관한 연구 (A Study on Inverse Problem of Materials Forming Process using Optimization Technique and Distributed Computing)

  • 최주호;오동길;하덕식;김준범
    • 대한기계학회논문집A
    • /
    • 제28권5호
    • /
    • pp.632-639
    • /
    • 2004
  • In this paper, an inverse problem of glass forming process is studied to determine a number of unknown heat transfer coefficients which are imposed as boundary conditions. An analysis program for transient heat conduction of axi-symmetric dimension is developed to simulate the forming and cooling process. The analysis is repeated until it attains periodic state, which requires at least 30 cycles of iteration. Measurements are made for the temperatures at several available time and positions of glass and moulds in operation. Heat removal by the cooling water from the plunger is also recorded. An optimization problem is formulated to determine heat transfer coefficients which minimize the difference between the measured data and analysis results. Significant time savings are achieved in finite difference based sensitivity computation during the optimization by employing distributed computing technique. The analysis results by the optimum heat transfer coefficients are found to agree well with the measured data.

에너지신산업을 위한 에너지 빅데이터 전처리 시스템 (Energy Big Data Pre-processing System for Energy New Industries)

  • 양수영;김요한;김상현;김원중
    • 한국전자통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.851-858
    • /
    • 2021
  • 재생에너지 및 분산자원의 증가로 에너지신산업에서는 전통적인 데이터뿐만 아니라 다양한 에너지 관련 데이터들이 생성되고 있다. 즉 다양한 재생에너지 설비와 발전 데이터, 계통 운영 데이터, 계량 및 요금 관련 데이터뿐만 아니라 새로운 서비스와 분석을 위해 필요한 기상 및 에너지 효율화 데이터 등이 있다. 에너지 빅데이터 처리 기술은 분산자원, 계통, AMI(: Advanced Metering Infrastructure)를 포함한 전력 생산·소비 인프라의 전반기에서 발생하는 데이터를 체계적으로 분석 ·진단할 수 있다. 이를 통해 ICT(: Information and Communications Technology)산업과 에너지 산업 간 융복합의 새로운 비즈니스 창출을 지원하는 기술이 될 수 있을 것이다. 이를 위해서 수집된 데이터의 항목별 특성 분석 및 연관관계 표본 추출과 각 특징들의 범주화 및 요소 정의 등 데이터 분석 시스템에 대한 연구가 필요하다. 또한 데이터의 손실 및 이상 상태 처리를 위한 데이터 정제 기술에 대한 연구가 이루어져야 한다. 그리고 에너지 데이터를 실시간으로 저장 및 관리할 수 있도록 Apache NIFI, Spark, HDFS(: Hadoop Distributed File System)에 대한 개발 및 구축이 필요하다. 본 연구에서는 위와 같은 다양한 전력거래를 위한 전반적인 에너지 데이터 처리 기술과 시스템를 제안하였다.

감성분석을 위한 병렬적 HDFS와 맵리듀스 함수 (A Parallel HDFS and MapReduce Functions for Emotion Analysis)

  • 백봉현;류윤규
    • 한국정보컨버전스학회논문지
    • /
    • 제7권2호
    • /
    • pp.49-57
    • /
    • 2014
  • 최근 대량의 SNS(Social Network Service) 데이터로부터 유용한 정보를 추출하고 사용자의 진의 정보를 평가하기 위한 오피니언 마이닝(opinion mning)이 소개되고 있다. 오피니언 마이닝은 대량의 SNS 데이터로부터 빠른 기간 내에 데이터를 수집하고 분석하여 목적에 적합한 정보를 추출하는 효율적인 기법이 필요하다. SNS에서 발생되는 다양한 비정형 데이터로부터 감성정보를 추출하기 위해, 본 논문에서는 하둡(Hadoop) 시스템 기반의 병렬적 HDFS(Hadoop Distributed File System)와 맵리듀스(MapReduce) 기반 감성분석 함수를 제안한다. 실험결과로 제안한 시스템과 함수는 데이터 수집과 적재시간에 대해 O(n)보다 빠르게 처리하며, 메모리와 CPU 자원에 대해 안정적인 부하분산이 이루어지는 것을 확인하였다.

  • PDF

Designing of Multi-tier GIS Architecture for Distributed Network Environment

  • Nie, Yoshinori;Nakamura, Morikazu;Miyagi, Hayao;Onaga, Kenji
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -1
    • /
    • pp.541-544
    • /
    • 2000
  • This paper presents a multitier GIS architecture to adapt to large-scale distributed networks and to improve data transfer performance with intelligent caching technique. We design this system using UML based on object-oriented analysis. We show some advantages in our proposed system against the ordinary GIS, in special, suitability to distributed networks.

  • PDF

Performance Optimization of Big Data Center Processing System - Big Data Analysis Algorithm Based on Location Awareness

  • Zhao, Wen-Xuan;Min, Byung-Won
    • International Journal of Contents
    • /
    • 제17권3호
    • /
    • pp.74-83
    • /
    • 2021
  • A location-aware algorithm is proposed in this study to optimize the system performance of distributed systems for processing big data with low data reliability and application performance. Compared with previous algorithms, the location-aware data block placement algorithm uses data block placement and node data recovery strategies to improve data application performance and reliability. Simulation and actual cluster tests showed that the location-aware placement algorithm proposed in this study could greatly improve data reliability and shorten the application processing time of I/O interfaces in real-time.

위성 데이터 분산처리 시스템 최적화 및 안정화 (Optimization and Stabilization of Satellite Data Distributed Processing System)

  • 최윤수;이원구;이민호;김선태;이상환
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권11호
    • /
    • pp.13-21
    • /
    • 2013
  • 본 논문은 다양한 분야에서 활용되고 있는 초기의 위성 데이터가 자체적으로 내포하고 있는 많은 왜곡 요소(구름, 광휘 등)에 대한 보정 작업을 클러스터에서 분산 처리함으로써 성능 향상 및 안정성을 제공해 주는 것이 목적이다. 이를 위해 로컬 스토리지와 상태 테이블을 이용한SGE(Sun Grid Engine) 기반 분산 처리 방식을 제안하였고, 시스템으로 구현하였다. 이를 검증하기 위해 7개의 실행노드를 이용한 실험 결과에서는 기존 시스템보다 138.81%의 성능 향상을 가져옴을 알 수 있었으며, 분산 처리 작업에 대한 안정성 또한 확보됨을 보여주었다. 이는 위성 데이터에 대한 분산 처리 작업이 I/O바운드 작업보다는 CPU 바운드 작업에 보다 더 적합하다는 것을 보여주며, 이러한 SGE 기반 분산 처리 방식은 위성영상 데이터를 처리해야하는 다양한 분야에서의 데이터 처리 및 분석 속도 향상을 가져올 수 있고, 더 나아가 근실시간적 서비스를 가능하게 할 것으로 기대한다.

분산 인 메모리 DBMS 기반 병렬 K-Means의 In-database 분석 함수로의 설계와 구현 (Design and Implementation of Distributed In-Memory DBMS-based Parallel K-Means as In-database Analytics Function)

  • 구해모;남창민;이우현;이용재;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권3호
    • /
    • pp.105-112
    • /
    • 2018
  • 데이터의 양이 증가하면서 단일 노드 데이터베이스로는 저장과 처리를 동시에 수행하기에는 부족하다. 따라서, 데이터를 분산시켜 복수 노드로 구성된 분산 데이터베이스에 저장되고 있으며 분석 역시 효율성을 위해 병렬 기능을 제공해야한다. 전통적인 분석 방식은 데이터베이스에서 분석 노드로 데이터를 이동시킨 후 분석을 수행하기 때문에 네트워크의 비용이 발생하며 사용자가 분석을 위해 분석 프레임 워크도 다를 수 있어야한다. 본 연구는 군집화 분석 기법인 K-Means 군집화 알고리즘을 관계형 데이터 베이스와 칼럼 기반 데이터베이스를 이용한 분산 데이터베이스 환경에서 SQL로 구현하는 In-database 분석 함수로의 설계와 구현 그리고 관계형 데이터베이스에서의 성능 최적화 방법을 제안한다.

분산 객체지향 소프트웨어를 위한 수정 영향 분석 (Change Impact Analysis for Object-Oriented softwares in the distributed environment)

  • 김경희;박재년;윤용익
    • 한국정보처리학회논문지
    • /
    • 제6권5호
    • /
    • pp.1280-1290
    • /
    • 1999
  • 기존의 수정 영향 분석은 단일 환경을 기반으로 하기 때문에 분산 환경에 직접 적용하기 어렵다. 본 논문에서는 분산 환경에서 객체지향 소프트웨어의 수정 영향을 분석한다 객체지향 소프트례어의 수정을, 자료, 매소드, 클래스의 집합으로 구분 하여 수정 영향을 분석하였으며, 분석 결과를 DPDG(Oistributed Program Dependency Graph)에 표현하였다. DPDG는 분산 환경에서의 객체지향 소프트웨어들의 관계를 메소드, 자료요소, 클래스, 설계 문서, 서버 등을 사용하여 그래프에 표시한다 DPG는 소프트웨어에 수정 발생 시, 재시험하여야하는 소프트웨어 요소를 찾기 위한 그래프이다 따라서, DPDG를 통해 재 시험에 드는 노력을 절약할 수 있다 본 논문에서는,OPDG를 통해 발견된 절약된 재시험 요소를 방화벽 테이블로 나타내었 으며, 이를 구현하여 본 논문에서 설계한 시험 지원도구 VIST(Visua! Infonnation Structure Tester)에서 사용하였다. VIST 는 절약된 방화벽을 사용하여, 분산 객체지향 소프트웨어 시험에 드는 노력과 비용을 절약하는 도구이다.

  • PDF