• 제목/요약/키워드: 실시간 데이터 분석

검색결과 2,581건 처리시간 0.051초

확장형 실시간 데이터 파이프라인 시스템 아키텍처 설계 (Design of Extended Real-time Data Pipeline System Architecture)

  • 신호승;강성원;이지현
    • 정보과학회 논문지
    • /
    • 제42권8호
    • /
    • pp.1010-1021
    • /
    • 2015
  • 빅데이터 시스템은 대규모 로그 데이터를 수집하는 용도로 광범위하게 사용되고 있기 때문에 높은 성능을 갖는 것이 매우 중요하지만, 현재의 Hadoop 기반의 빅데이터 시스템은 중복 처리로 인하여 낮은 성능을 갖는 아키텍처적인 문제를 가지고 있다. 본 논문은 아키텍처 설계 개선을 통하여 Hadoop 기반 시스템의 낮은 성능 문제를 해결한다. 새로운 제안 아키텍처는 기존 아키텍처의 배치(Batch) 기반의 데이터 수집 방식을 개별처리 방식과 혼합한 수집 방법을 사용하고, 수집하는 데이터를 In-Memory 상에서 직접 분석하여 중복 처리를 배제하여 높은 성능을 제공하게 한다. 또한 제안 아키텍처는 기존 Hadoop 기반 아키텍처의 장점인 시스템 확장성을 가진다. 본 논문은 제안 아키텍처가 테스트 베드 환경에서 기존 아키텍처보다 데이터의 분석 처리 속도가 30%~35% 빠르고 확장성도 가진다는 것을 확인하였다.

HDTV 데이터 편집을 위한 고속 실시간 대규모 데이터 저장 시스템의 설계 (Design of High Speed , Real-time , and Large Scale Data Storage System for Editing HDTV Data)

  • 이찬수;성영락;오하령
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권2호
    • /
    • pp.223-235
    • /
    • 1999
  • 본 논문에서는 HDTV 데이터를 입출력할 수 있는 고속 실시간 데이터 저장 시스템을 제안한다. 이 시스템은 ⅰ) 방대한 크기를 HDTV 데이터를 고속으로 입출력할 수 있어야 한다. ⅱ)데이타를 연속적으로 입출력할 수 있는 것 외에 데이터를 비선형적으로 랜덤하게 억세스 할 수 있어야 한다. ⅲ)실시간으로 데이터를 재생하기 위해 일정하게 주어진 시스템 입출력 속도를 항상 만족할수 있어야 한다. 이러한 조건을 만족시키기 위해서 여러 개의 하드디스크를 병렬로 연결하고 데이터들을 각각의 하드디스크에 나누어 저장하였다. 하드디스크의 입출력 성능은 하드디스크 아암의 탐색 동작에 의해 크게 좌우되므로 탐색 동작을 효과적으로 제어할 수 있는 방법이 설계되었다. 제안된 시스템은 주제어부, 데이터 분배부, 종제어부로 나뉘며 각각의 하드디스크는 독립도니 종제어부에 의해 제어된다. 제안된 시스템이 주어진 요구사항을 만족하는지를 확인하기 위하여, 제안된 시스템을 DEVS 형식론을 이용하여 구현하고 시뮬레이션 하였다. DEVS 형식론은 이산사건 시스템을 계층적이고 모듈화된 형태로 기술한다. 시뮬레이션 과정에서 발생된 사건들을 분석하였다. 그 결과 제안된 시스템이 주어진 요구사항을 잘 만족함을 보았다.

클라우드 기반의 생산설비 데이터 수집 및 분석 시스템 개발 (Development of Cloud based Data Collection and Analysis for Manufacturing)

  • 이영동
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.216-221
    • /
    • 2022
  • 4차산업혁명은 사회 전반에 걸쳐 디지털 혁신으로의 전환을 가속화하고 있으며, 제조업에서는 스마트공장을 비롯해 4차산업혁명 기반 제조업 혁신을 위한 노력이 이어지고 있다. 제조업에서의 4차산업혁명 기술의 접목은 AI, 빅데이터, IoT, 클라우드, 로봇 등을 활용해 기존 자동화에서 업그레이드된 생산설비 데이터 수집 및 분석시스템 구축과 제품 불량 원인 파악 및 불량률을 최소화하기 위한 기술개발이 요구된다. 본 논문에서는 생산설비 현장에서의 전력, 환경, 설비 상태 데이터를 IoT 디바이스를 통해 수집하고, 수집한 데이터를 클라우드 컴퓨팅 환경에서 실시간으로 수치화하여 나타내고 위젯을 활용하여 MQTT기반 실시간 인포그래픽 형태로 표시할 수 있는 시스템을 구현하였다. IoT 디바이스로부터 전송된 실시간 센서 데이터를 Rest API 방식으로 클라우드 서버에 저장하고, 대시보드에서 데이터를 원격에서도 모니터링이 가능함은 물론 시간별, 일자별로 분석이 가능하였다.

에너지 빅데이터를 수용하는 빅데이터 시스템 개발 (Development of Big Data System for Energy Big Data)

  • 송민구
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권1호
    • /
    • pp.24-32
    • /
    • 2018
  • 본 논문은 산업 현장과 민간에서 실시간으로 수집되는 에너지 빅데이터를 수용하는 빅데이터 시스템을 제안한다. 구축된 빅데이터 시스템은 하둡(Hadoop) 기반이며, 빅데이터 처리에 있어 인메모리(in-memory) 분산처리 컴퓨팅을 지원하는 스파크(Spark) 프레임워크가 동시에 적용되었다. 본문에서는 지역난방에 사용되는 열에너지 형태의 빅데이터에 초점을 두어, 입출력되는 에너지의 특성을 고려하며 실시간 수집되는 빅데이터를 적재, 관리, 처리 및 분석하는 방법을 다룬다. 이 때, 외부에서 유입되는 빅데이터는 시스템 내부에 설계된 관계형 데이터베이스 스키마에 따라 저장하고 관리되며, 저장된 빅데이터는 설정된 목적에 따라 처리하고 분석된다. 제안된 빅데이터 시스템과 더불어 지역난방과 관련한 복수의 실증현장으로부터 실시간으로 수집되는 열에너지 빅데이터에 대해 시스템이 활용된 사례를 기술한다.

환경방사능 데이터 분석을 위한 실시간 환경 감시차량 관제 시스템 구축 (Development of Geographical Information System for the Realtime Environmental Radioactivity Monitoring)

  • 손호웅;김인현;이윤;김영우
    • 지구물리
    • /
    • 제7권1호
    • /
    • pp.61-72
    • /
    • 2004
  • 실시간으로 수집된 환경방사능 데이터 및 차량위치정보를 무선통신망을 통해 전송 받아 지도 상에 표출하고 핵종별 수집시간대별 분석 및 차량 위치별 수집데이터 분석 등의 통계분석기능과 결과물의 문서출력기능을 지원하고 다수의 감시차량 관제 및 관리가 가능한 서버 클라이언트 환경의 환경방사능 감시 차량관제 시스템을 개발하였다

  • PDF

인터넷에서 실시간 스트리밍 제어를 위한 피드백 정보 특성분석 (Analysis on the characteristics of feedback information for control real-time streaming in the internet)

  • 신상철;노병희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.63-66
    • /
    • 2003
  • 실시간 멀티미디어의 전송시 네트워크의 상황에 따라서 서비스의 품질이 급변하게 된다. 이 경우 QoS를 보장하기 위해서 일반적으로 피드백에 의한 제어방법을 사용하게 된다 본 논문에서는 UDP 패킷 전송실험을 통하여 실시간 멀티미디어 전송에서의 QoS를 보장하기 위한 피드백 정보의 이용가능성에 대해 살펴보고 실험 데이터를 여러 가지 각도로 분석해보았다. 피드백 정보의 문제점을 살펴보고 개선방안을 제시하였다.

  • PDF

IoT 센서로 수집한 수전 설비의 온도 데이터를 이용한 오류 빅데이터 분석 (Error Analysis for Temperature Big Data of Hydropower Collected by IoT sensors)

  • 주은진;홍장의
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.553-555
    • /
    • 2017
  • 수전 설비 시스템은 전력 회사에서 3 상 전원을 받는 설비로, 전기를 공급받기 위한 설비이다. 정전이나 제품생산설비의 중단은 기업에 있어서는 경제적 손실이 매우 큰 사고일 수 밖에 없다. 요즘은 IoT 센서를 이용한 수전설비 관리 시스템의 활용이 늘어나고 있는 추세이다. IoT 센서를 이용한 수전 설비의 구축에서 정확한 상태 값의 센싱과 수집된 값의 전송, 그리고 정확성 판단에 대한 이슈들이 고려되어야 하며, 또한 기기간 통신을 통해 실시간 상호작용으로 수전설비의 고장을 어떻게 예방할 것인가에 대한 것이 중요하다. 본 연구에서는 수전 설비의 실시간 감지와 모니터링을 위한 목적으로 기존의 고장 및 오류 정보를 기반으로 하는 빅데이터 분석을 통해 발생 가능한 고장 및 오류를 사전 예측할 수 있도록 정보를 제공하는 것에 주안점을 두었다.

웹 로그 데이터의 OLAP 연산을 위한 희박성 분석 (Web Log Data Sparsity Analysis for OLAP)

  • 김지현;용환승
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.58-60
    • /
    • 2001
  • 하루에도 수십 수백 메가 바이트까지 증가하는 웹 로그 데이터를 이용하여 실시간에 다차원분석을 가능하게 하기 위해서는 OLAP의 적용이 필요하다. 하지만 OLAP을 적용하는데 있어서 빠른 응답시간을 얻기 위해 사전처리(Precomputation)를 수행 할 시 심각한 데이터의 희박성으로 인해 데이터 폭발 현상이 발생된다. 본 논문에서는 실제 웹 로그 데이터를 사용하여 OLAP적용 시 희박성을 일으키는 원인들을 밝히고, 2, 3 차원에서의 희박성 형태를 분석함으로써 웹 로그 데이터의 희박성 처리 방식 및 성능평가에 기반이 되게 한다.

  • PDF

대용량 데이터 스트림을 처리하는 과학계산 응용을 위한 효율적인 데이터 이동 기법 (Efficient Data Movement for Scientific Application Processing Large Size Data Stream)

  • 변은규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.170-173
    • /
    • 2015
  • 대규모 실험장비에서 발생하는 아주 큰 사이즈의 데이터를 처리하기 위해서 기존에는 수집 및 저장, 계산 장비로의 원거리 전송, 데이터 분석 등의 단계를 따로 처리해 왔다. 데이터의 양이 폭발적으로 증가하고 있고 동시에 데이터의 실시간 처리 요구가 증가하는 상황이다. 이에 본 연구에서는 추상화된 입출력 계층을 이용하여 마치 로컬 저장소에 있는 데이터를 사용하는 것과 같은 인터페이스를 통해 원거리에서 생성된 데이터 스트림을 실시간으로 이동하고 처리할 수 있는 기법을 소개한다. 또한 데이터 전처리 계산 위치를 송신 측으로 변경하여 대용량 데이터를 효과적으로 전송하기 기법을 제안한다.

동적으로 변화하는 정보에 대한 모니터링 및 적응적 변화 예측 (Monitoring and adaptive prediction of the dynamically changed information)

  • 박대욱;이원석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.230-232
    • /
    • 2007
  • 최근의 온라인 응용 환경에서는 다양한 종류의 데이터 스트림을 다루고 있으며 이러한 데이터 스트림은 빠른 속도로 무한히 생성되고 실시간의 빠른 처리를 필요로 한다. 따라서 데이터 스트림 실시간 처리 및 분석 작업에서는 데이터 스트림을 지속적으로 모니터링하여 앞으로의 변화와 이에 따른 부하를 예측하고 성능을 조절하는 일이 필요하다. 본 논문에서는 끊임없이 발생하는 데이터를 관찰하여 데이터가 발생하는 패턴을 찾아내고, 찾아낸 패턴을 기반으로 미래의 특정 시점에서 발생할 데이터 값을 미리 예측하는 효율적인 기법을 제안한다. 무한한 양의 데이터를 제한된 크기의 메모리 내에서 처리하여 현재부터 과거 특정시점까지 발생한 데이터의 패턴을 가장 정확히 일반화할 수 있는 함수를 찾아내고 그 함수를 기반으로 미래에 발생할 데이터의 값을 예측한다.