• 제목/요약/키워드: 빅데이터 수집

검색결과 1,012건 처리시간 0.036초

실시간 발전소 시설 장비 센서 데이터에 대한 빅데이터 스트리밍 질의 처리 시스템 설계 및 구현 (Design and Implementation of Big Data Streaming Query Processing System for Realtime Power Plant Sensor data)

  • 엄정호;유찬희;;박경석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.88-91
    • /
    • 2020
  • 발전 시설은 연간 무중단으로 운영되어야 하고, 고장이 발생하면 손해가 막대하기 때문에 발전 시설 장비에는 수십만 개의 센서 데이터가 설치되어 있다. 본 논문에서는 효율적인 센서 데이터의 수집과 시설 모니터링 및 고장 예측 등을 위한 빅데이터 스트리밍 질의 처리 시스템을 설계 및 구현하였다. 또한 실시간 데이터 수집의 효율적인 관리를 위해 인코딩 방식을 설계하였으며, 데이터 전송 성능을 측정하여 문자열로 데이터를 전송하는 것보다 평균 12%, 최대 32% 데이터 처리 성능이 향상됨을 보였다. 또한, 스트리밍 데이터에 대한 윈도우 질의 처리 성능을 측정하여 약 0.97초의 평균 집계 질의 처리 시간이 소요됨을 확인하였다. 향후에는 고장 감지를 위한 인공지능 추론 모델을 제안하는 빅데이터 스트리밍 질의 처리 시스템에 적용할 예정이다.

제조 빅데이터 시스템을 위한 효과적인 시각화 기법 (Effective visualization methods for a manufacturing big data system)

  • 류관희
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1301-1311
    • /
    • 2017
  • 제조 빅데이터 시스템은 제조 전 공정에서 관련된 4M 데이터의 수집, 저장, 관리, 예측적 분석을 통해 선제적 제조 활동 개선이 가능한 의사결정을 지원하고 있다. 이러한 시스템에서 데이터의 효율적인 관리와 운영을 위해 데이터를 효과적으로 시각화하는 것이 무엇보다도 중요하다. 본 논문에서는 제조 빅데이터 시스템에서 데이터 수집, 분석 및 예측 결과를 효과적으로 보여 주기 위해 사용가능한 시각화 기법을 제시한다. 본 논문에서 제시된 시각화 기법을 통해 제조 현장에서 발생하는 문제를 보다 손쉽게 파악할 수 있었을 뿐만 아니라 이들 문제를 효과적으로 대응할 수 있어 매우 유용하게 사용될 수 있음을 확인하였다.

빅데이터 분석을 통한 물환경 통합관리지표 적용방안 연구 (A study on the Application of Water Environment Integrated Management Index through Big Data Analysis)

  • 조부건;정우석;김영도
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.47-47
    • /
    • 2022
  • 최근 물순환 관리를 위하여 물순환 선도도시, 물순환 기본계획 등 물순환 연구가 진행되어지고 있다. 물순환 연구는 수문학적 물순환 개념에서 수량, 수질, 수생태, 농업, 지하수, 불투수 면적 등 수환경의 전반적인 부분에 걸쳐 개념이 확장되어지고 있다. 국내외에서는 이와같은 연구가 진행되어지고 있으며 기후변화에 대응하여 홍수, 가뭄등을 고려한 연구도 진행되어 지고 있다. 물순환의 범위가 넓어짐에 따라 수질, 수량, 수생태 등 수환경을 종합적으로 연계하여 연구할 필요가있다. 따라서 다양한 관점에서의 연구가 필요한 분야이다. 물순환은 기존의 수량적인 부분과 함께 수질, 수생태등 많은 분야 및 방대한 양의 자료가 적용되어 진다. 이는 빅데이터의 적용이 필수적이라고 할 수 있으며 통합물관리를 위한 빅데이터의 구축이 필수적이라고 판단된다. 빅데이터의 구축을 통해서 현재 수환경에 활용되어 지고 있는 평가지표를 수집하고 활용성을 분석하고자 한다. 지표 및 산정자료의 수집을 통해 통합물관리 빅데이터를 구축하고 선정된 지표를 적용하여 각 유역의 특성을 파악하고 문제점을 도출할 수 있는 통합물관리 지표의 적용성을 판단하고자한다. 기존에 활용되는 지수들은 각각의 분야만 산정이 가능하며 이를 통합적으로 산정할 필요가 있다. 본 연구에서는 통합물관리에서의 빅데이터의 적용성을 판단하고 선정된 통합관리지표가 유역의 물관리 상태를 판단하고 분석이 가능한 물환경 평가지표를 도출하고자 한다.

  • PDF

빅 데이터를 통한 개인 맞춤형 교육 시스템 설계 (A Design of the Personalized Training System Using Big Data)

  • 김민재;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.441-442
    • /
    • 2014
  • 최근 IT 시장에서는 빅 데이터가 새로운 패러다임으로 주목받으면서 모든 분야에서 빅 데이터를 활용하기 위해 많은 노력을 기울이고 있다. 빅 데이터를 활용한 스마트교육에서는 학생들의 모든 학습활동 자료가 쉽게 수집될 수 있을 뿐만 아니라 모든 학생의 자료 또한 수집이 가능하다. 빅 데이터를 통한 학습자 맞춤형 교육은 현재 진행되는 스마트 교육의 진정한 효과로써 나타날 수 있을 것으로 여겨진다. 따라서 본 논문에서는 학습자의 학업 성취도 향상의 요인인 학습 내용에 대한 관심과 흥미를 기준으로 분석한 빅 데이터를 활용하는 개인 맞춤형 교육 시스템을 설계하였다.

  • PDF

빅데이터 분석을 위한 스마트폰 사용 데이터 수집 앱 및 관리 프로그램 (Smartphone Usage Data Collection Application and Management Program for Big Data Analysis)

  • 조성민;오승현;안지우;이명숙
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.225-228
    • /
    • 2021
  • 본 연구는 스마트폰 중독과 관련된 다양한 분석을 위한 스마트폰 사용 앱과 관리자 웹을 개발하고자 한다. 연구방법으로 이전 연구에서 중요한 변수로 작용되었던 '화면 켠 횟수', '실사용시간-인지사용시간' 변수를 분석할 있도록 적용하여 스마트폰 사용시간, 사용량, 사용 앱, 화면 잠금을 해제한 횟수 등 다양한 데이터 수집이 가능한 앱을 개발한다. 관리자 웹은 수집된 데이터를 저장, 분석할 수 있는 공간으로 사용할 것이다. 앱에서 수집된 데이터는 서버에 전송한 후, 시각화 분석 기능을 제공하는 관리 프로그램으로 개발하여 스마트폰 중독 연구에 사용한다. 향후 데이터 수집과 사용 목적에 동의한 사용자를 모집하여 데이터를 수집하고 스마트폰 사용 패턴, 데이터마이닝, 중독 등과 관련된 다양한 분석을 할 것이다. 이를 통해 보다 정확하고 효과적인 스마트폰 중독 진단이 가능해질 것과 나아가 스마트폰 중독 치료방안 연구에 기여할 것으로 기대한다.

  • PDF

Mi Band와 MongoDB를 사용한 생체정보 빅데이터 시스템의 설계 (Design of Building Biomertic Big Data System using the Mi Band and MongoDB)

  • 이영훈;김용일
    • 스마트미디어저널
    • /
    • 제5권4호
    • /
    • pp.124-130
    • /
    • 2016
  • 빅데이터 기술의 발전에 따라 여러 분야에서 빅데이터의 필요성이 증가하고 있다. 그중 최근 의료 산업은 치료 중심에서 예방과 건강관리 중심으로 변화됨에 따라 질병 발생 가능성 예측 및 개인 맞춤형 의료 서비스의 중요성이 증대되고 있다. 이를 위해서는 개인의 생체정보를 수집할 수 있는 디바이스와 수집된 데이터를 분석할 빅데이터 시스템이 필요하다. 본 논문에서는 저가형 웨어러블 디바이스를 이용한 생체정보 빅데이터 시스템을 설계하였다. 웨어러블 디바이스는 심장 박동수와 걸음 수, 활동량 등의 기본적인 생체정보를 획득할 수 있는 Mi Band를 이용하였고, 수집된 생체정보는 MongoDB를 이용하여 NoSQL 형식으로 저장한 후 분석하였다. 본 연구의 결과를 기반으로 차후에는 Hadoop 등을 사용하여 실제 의료 환경에서 사용이 가능한 빅데이터 시스템을 구축하고 다양한 의료 정보용 웨어러블 디바이스와 연계하여 실제 의료 서비스에서 사용이 가능할 수 있다.

비정형 빅데이터 수집 모듈의 구현 및 비교 (Implementation and Comparison of Atypical Big-Data Collecting Modules)

  • 김정기;천요섭;김우생
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.631-634
    • /
    • 2014
  • 최근 스마트폰의 보급으로 블로그, SNS 등에서 방대한 양의 데이터가 발생함에 따라 이를 수집하고 분석하는 작업의 중요성이 커지고 있다. 이러한 데이터는 크게 정형 데이터와 비정형 데이터로 나눌 수 있는데, 특히 비정형 데이터는 전체 데이터의 약 80%를 차지할 정도로 그 양과 가치가 매우 크다. 이 논문에서는 빅데이터 환경에서 발생하는 이러한 비정형 데이터를 수집하는 모듈 중 가장 널리 알려진 Chukwa와 Flume에 대한 개발 및 비교 분석을 시도 하였다.

안전한 국방 빅데이터 프레임워크를 위한 Learned MAPE-K 기반 자료교환 시스템 (Data Exchange System Based on Learned MAPE-K for a Secure Defense Big Data Framework)

  • 조준하;유진용;김영갑
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.173-175
    • /
    • 2022
  • 국방 각급 부대는 망연계 자료교환 시스템에 의해 인터넷과 국방망을 연계하여 데이터를 수집하고 있다. 또한, 안전한 국방 데이터수집과 빅데이터 환경조성을 위해 악성코드를 내재한 데이터들을 차단 및 분류하는 데이터 검열을 수행한다. 그러나 수집되는 데이터들이 새로운 악성코드를 내재할 경우, 현재 운용되고 있는 국방 시스템으로 식별하는 것이 불가능하여 외부로부터의 보안위협이 존재한다. 따라서 본 논문에서는 새로운 악성코드 위협에도 대응할 수 있는 Learned MAPE-K 기반 자료교환 시스템을 제안한다.

빅데이터 분석을 통한 행정구역별 홍수 취약성 분석 (An Analysis of Flood Vulnerability by Administrative Region through Big Data Analysis)

  • 유영욱;성연정;박태경;정영훈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.193-193
    • /
    • 2021
  • 전 세계적으로 기후변화가 지속되면서 그에 따른 자연재난의 강도와 발생 빈도가 증가하고 있다. 자연재난의 발생 유형 중 집중호우와 태풍으로 인한 수문학적 재난이 대부분을 차지하고 있으며, 홍수피해는 지역적 수문학적 특성에 따라 피해의 규모와 범위가 달라지는 경향을 보인다. 이러한 이질적인 피해를 관리하기 위해서는 많은 홍수피해 정보를 수집하는 것이 필연적이다. 정보화 시대인 요즘 방대한 양의 데이터가 발생하면서 '빅데이터', '머신러닝', '인공지능'과 같은 말들이 다양한 분야에서 주목을 받고 있다. 홍수피해 정보에 대해서도 과거 국가에서 발간하는 정보외에 인터넷에는 뉴스기사나 SNS 등 미디어를 통하여 수많은 정보들이 생성되고 있다. 이러한 방대한 규모의 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원이 될 것이며, 홍수대비책으로 활용될 소중한 정보가 될 수 있다. 본 연구는 인터넷기반으로 한 홍수피해 현상 조사를 통해 홍수피해 규모에 따라 발생하는 홍수피해 현상을 파악하고자 하였다. 이를 위해 과거에 발생한 홍수피해 사례를 조사하여 강우량, 홍수피해 현상 등 홍수피해 관련 정보를 조사하였다. 홍수피해 현상은 뉴스기사나 보고서 등 미디어 정보를 활용하여 수집하였으며, 수집된 비정형 형태의 텍스트 데이터를 '텍스트 마이닝(Text Mining)' 기법을 이용하여 데이터를 정형화 및 주요 홍수피해 현상 키워드를 추출하여 데이터를 수치화하여 표현하였다.

  • PDF

자동화된 트위터 데이터 수집 시스템 설계 및 구현 : 환경 데이터를 중심으로 (Design and Implementation of Automated Twitter Data Collecting System : Focus on Environmental Data)

  • 김도형;구자환;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.361-364
    • /
    • 2020
  • 소셜 네트워크 서비스의 사용자가 늘어나면서, 소셜 네트워크 서비스상에서 발생하는 빅데이터를 활용한 서비스가 늘어나고 있다. 소셜 네트워크 서비스 데이터는 실시간으로 생성되며, 따라서 데이터 수집 시스템 역시 자동화하여 준 실시간으로 데이터를 수집할 필요가 있다. 본 논문에서는 대표적인 소셜 네트워크 서비스인 트위터의 데이터를 지속적으로 수집하기 위한 자동 수집 시스템을 제안한다. 수집 시스템은 Twitter API 를 활용하는 Python 라이브러리를 통해 내용 및 메타데이터를 수집하며, 수집된 데이터를 재 검증한 뒤 저장한다. 또한 구현된 시스템에 환경 데이터를 주제로 하는 쿼리를 입력하여 실제 트위터 데이터를 수집하며 구현된 시스템을 검증해보았다.