• 제목/요약/키워드: Big Data enabled

검색결과 32건 처리시간 0.03초

교통 빅데이터의 효율적 저장 및 검색 기술의 설계와 구현 (Design and Implementation of Efficient Storage and Retrieval Technology of Traffic Big Data)

  • 김기수;이재진;김홍회;장유림;함유근
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.207-220
    • /
    • 2019
  • 최근 정보통신기술의 발달은 센서를 바탕으로 수많은 데이터를 구축하고 이를 이용하여 실시간 서비스를 제공할 수 있게 한다. 교통안전공단에서는 디지털 운행기록계를 통해 전국의 상용차의 운행 정보를 수집하고 있다. 전국 상용자의 운행 정보는 교통 분야에서 다방면으로 활용이 가능하다. 그 중 특히 자율주행 분야에서는 실시간으로 운행정보를 분석하여 위험 운전에 대응을 하거나 방지하는데 도움을 줄 수 있다. 그러나 전통적인 데이터베이스 시스템을 이용하여 대용량의 데이터를 실시간 서비스에 적합한 수준의 성능으로 처리하는 데는 한계가 존재한다. 특히 국내에서는 이와 같은 기술적인 문제로 상용차 운행정보의 실시간 분석을 위한 대규모 교통 빅데이터의 처리가 이전에 시도된 적이 없다. 이런 문제를 해결하기 위해 본 연구에서는 새로운 방식의 데이터베이스 서버 시스템 최적화를 진행하였고 실시간 서비스가 가능한 수준임을 확인하였다. 구축된 데이터베이스 시스템을 이용하여 디지털 트윈, 자율주행환경을 마련하기 위한 기반 데이터를 확보할 수 있을 것으로 기대된다.

  • PDF

Comparison of time series clustering methods and application to power consumption pattern clustering

  • Kim, Jaehwi;Kim, Jaehee
    • Communications for Statistical Applications and Methods
    • /
    • 제27권6호
    • /
    • pp.589-602
    • /
    • 2020
  • The development of smart grids has enabled the easy collection of a large amount of power data. There are some common patterns that make it useful to cluster power consumption patterns when analyzing s power big data. In this paper, clustering analysis is based on distance functions for time series and clustering algorithms to discover patterns for power consumption data. In clustering, we use 10 distance measures to find the clusters that consider the characteristics of time series data. A simulation study is done to compare the distance measures for clustering. Cluster validity measures are also calculated and compared such as error rate, similarity index, Dunn index and silhouette values. Real power consumption data are used for clustering, with five distance measures whose performances are better than others in the simulation.

차륜 및 차축베어링 고장진단을 위한 빅데이터 기반 머신러닝 기법 연구 (A Study of Big data-based Machine Learning Techniques for Wheel and Bearing Fault Diagnosis)

  • 정훈;박문성
    • 한국산학기술학회논문지
    • /
    • 제19권1호
    • /
    • pp.75-84
    • /
    • 2018
  • 본 철도 유지보수 산업의 효율화를 위해서는 핵심부품의 적시 관리를 통한 부품 가동률 향상 및 철도 운행의 안정성 향상이 필요하다. 또한 유지보수 시스템 고속화에 따른 신뢰성 향상과 핵심부품의 유지보수 비용 절감의 두 가지 측면을 모두 만족시키기 위해, 부품 이력관리와 대규모 빅데이터의 자동화된 분석 기술을 활용한 부품 상태 진단 기술 수요가 증가하고 있다. 이 논문에서는 철도차량의 차상 및 지상 장치로부터 발생되는 실시간 빅데이터 수집, 처리, 분석을 위해서 빅데이터 플랫폼 기반의 철도차량 부품의 상태 데이터 관리시스템을 개발하였으며, 이 시스템의 활용으로 철도차량의 부품 상태정보 및 시스템 리소스에 대한 실시간 모니터링이 가능하다. 또한 빅데이터 플랫폼으로부터 수집된 상태 데이터를 기반으로 분산/병렬처리 및 자동화된 부품 고장진단이 가능한 머신러닝 기법을 제안하였다. 실험결과, 분산/병렬처리 기술이 적용된 알고리즘의 실행시간 단축을 아마존 웹서비스의 가상 인스턴스 생성 시스템을 통해 증명하였으며, random forest 머신러닝 기법을 활용한 고장 진단 모델의 베어링 및 차륜 부품에 대한 상태 예측 정확도가 83%임을 확인하였다.

지역중심의 스마트관광 생태계 지원 서비스 플랫 (Service Platform of Regional Smart Tour Ecosystem Support)

  • 원달수
    • 문화기술의 융합
    • /
    • 제4권4호
    • /
    • pp.31-36
    • /
    • 2018
  • 광 산업은 국가 경제 활성화에 지대한 영향력을 갖고 있으며, IT기술의 발전은 관광객의 특성, 행위, 구매 성향, 관심사 등에 기반한 개인 프로파일 정보 및 위치정보, 활동정보 등의 수집과 분석이 가능해졌다. 이를 구현하기 위해 융합형 스마트관광 정보 서비스 플랫폼 구현은 3단계로 나누어 비지니스 모델 개발, IoT & 빅데이터 통합관리 시스템, 빅데이터 알고리즘 개발 및 분석 플랫폼 개발로 완성된다. 플랫폼 및 알고리즘의 원천기술은 오픈소스를 채택하고 그 기반위에 서비스 요소를 확장한 후, 지역을 연계한 Test-Bed 실증 시험을 통해 문제점을 보완하는 과정을 진행하게 된다. 이 플랫폼을 활용하면 다양한 정보를 통합적으로 분석하여 관광객별 맞춤화된 서비스를 제공할 수 있는 스마트관광 환경이 가능해진다. 또한 지역중심의 스마트관광 생태계 조성을 통해 관광 목적지 주민의 삶을 개선하고 지역 재생과 일자리 창출에도 기여할 수가 있을 것이다.

빅데이터 기반 실시간 불량품 발생 원인 분석 및 설비 교체주기 예측 (Analysis of Defective Causes in Real Time and Prediction of Facility Replacement Cycle based on Big Data)

  • 황승연;곽경민;신동진;곽광진;노영주;박경원;박정민;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.203-212
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 세계 제조 강국들은 침체된 제조업의 부흥을 위해 국가적 전략을 추진하고 있다. 이러한 추세에 따라 문재인 정부도 '과학기술 발전이 선도하는 4차 산업혁명'이라는 전략을 제시하였다. 4차 산업혁명을 이끄는 핵심기술인 IoT, Cloud, Big data, Mobile, AI 등의 지능정보기술은 로봇, 3D 프린팅 등과 같은 신산업의 등장과 기존 주요 제조업의 스마트화를 촉진하고 있다. 스마트공장과 같은 기술이 발전함에 따라 IoT 기반의 센싱 기술이 발전하면서 이전에는 수집할 수 없었던 다양한 데이터를 측정할 수 있게 되었고, 각 공정에서 생성되는 데이터도 폭발적으로 증가했다. 따라서 본 논문에서는 데이터 생성기를 활용하여 스마트공장에서 발생할 수 있는 가상 데이터를 생성하고, 이를 활용하여 실시간으로 불량품의 발생 원인을 분석하고 설비의 교체주기를 예측하는 방법을 설명한다.

병렬 분산파일시스템의 성능 분석을 통한 최적화 연구 (Study of Optimization through Performance Analysis of Parallel Distributed Filesystem)

  • 윤준원;송의성
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권5호
    • /
    • pp.409-416
    • /
    • 2016
  • 최근 빅데이터 이슈가 화두가 됨에 따라 대학, 산업체, 연구소 등에서는 다양한 데이터들을 수집, 분석 하려는 노력이 활성화 되고 있다. 여기에는 과거부터 축적된 데이터, 현재에 바로 분석이 불가능하더라도 잠재적인 의미를 가지고 있는 데이터 등 대량의 데이터들이 수집되어 의미론적인 분석을 통해 가치 있는 분석결과를 얻게 된다. 이를 위해 전 세계적으로 대용량의 데이터 요구를 처리 할 수 있는 고성능 스토리지 시스템의 수요가 증가하고 있다. 또한, 여러 사용자들에게 축적된 대량의 데이터에 동시에 접속하여 다양한 분석을 수행할 수 있도록 안정성 있는 병렬 분산파일시스템을 제공해야 한다. 본 연구에서는 위와 같이 안정성 있는 파일시스템을 제공하기 위해 반드시 고려되어야 할 스토리지 시스템의 I/O 대역폭, 메타데이터의 성능 등을 파악하고 최적의 환경을 구성하기 위한 방법을 제시하고자 한다.

사물인터넷 동향분석을 통한 Co-creation기반 스마트시티 구축 방안 (A Development Plan for Co-creation-based Smart City through the Trend Analysis of Internet of Things)

  • 박주섭;홍순구;김나랑
    • 한국산업정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.67-78
    • /
    • 2016
  • 최근 세계 각국은 교통난, 주택난, 에너지 부족 등 많은 도시 문제를 해결하고 삶의 질을 높이기 위해 스마트시티 프로젝트를 적극적으로 추진하고 있다. 이는 사물인터넷의 발달로 인해 도시 자원의 효율적 통제 및 재사용을 통한 지속가능성, 편리성 및 친환경성을 갖춘 스마트시티의 구축이 가능해졌기 때문이다. 본 연구의 목적은 사물인터넷 기술 동향을 분석하고 사물인터넷 활용분야 가운데 하나인 스마트시티 구축을 위한 방안을 제시하는 데 있다. 이를 위해 비정형 데이터 분석의 하나인 텍스트마이닝 기법을 활용하여 2013년부터 2015년까지 전자신문 기사를 분석하였고 외국의 스마트시티 구축 사례를 조사하였다. 분석결과 빅데이터, 클라우드, 플랫폼, 센서 등이 스마트시티와 밀접한 관계가 있었다. 스마트시티의 성공적 구축을 위해서는 첫째, 도시내 이해관계자들이 모두 협력하여 가치사슬 전 과정에서 새로운 가치를 창출해내야 한다. 둘째, 빅데이터를 적극 활용하여야 하고 공공분야 데이터를 지금보다 더 적극적으로 개방하여야 한다. 본 연구는 빅데이터 분석 방법을 제시하여 후속 연구를 유발하였다는 학문적 기여도가 있다. 또한 실제 지방정부 및 행정기관에서 스마트시티 구축을 위한 정책 수립의 자료로 활용될 수 있는 실무적인 기여도가 있다. 본 연구에서는 사물인터넷 기술 동향을 분석하기 위해 '전자신문' 기사만을 선정하여 분석하였기 때문에 전체 동향을 반영하는 데 제한이 있을 수 있다.

빅데이터를 이용한 중고 거래 분석 시스템 연구 (A Study for Used Transaction Analysis System using Big Data)

  • 안병태
    • 디지털융복합연구
    • /
    • 제19권6호
    • /
    • pp.259-264
    • /
    • 2021
  • 최근 중고 거래를 지원하는 중고 거래 사이트가 증가함에 따라 사용자는 실시간으로 다양한 정보를 검색하고자 한다. 이러한 새로운 변화는 전자상거래 기반에서 새로운 유형의 C2C(Commerce to Commerce) 거래가 활성화 되었다. 그러나 각각의 중고 거래 사이트는 고유한 특성들이 있어 전체 표준화가 어렵다. 따라서 본 논문에서는 사용자가 사용한 거래 데이터를 실시간으로 제공하고 원하는 정보를 신속하게 제공하는 시스템을 연구하였다. 본 논문에서는 인터넷 전자 상거래를 통한 중고품 통합 거래 시스템 개발에 필요한 크롤러 시스템을 연구하고, 정의된 형태소 분석기를 통해 사용자가 원하는 웹 환경에서 정보 제공이 가능하도록 하였다. 따라서 본 연구에서는 다양한 중고 물품 사이트에 접속하지 않고도 사용자가 원하는 정보를 제공하는 시스템을 설계하였다.

온라인 소셜네트워크를 통한 한국인의 정치성향 예측 기법의 연구 (A Study on Political Attitude Estimation of Korean OSN Users)

  • 무하마드 에카 위자야;안희준
    • 한국산업정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.1-11
    • /
    • 2016
  • 본 연구는 Facebook 사용자들의 Like활동 정보를 사용하여 정치성향을 예측하기 위한 분석 모델과 프로그램를 개발하였다. Facebook의 Ajax사용 특성 을 반영한 Facebook 크로울러를 개발하였으며, 이를 사용하여 수집된 성기고 방대한 데이터의 상관 매트릭스 정보를 효과적의 축소하기 위한 카테고리 레벨 필터링 기법을 개발하였다. 대한민국 사용자들을 대상으로 LCA (Latent class analysis) 분석한 결과 28 개의 기준 (전체 대상페이지의 3% 미만) 으로 사용자의 정치적인 극성을 상당히 정확하게 (AUC of 0.82) 예측할 수 있음을 확인하였다.

교육종단연구 분석을 위한 빅데이터 플랫폼 개발 및 적용 (Development and Application of a Big Data Platform for Education Longitudinal Study Analysis)

  • 박정;조완섭
    • 한국빅데이터학회지
    • /
    • 제5권1호
    • /
    • pp.11-27
    • /
    • 2020
  • 본 논문에서는 교육종단연구 데이터를 효과적으로 저장·처리·분석하기 위한 데이터 플랫폼을 개발하고, 이를 서울교육종단연구(SELS)에 적용하여 유용성을 확인한다. 플랫폼은 데이터 전처리부와 데이터 분석부로 구성된다. 데이터 전처리부에서는 1) 마스킹 2) 요인화 3) 정규화·이산화 4) 데이터 유도 5) 데이터 웨어하우징 과정을 통해 교육종단연구 데이터 웨어하우스를 생성하게 된다. 데이터 분석부는 OLAP과 데이터 마이닝(DM)으로 구성된다. 먼저, OLAP에서는 측정값 선정, 스키마 설계를 거쳐 OLAP을 수행하게 된다. 이후 DM에서는 변수 선택, 연구모형 선택, 데이터 수정, 인수튜닝, 모형학습, 모형평가 및 해석단계를 거친다. 본 플랫폼에서 전처리 과정을 거쳐 생성된 데이터 웨어하우스는 다양한 연구자들에 의해 공유될 수 있고, 지속적인 연구결과 데이터 셋의 축적이 가능하므로 후속 연구자들은 추가적인 분석을 수월하게 수행할 수 있게 된다. 또한, 정책입안자들도 SELS 데이터 웨어하우스에 직접 접근하여 다차원 분석을 통해 온라인으로 분석할 수 있어 과학적인 의사결정이 가능하게 된다. 본 연구에서는 개발된 플랫폼의 유용성을 입증하기 위해 SELS 데이터를 플랫폼 상에서 구축하고 수학 학업성취도를 측정값으로 선정하여 OLAP 및 DM을 수행하였으며, 측정값에 영향을 주는 다양한 요인을 데이터 마이닝 기법을 사용하여 분석하였다. 이를 통해 데이터 기반 교육정책 시사점을 빠르고 효과적으로 도출할 수 있었다.