• Title/Summary/Keyword: HADOOP

Search Result 394, Processing Time 0.029 seconds

A Trend Analysis Service Using a Hadoop Cluster of Mini PCs (미니 PC 기반의 하둡 클러스터를 이용한 트렌드 분석 서비스)

  • Jeon, Young-Ho;Kim, Eun-Sang;Park, Hyo-Ju;Lee, Ki-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.710-711
    • /
    • 2015
  • IT 산업의 발전에 따라 생성되는 데이터의 양이 폭발적으로 증가하고 있다. 이러한 빅 데이터는 여러 대의 컴퓨터로 구성한 하둡 클러스터를 이용하면 상당히 빠른 속도로 처리할 수 있으나, 일반적으로 하둡 클러스터를 구성하기 위해 많은 비용과 공간이 소요되는 단점이 있다. 본 논문에서는 저가의 미니 PC로 하둡 클러스터를 구성하여 비용 및 공간적 문제점을 해결하고, 구축한 하둡 클러스터를 이용한 트렌드 분석 서비스를 제안하였다. 실험 결과 미니 PC로 이루어진 하둡 클러스터가 고가의 서버보다 트랜드 분석에 더 좋은 처리 성능을 보였다.

Security Log Collection and Analysis by Utilizing Hadoop Eco System (하둡 에코 시스템을 이용한 보안 로그 수집 및 분석)

  • Kim, Duhoe;Shin, Dongkyoo;Shin, Dongil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.194-196
    • /
    • 2015
  • 시스템에 이상 징후가 발생하거나 해킹을 당했을 때, 전문가들은 가장 먼저 로그 파일을 확인한다. 이처럼 로그파일을 관리하고 분석하는 것은 시스템을 관리 하는 것에 있어서 필수불가결하다. 하지만 보안을 담당하는 장비에서 발생하는 로그들은 저장 공간의 한계 때문에 일부만 저장되었다가 사라지거나 HDD가 없는 보안장비들은 로그를 남길 수 없다. 따라서 이러한 단점을 해결하기 위해 본 논문에서는 보안 로그 수집과 분석에 하둡 에코 시스템을 접목시켜 방대한 로그를 저장하고, 이를 R프로그래밍으로 분석 할 수 있는 시스템 모델을 제안한다. 제안한 시스템 모델을 구현하기 위한 아키텍처에 대해서도 상세한 결과를 서술하였다.

Parallel Processing of BLAST Using Hadoop and Its Performance Evaluation (하둡을 이용한 BLAST의 병렬 처리 및 성능 분석)

  • Choi, Hoon;Um, Jungho;Yoon, Hwa-mook;Choi, Yun-Soo;Lee, Minho;Lee, Won-Goo;Song, Sa-Kwang;Jung, Hanmin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.115-117
    • /
    • 2012
  • 차세대 시퀀싱 장비는 기존의 컴퓨팅 방법으로 처리할 수 없을 만큼 많은 양의 시퀀스 데이터를 생성하고 있다. 본 논문에서는 차세대 시퀀스 데이터의 정렬을 위해 널리 사용되고 있는 BLAST의 병렬 처리 방법을 하둡을 사용하여 제시하며, 이의 성능 개선 효과를 분석한다.

Preprocessor of Scientific Experimental Data for MapReduce based Data Analysis (MapReduce 기반 데이터분석을 위한 과학실험데이터 전처리기)

  • Kang, Yun-Hee;Kang, Kyung-woo;Kung, Sang-wang;Jang, Haeng-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.118-120
    • /
    • 2012
  • 이 논문에서는 MapReduce 프레임워크를 활용한 기후 시뮬레이션 결과의 데이터분석을 위한 전처리 과정을 다룬다. 이를 위해 기후 시뮬레이션 결과 데이터 셋으로부터 특정변수를 추출하여 자료를 변환한 후 변환된 자료를 HDFS 에 저장하기 위한 과학데이터 필터를 설계한다. 설계된 필터를 통해 저장된 자료는 Hadoop 의 MapReduce 응용을 통해 연도별 통계처리를 분산병렬 방식으로 수행한다.

Design and Implementation of Sensor Cloud System for Security and Surveillance Service (보안 감시 서비스를 위한 센서 클라우드 시스템 설계 및 구현)

  • Shim, Jae-Seok;Choi, Yeong-Ho;Lim, Yujin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.137-138
    • /
    • 2012
  • 최근 다양한 센서를 활용한 보안 감시 시스템의 수요가 증가하면서 센서 데이터의 효율적인 관리 또한 중요해지고 있다. 본 논문에서는 높은 확장성 대비 낮은 비용이 장점인 클라우드 환경을 적용한 센서 클라우드 시스템을 설계한다. 본 시스템에서는 옥내에 분산되어 있는 센서 네트워크가 침입자를 감지하여 클라우드 게이트웨이를 통해 센서 클라우드로 센서 데이터를 전달한다. 전달된 센서 데이터는 Apache Hadoop 을 기반으로 하는 데이터 서버에 분산 저장된다. 또한 본 시스템은 센서 데이터를 실시간으로 파악하기 위한 시스템 인터페이스를 포함한다.

A Study for Improving MapReduce Performance using Solid State Drive (SSD를 사용한 맵리듀스 정렬 성능개선)

  • Kang, Seok-Hoon;Kang, Woon-Hak;Lee, Sang-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1118-1120
    • /
    • 2012
  • 컴퓨터 메모리의 용량이 커지고 기술이 발전하며 메모리와 저장장치의 데이터 처리속도 차이는 나날이 커지고 있다. 이를 보완하고자 데이터 처리를 가급적 메모리에서 해결하여 처리속도를 높이고자 하는 연구가 많이 있다. 그 중 MapReduce에 대한 연구는 현재 주목이 되고 있는 분야이다. MapReduce는 빅데이터를 클러스터 환경에서 처리하기에 대중적인 프로그래밍 모델이다. 본 논문은 MapReduce 기반의 Hadoop을 SSD를 적용하여 실행속도를 증진시키려 한다. 전통적인 MapReduce 모델은 데이터를 정렬하는데에 I/O가 크게 발생하는데, MapRedce가 사용하는 병합정렬의 I/O 병목현상을 개선하고자 SSD를 사용하였다.

High Rate Denial-of-Service Attack Detection System for Cloud Environment Using Flume and Spark

  • Gutierrez, Janitza Punto;Lee, Kilhung
    • Journal of Information Processing Systems
    • /
    • v.17 no.4
    • /
    • pp.675-689
    • /
    • 2021
  • Nowadays, cloud computing is being adopted for more organizations. However, since cloud computing has a virtualized, volatile, scalable and multi-tenancy distributed nature, it is challenging task to perform attack detection in the cloud following conventional processes. This work proposes a solution which aims to collect web server logs by using Flume and filter them through Spark Streaming in order to only consider suspicious data or data related to denial-of-service attacks and reduce the data that will be stored in Hadoop Distributed File System for posterior analysis with the frequent pattern (FP)-Growth algorithm. With the proposed system, we can address some of the difficulties in security for cloud environment, facilitating the data collection, reducing detection time and consequently enabling an almost real-time attack detection.

Big data-based piping material analysis framework in offshore structure for contract design

  • Oh, Min-Jae;Roh, Myung-Il;Park, Sung-Woo;Chun, Do-Hyun;Myung, Sehyun
    • Ocean Systems Engineering
    • /
    • v.9 no.1
    • /
    • pp.79-95
    • /
    • 2019
  • The material analysis of an offshore structure is generally conducted in the contract design phase for the price quotation of a new offshore project. This analysis is conducted manually by an engineer, which is time-consuming and can lead to inaccurate results, because the data size from previous projects is too large, and there are so many materials to consider. In this study, the piping materials in an offshore structure are analyzed for contract design using a big data framework. The big data technologies used include HDFS (Hadoop Distributed File System) for data saving, Hive and HBase for the database to handle the saved data, Spark and Kylin for data processing, and Zeppelin for user interface and visualization. The analyzed results show that the proposed big data framework can reduce the efforts put toward contract design in the estimation of the piping material cost.

A Method to Access Data for Spatial Operation in Parallel Distributed Processing System (병렬 분산 처리 시스템에서 공간 연산을 위한 데이터 접근 방안)

  • Kim, Jindeog
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.10a
    • /
    • pp.442-444
    • /
    • 2016
  • 과거에 비해 비약적으로 생산되는 공간 데이터에 대한 처리를 위한 공간 연산은 빠른 처리 응답성을 요구하는 경우가 많다. 그래서 최근 하둡(Hadoop)과 같은 빅데이터 처리 시스템을 이용하여 처리하고자 하는 시도가 많다. 한편, 공간 조인은 데이터 분할(Partitioning)과 공간 색인의 이용 여부, 여과 단계와 정제 단계를 거치는 등 그 복잡도가 강한 공간 연산이다. 그래서 빅데이터 처리 시스템을 이용한 공간 조인의 처리 방식은 매우 다양하다. 그러나 지금까지 이러한 공간 조인의 처리 방식에 다른 리소스 활용에 대한 비교는 거의 없다. 이 논문에서는 다양한 공간 연산의 수행 방법에 따른 빅데이터 시스템 클러스터에서 데이터 전송 방식을 고찰하고 데이터 전송에 따른 네트워크 리소스의 효율적인 사용 방안을 제안하고자 한다. 구체적으로 단일할당과 다중할당 색인 기법의 비교, 파티셔닝 방법의 비교, 맵리듀스 시스템의 태스크 할당 방법에 따른 비교를 통해 다양한 연산 유형에 따른 공간 조인의 처리 방안 선정에 고려 요소를 제시하고자 한다.

  • PDF

A Design of Tire Condition Checkup System for Useful Information Offering (유용한 타이어 상태정보를 제공하기 위한 타이어 상태 확인 시스템 설계)

  • Kim, Minyoung;Jang, Jong-Wook
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2014.10a
    • /
    • pp.472-474
    • /
    • 2014
  • 현재 자동차 교통사고 발생원인 중 타이어의 불량으로 인한 교통사고는 매년 급증하고 있다. 자동차 타이어의 상태를 점검하여 미연에 사고를 예방하는 캠페인이 방송매체를 통해 진행되고 있으며 이와 관련된 행사도 실시하고 있다. 기존의 타이어 측정방법은 객관적이지 못하며 전문적인 기관에 의뢰해도 사정은 마찬가지다. 운전자에게 편리하며 객관적인 타이어 상태를 측정하려는 방법은 연구되지 않는다. 본 논문에서는 운전자에게 편리하며 객관적인 타이어 상태 정보를 제공하고, 계속적으로 누적된 타이어 상태 측정데이터를 분석하여 운전자에게 유용한 타이어 상태정보를 제공하는 시스템을 설계하기 위한 연구내용을 다룬다.

  • PDF