• Title/Summary/Keyword: 데이터 처리량

Search Result 2,586, Processing Time 0.041 seconds

Design and Implementation of a Generic Classification System Based on Incremental Learning Technology (점진적 학습 기술 기반 범용적인 분류기 구조설계 방법의 설계 및 구현)

  • Min, Byung-Won;Oh, Yong-Sun
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2019.05a
    • /
    • pp.425-426
    • /
    • 2019
  • 전통적인 마이닝 기법은 다양한 디지털 매체와 센서 등에서 생산되는 빅데이터를 처리하기 어려울 뿐 아니라 신규 데이터 누적시 전체 데이터를 재분석 해야하는 비효율성과 대용량의 문서를 학습함에 있어 메모리부족 문제, 학습 소요시간 문제 등이 있다. 이러한 문제를 해결하기 위하여 본 논문에서는 자질축소 기법에 의존하지 않고 대량의 문서를 자유롭게 학습하고 부분적인 자질 추가 변경 시에 변경요소만을 추가 반영할 수 있는 범용적이고 일반적인 분류기의 구조설계 방법을 설계 및 구현하였다. 점진적 학습 모듈은 일반적인 학습 방법이 데이터의 추가 및 변동시마다 모든 데이터를 재학습하는 데 반해, 기존의 학습 결과에 증분된 데이터만 재처리 없이 추가적으로 학습한다. 재학습을 위해 사용자는 작업 수행 중 자원 관리를 통해 기존에 처리된 데이터를 자유롭게 가져와서 새로운 데이터와 병합이 가능하다. 이러한 점직적 학습 효율성은 빅데이터 기반 데이터 처리에 주요한 특성인 데이터 생산 속도를 극복하기 위한 좋은 대안이 될 수 있음을 확인하였다.

  • PDF

Agent-based Resource Metadata Management Method for Query Processing in Distributed Databased (분산데이터베이스 환경에서의 질의 처리를 위한 에이전트 기반 리소스 메타데이터 관리기법)

  • 주향금;김성림;윤종필
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.75-77
    • /
    • 1998
  • 기존 클라이언트 캐쉬 데이터에 기반된 질의 처리에 있어 캐쉬 데이터와 서버 데이터간의 동일성과 데이터 전송 문제를 해결하기 위해 에이전트 기반 클라이언트-서버구조를 제안한다. 서버 데이터가 변하지 않았을 경우 데이터 전송량을 감소시키는 유용한 방법으로, pull, push 기법을 사용한다. 서버 리소스 에이전트에서 데이터베이스 변경 정보를 브로커 에이전트에 push하고, 클라이언트 에이전트가 요구하는 질의에 대해서 브로커 에이전트에게 변경 정보를 pull한다.

Computing Average Iceberg Query by Dynamic Partition (동적 분할에 의한 평균 빙산 질의 처리)

  • 배진욱;이석호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10a
    • /
    • pp.126-128
    • /
    • 1999
  • 평균 빙산 질의란 대용량의 데이터들에 의해 avg 집단 함수를 수행한 뒤 임계값 이상인 데이터들을 결과로 출력하는 연산을 의미한다. 이 때 데이터 도메인의 크기가 메모리에 생성할 수 있는 카운터의 수보다 크기 때문에 연산 처리가 어렵다. 지난 연구에서 빙산 질의에 대해 제안한 해시 카운터는 avg 연사의 경우 착오누락이 발생한다는 문제점이 존재한다. 그래서 이런 문제점들을 해결하며 효율적으로 연산을 수행하기 위해, 데이터베이스를 분할하며 카운터를 관리하는 '메모리 Full 분할', '후보 Full 분할'의 두 알고리즘을 제안한다. 실험결과 두 알고리즘은 메모리크기, 데이터 분포, 데이터 순서에 영향을 받았는데, 데이터들이 정렬이 되어 있거나 데이터분포가 정규분포를 이룰 때 우수한 성능을 보였다.

  • PDF

Current Status and Future Prospects of Big Data Analysis Technology (빅 데이터 분석 기술 현황 및 향후전망)

  • Han, Ji-Seon;Yun, Sung-Yeol;Park, Seok-Cheon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.440-442
    • /
    • 2012
  • 데이터를 대량 생산하는 스마트 기기가 대거 등장한 요즘 빅데이터는 대용량 데이터를 분석하여 가치 있는 정보를 추출하고 이 지식을 바탕으로 위기에 대응하거나 변화를 예측하는 정보기술이다. 그러나 아직 빅데이터에 대해 분류하거나 분석하는 기술의 연구가 미비하다. 따라서 본 논문에서는 빅 데이터의 개념, 배경, 분석기술 현황에 대해 분석하고 빅 데이터 유형 분석 및 분석 기술의 향후 전망을 제시한다.

Big data distributed processing system using RHadoop (RHadoop을 이용한 빅데이터 분산처리 시스템)

  • Shin, Ji Eun;Jung, Byung Ho;Lim, Dong Hoon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.26 no.5
    • /
    • pp.1155-1166
    • /
    • 2015
  • It is almost impossible to store or analyze big data increasing exponentially with traditional technologies, so Hadoop is a new technology to make that possible. In recent R is using as an engine for big data analysis based on distributed processing with Hadoop technology. With RHadoop that integrates R and Hadoop environment, we implemented parallel multiple regression analysis with various data sizes of actual data and simulated data. Experimental results showed our RHadoop system was faster as the number of data nodes increases. We also compared the performance of our RHadoop with lm function and biglm packages available on bigmemory. The results showed that our RHadoop was faster than other packages owing to paralleling processing with increasing the number of map tasks as the size of data increases.

Algorithm of Holding Time Control Using Delay-Tolerant Packet for Energy-Efficient Transmission (에너지 효율적인 전송을 위한 지연 허용 패킷의 유지시간 제어 알고리즘)

  • Ryu, Seung Min;Choi, Won Seok;Choi, Seong Gon
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.5 no.4
    • /
    • pp.87-94
    • /
    • 2016
  • This paper proposes an energy transmission method to maximize energy efficiency of a based station. This method makes use of classification of service type to solve an inefficient use of transmission power, which is from exponential relationship between the legacy data throughput and transmission power. The proposed one is a way to find the most energy-efficiency points with the transmitted optimal amount of data on users in a base station of wireless network environment. For this, we propose EETA (Energy-Efficient Transmission Algorithm) which can control the amount of data and the holding time at the base station. As a result, the proposed method can improve the energy efficiency of about 10% compared to the legacy base station.

A Survey on Efficient Transmission method in Wireless Image Sensor Networks (Wireless Imgae Sensor Networks 에서 효율적인 전송 기법에 관한 연구)

  • Lee, Jong Seung;Lee, Kangwhan
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2009.05a
    • /
    • pp.298-301
    • /
    • 2009
  • 최근 들어 무선 멀티미디어 서비스를 위한 Wireless Sensor Network 에 관한 연구가 활발히 진행됨에 따라 그 응용의 한 부분으로써 이미지 센서를 이용하여 이미지 데이터를 전송하는 WISN(Wireless Image Sensor Networks) 에 관한 연구가 시작되었다. WISN은 센서노드의 제한된 자원(배터리, 대역폭, 처리속도, 메모리 크기)으로 인해 많은 어려움을 갖는다. 특히 그 중에서 제한된 배터리로 인해 이미지 센서노드는 효율적인 에너지 관리가 필요하다. 이미지 센서노드의 에너지 소모는 이미지 캡쳐 과정, 이미지 데이터의 처리 및 가공(compression)과정, 이미지 데이터의 전송 과정에서 발생한다. 또한 수 Kbyte 이미지 데이터는 기존의 무선센서 네트워크의 데이터보다 훨씬 크기 때문에 빈번한 이미지 데이터의 전송은 노드의 수명을 단축시켜 전체 네트워크의 분단을 초래한다. 본 논문에서는 이러한 문제점을 해결하기 위해 JPEG 이미지 크기의 변화량을 고려하여 전송 횟 수를 최소화하는 기법을 제안한다. 종단 센서노드는 자신이 이전 JPEG이미지와 현재 JPEG이미지의 크기를 비교하여 특정 임계값 이하이면 전송하지 않고, 임계값 이상일 때에는 변화된 특정 부분의 이미지만을 보냄으로써 데이터량을 줄이게 된다. 결과적으로 효율적 에너지 관리를 통해 센서 노드의 라이프타임을 향상 시키는 결과를 가진다. 제안된 기법을 검증하기 위하여 테스트 보드를 만들어 제안된 기법과 일반적인 방법에서의 데이터의 전송 횟수 및 에너지 소모량과 노드의 라이프타임을 비교하여 제안된 기법의 성능의 우수함을 보였다.

  • PDF

High-Performance Loading Method for Historical Spatial Query Processing in Data Stream System (데이터 스트림 시스템에서 과거 공간질의 처리를 위한 고속 로딩 기법)

  • Jae-Wan Shin;Sung-Ha Baek;Dong-Wook Lee;Soong-Sun Shin;Kyung-Bae Kim;Hae-Young Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.397-400
    • /
    • 2008
  • 무한히 발생되는 실시간 데이터와 디스크에 저장된 히스토리컬 데이터를 동시에 처리하는 하이브리드 질의에 관한 연구가 활발히 이루어지고 있다. 하이브리드 질의는 디스크에 저장된 대용량의 공간 데이터 처리를 위해 빠른 디스크 입/출력을 요구한다. 이러한 데이터를 처리하기 위해 인덱스, 데이터 축소 기법등이 연구되었다. 데이터의 빠른 검색을 위한 인덱스 기법은 디스크에 분산 저장된 데이터에 대한 탐색 비용과 입/출력 비용을 줄이지 못한다. 또한, 샘플링을 통해 디스크 입/출력 시간 비용을 줄이는 데이터 축소 기법은 데이터의 정확성을 떨어뜨려 정확성을 요구하는 하이브리드 질의에서는 이용하기가 어렵다. 이논문에서는 디스크 입/출력 시간과 디스크 탐색 시간 비용을 줄이고, 정확성을 보장하는 과거 공간질의 처리를 위한 고속로딩 기법을 제아난다. 제안기법은 공간을 그리드 형태로 나누고 인접한 공간 데이터를 함께 관리함으로써 디스크 입/출력 비용을 줄 일 수 있다. 또한, 공간적으로 인접한 데이터를 물리적으로 인접한 곳에 저장하여 디스크 탐색시간 비용을 줄일 수 있다. 이렇게 저장된 데이터는 손실 없이 모두 저장되며, 정확성 또는 보장할 수 있다.

Study about Object Distinction based on the Magnetic variation of metal objects (금속 물체의 자기 변화에 기반한 물체 판별에 대한 연구)

  • Kim, Sang Hyeok;Ko, Byeong Jo;Lee, Jae Heung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.514-516
    • /
    • 2017
  • 금속탐지 센서는 공항, 유물 탐지, 지뢰 탐지 등 여러 분야에서 유용하게 사용하고 있다. 하지만 기존의 금속 탐지기의 경우 탐지되어진 물체를 구분할 수 없어 사람이 직접 그 물체가 어떤 것인지 확인을 해야 한다. 만약 이 과정을 컴퓨터를 통해 처리할 수 있다면 물체가 무엇인지 확인하는 검사시간을 줄일 수 있으며, 인적자원의 낭비를 줄일 수 있다. 이 연구에서는 AMR 자기 스위치 센서를 이용하여 금속을 탐지하고, 데이터를 분석하여 탐지된 물체의 철의 함유량을 파악, 어떠한 물체인지 유추하는 것을 목표로 하였다. 이를 위해 금속 함유량이 다른 여러 물체의 데이터, 센서를 지나가는 속도에 다른 데이터, 센서와의 거리에 다른 데이터등을 측정하였고, 이를 통해 철의 함량을 구하기 위한 요소를 파악하였다.

A Key Distribution Method for load balancing in MapReduce Framework (MapReduce 프레임워크에서 균등한 작업 부하 분산를 위한 키 분배 기법에 대한 연구)

  • Son, Ji-Hoon;Choi, Hyun-Sik;Chung, Yon-Dohn
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.53-56
    • /
    • 2011
  • 맵리듀스는 대용량의 데이터를 병렬로 처리하기 위해 제안된 프레임워크이다. 맵리듀스 프레임워크는 대용량의 데이터를 처리하기에 적합하기 때문에 많은 응용에서 사용되고 있다. 하지만 이것은 불균등한 데이터 분포에 대해 취약하다는 단점이 있다. 본 논문에서 우리는 맵리듀스 프레임워크에서 균등한 작업 부하 분산을 위한 키 분배 기법을 제안한다. 우리는 실험을 통해 제안 기법이 기존의 맵리듀스보다 불균등한 분포를 갖는 데이터를 효율적으로 처리한다는 것을 보였다.