• Title/Summary/Keyword: 대용량 데이터 처리 기술

Search Result 502, Processing Time 0.039 seconds

A Fast Editing/Writing Technique for Large-scale Multimedia Files with Data Block Sharing (데이터 블록 공유를 통한 대용량 멀티미디어 파일 고속 편집 저장 기법)

  • Jung, Seung-Wan;Nam, Young-Jin;Seo, Dae-Wha
    • Annual Conference of KIPS
    • /
    • 2008.05a
    • /
    • pp.694-697
    • /
    • 2008
  • 디지털 기술의 발전과 디지털 캠코더와 같은 장비의 대중화로 인하여, 오늘날 누구나 쉽게 영상물을 촬영하고 디지털화 하여 저장할 수 있다. 특히 이런 장비들이 제공하는 고화질의 미디어 컨텐츠는 대용량 파일의 형태로 저장된다. 대용량 파일의 필요한 부분만을 편집하여 재 저장하기 위해서는 새로운 기법이 요구된다. 현재의 리눅스 시스템에서는 편집된 파일의 내용을 새롭게 저장하는 방법을 사용하는데 미디어 컨텐츠와 같은 대용량 파일의 경우 많은 디스크 대역폭과 시간을 요구한다. 본 논문에서는 아이노드 블록 포인터 재설정 기법과 데이터 블록 공유 기법을 사용하여 대용량 파일에서 필요한 부분을 빠르고 효율적으로 편집하여 저장 및 복제할 수 있는 방법을 제시한다. 시뮬레이션을 통해 편집하여 저장할 시 리눅스 Ext3 파일 시스템에 비해 최대 16배 시간 단축을 확인하였다. 또한 편집한 내용을 새로운 파일로 저장할 경우 제안 기법은 공유 데이터 블록을 사용하므로 실제 사용하는 디스크 공간용량은 원본 동영상 파일의 크기만큼만 사용한다.

Design of the Framework for Processing Large Sensor Data Stream (대용량 센서 데이터 스트림 처리를 위한 프레임워크 설계)

  • Choi Hyun-Hwa;Won Jong-Ho;Lee Hun-Soon;Chae Mi-Ok;Park Jae-Hong;Chung Warnill;Kim Byung-Seob;Lee Myung-Cheol;Lee Mi-Young
    • Annual Conference of KIPS
    • /
    • 2004.11a
    • /
    • pp.35-38
    • /
    • 2004
  • 센서 데이터 스트림 처리 기술은 유비쿼터스 컴퓨팅의 핵심 기술로 그 중요성이 날로 증대되어, 현재 산업계는 물론 학계에서도 그 역량을 이에 집중하고 있다. 본 논문에서는, 센서 데이터 스트림에 대한 특징 및 이를 처리하기 위한 산업계와 학계의 동향을 알아본다. 그리고, 대용량 센서데이터 스트림을 처리하기 위해 요구되어지는 기능을 정리하고, 이를 기반으로 센서 데이터 스트림처리 시스템의 구조를 설계한다.

  • PDF

An information Security for the Erasure code Design and Load Balance Server (무선인터넷 프록시 서버 환경에서 정보 보안를 위한 이레이져 코드 설계와 서버 부하분산)

  • Ga, Young-Sung;Park, Kwang-Ok;Lee, Jong-Kun
    • Annual Conference of KIPS
    • /
    • 2013.11a
    • /
    • pp.347-350
    • /
    • 2013
  • 본 논문에서는 무선 인터넷이 대중화 되면서 프록시 서버의 역할의 중요성과 대용량 데이터 보안, 대용량 트래픽을 처리할 수 있는 확장성이 요구되어지고 있다. 무선 인터넷은 유선 인터넷과 달리 기술 환경과 그 특성상 여러가지 제약점들을 가지고 있다. 낮은 대역폭, 이동성 문제, 네트워크 프로토콜, 보안, 데이터 압축, 캐싱 방법 등 아직 기술적으로 해결하여야 문제점을 가지고 있다. 본 논문에서는 데이터 보안을 위하여 무선 인터넷 프록시 서버에 Erasure code 코드를 사용하여 기밀성, 무결성, 가용성 등을 강화하면서 서버의 성능 저하를 해결하기 위하여 서버 부하분산을 적용시키고자 한다.

Safe Data Sharing Scheme in Cloud Computing (클라우드 컴퓨팅 환경에서의 안전한 데이터 공유 기법)

  • Kim, Su-Hyun;Lee, Im-Yeong
    • Annual Conference of KIPS
    • /
    • 2015.10a
    • /
    • pp.722-725
    • /
    • 2015
  • 분산 컴퓨팅 환경에서 다양한 데이터 서비스가 가능해지면서 대용량 데이터의 분산관리가 주요 이슈로 떠오르고 있다. 한편, 대용량 데이터의 다양한 이용 형태로부터 악의적인 공격자나 내부 사용자에 의한 보안 취약성 및 프라이버시 침해가 발생할 수 있다. 민감한 데이터들이 클라우드 서버 내에 저장되어 사용될 때, 외부 공격자나 내부 사용자의 미흡한 관리로 인한 데이터 유출 문제가 발생할 수 있다. 이를 해결하기 위해 데이터에 대한 암호화를 통해 관리가 가능하다. 하지만 기존의 단순한 암호화 방식은 클라우드 환경에 저장된 데이터의 접근 관리에 따른 문제점이 존재한다. 또한, 기존의 데이터 암호 기술들은 클라우드 스토리지 상에서 여러 사용자 간의 데이터 공유 서비스에 적용하기 힘든 단점을 가지고 있다. 따라서 본 논문에서는 속성기반 암호로 암호화된 키를 재암호화하여 다른 사용자와 안전하고 효율적으로 공유할 수 있는 데이터 공유기법을 제안한다.

A MapReduce-based kNN Join Query Processing Algorithm for Analyzing Large-scale Data (대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘)

  • Lee, HyunJo;Kim, TaeHoon;Chang, JaeWoo
    • Journal of KIISE
    • /
    • v.42 no.4
    • /
    • pp.504-511
    • /
    • 2015
  • Recently, the amount of data is rapidly increasing with the popularity of the SNS and the development of mobile technology. So, it has been actively studied for the effective data analysis schemes of the large amounts of data. One of the typical schemes is a Voronoi diagram based on kNN join algorithm (VkNN-join) using MapReduce. For two datasets R and S, VkNN-join can reduce the time of the join query processing involving big data because it selects the corresponding subset Sj for each Ri and processes the query with them. However, VkNN-join requires a high computational cost for constructing the Voronoi diagram. Moreover, the computational overhead of the VkNN-join is high because the number of the candidate cells increases as the value of the k increases. In order to solve these problems, we propose a MapReduce-based kNN-join query processing algorithm for analyzing the large amounts of data. Using the seed-based dynamic partitioning, our algorithm can reduce the overhead for constructing the index structure. Also, it can reduce the computational overhead to find the candidate partitions by selecting corresponding partitions with the average distance between two seeds. We show that our algorithm has better performance than the existing scheme in terms of the query processing time.

An Efficient Location Encoding Method Based on Hierarchical Administrative District (계층적 행정구역 기반의 효율적인 위치정보 표현 방식)

  • Kim Woo-Cheol;Lee SangYoon;Park Sanghyun;Won JungIm
    • Annual Conference of KIPS
    • /
    • 2004.11a
    • /
    • pp.125-128
    • /
    • 2004
  • 최근 이동 통신 기술의 급속한 발달로 인해 휴대폰, PDA 등과 같은 휴대용 단말기의 사용이 보편화 되고 있다. 따라서 이동 객체의 시간에 따른 공간적인 위치정보를 활용하여 다양한 서비스를 제공하는 위치 기반 서비스(Location-Based Service)에 관한 많은 연구가 진행되고 있다. 위치 기반 서비스의 효율적 제공을 위하여 시간에 따라 지속적으로 변하는 이동 객체의 대용량 시공간 정보를 신속하게 저장, 관리, 검색할 수 있는 인덱싱 및 질의 처리 기술이 수반되어야 한다. 본 논문에서는 대용량 이동 객체 데이터베이스를 대상으로 한 효율적인 인덱스 구축을 위한 데이터 압축 표현 방식에 대하여 논한다. 이를 위해 본 논문에서는 기존의 주요 연구에서 2 차원 공간 좌표 (X, Y)로 표현되던 이동 객체의 공간 정보를 계층적 구조를 갖는 행정구역에 기반하여 1 차원의 공간 정보로 압축 표현하는 방식을 제안한다. 이를 이용하여 대용량의 공간정보를 저장하고 있는 이동 객체 데이터베이스의 인덱스 크기의 감소 및 질의 처리 시간의 향상 효과를 얻을 수 있다. 또한, 제안된 방식은 2 차원 공간 좌표를 1 차원의 행정구역 기반의 위치정보로 표현하기 때문에 이로 인한 데이터 손실이 발생할 수 있으나, 일정 공간 내의 객체분포를 필요로 하는 교통 상황 파악, 근사적(approximate) 공간 정보를 필요로 하는 사람${\cdot}$차량 위치 추적 서비스와 같은 위치 기반 서비스를 신속하게 처리하는데 유용하게 사용될 수 있다.

  • PDF

XML 기반 멀티미디어 검색시스템

  • 윤미희;최동선;최병갑
    • Review of Korea Contents Association
    • /
    • v.1 no.2
    • /
    • pp.75-82
    • /
    • 2003
  • 인터넷의 보급과 더불어 대용량 저장장치의 가격이 하락하면서 멀티미디어 데이터의 저장과 공유가 보편화되었다. 또한 멀티미디어 데이터를 활용하는 지리정보시스템, 멀티미디어 의료 정보시스템, 전자신문, 전자도서관, 홈쇼핑, VOD등의 새로운 응용 분야들이 각광을 받고 있다. 이러한 환경적인 요인은 대용량의 멀티미디어 테이터를 효율적으로 추출, 저장, 검색하기 위한 멀티미디어 데이터 처리기술이 요구된다.(중략)

원격 메모리를 이용한 메모리 가상화 서비스 기술

  • Cha, Gyu-Il;Kim, Yeong-Ho;An, Sin-Yeong;Im, Eun-Ji
    • Information and Communications Magazine
    • /
    • v.31 no.3
    • /
    • pp.22-31
    • /
    • 2014
  • 최근 빅데이터 처리에 대한 요구가 급증하면서 매니코어 계산 장치의 개발이 활발히 진행되고 있어 계산 장치와 입출력 저장장치의 성능 격차는 과거보다 더욱 두드러지고 있다. 이런 상황에서 메모리 가상화 서비스 기술은 입출력 저장 장치의 성능 문제를 완화할 최적의 대안으로 주목받고 있다. 본고에서는 방대한 데이터를 처리해야 하는 응용 프로그램에게 입출력 저장 장치의 성능 한계를 극복하고 데이터 처리 비용을 최소화 할 수 있도록 원격 메모리를 이용한 대용량 가상 물리 메모리 제공 서비스를 지원하는 최근 메모리 가상화 서비스 기술 동향에 대해 알아본다.

Design of Cloud based Grid Test-bed for Handling Science Dataset (클라우드 기반 과학데이터 그리드 테스트베드 설계)

  • Kang, Yun-Hee
    • Annual Conference of KIPS
    • /
    • 2014.04a
    • /
    • pp.90-92
    • /
    • 2014
  • 이 논문에서는 그리드 환경에서 과학응용을 효율적으로 수행시키기 위해 클라우드 기반의 동적자원 프로비저닝 기술을 그리드 응용에 적용하기 위한 테스드베드 설계를 기술한다. 이를 위해 클라우드 기반 그리드 테스트베드 구축을 위한 요구사항 및 응용 아키텍처 설계를 요약한 후 가상화 자원을 이용하는 과학데이터 그리드 플랫폼을 대용량 데이터 처리에 적합하도록 최적화하고, 그 방안을 제시한다. 설계된 테스트베드는 그리드 환경 고도화를 위한 접근 방법으로 계산 자원 제공을 위해 클라우드 기술을 활용하도록 한다.

Evaluation of Alignment Methods for Genomic Analysis in HPC Environment (HPC 환경의 대용량 유전체 분석을 위한 염기서열정렬 성능평가)

  • Lim, Myungeun;Jung, Ho-Youl;Kim, Minho;Choi, Jae-Hun;Park, Soojun;Choi, Wan;Lee, Kyu-Chul
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.2
    • /
    • pp.107-112
    • /
    • 2013
  • With the progress of NGS technologies, large genome data have been exploded recently. To analyze such data effectively, the assistance of HPC technique is necessary. In this paper, we organized a genome analysis pipeline to call SNP from NGS data. To organize the pipeline efficiently under HPC environment, we analyzed the CPU utilization pattern of each pipeline steps. We found that sequence alignment is computing centric and suitable for parallelization. We also analyzed the performance of parallel open source alignment tools and found that alignment method utilizing many-core processor can improve the performance of genome analysis pipeline.