• Title/Summary/Keyword: 대용량 고성능 계산

Search Result 26, Processing Time 0.028 seconds

MAHA-FS : A Distributed File System for High Performance Metadata Processing and Random IO (MAHA-FS : 고성능 메타데이터 처리 및 랜덤 입출력을 위한 분산 파일 시스템)

  • Kim, Young Chang;Kim, Dong Oh;Kim, Hong Yeon;Kim, Young Kyun;Choi, Wan
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.2 no.2
    • /
    • pp.91-96
    • /
    • 2013
  • The application field of supercomputing systems are changing to support into the field for both a large-volume data processing and high-performance computing at the same time such as bio-applications. These applications require high-performance distributed file system for storage management and efficient high-speed processing of large amounts of data that occurs. In this paper, we introduce MAHA-FS for supercomputing systems for processing large amounts of data and high-performance computing, providing excellent metadata operation performance and IO performance. It is shown through performance analysis that MAHA-FS provides excellent performance in terms of the metadata processing and random IO processing.

An Implementation of High Performance Transmission System for Large-scale Experimental Data (대용량 실험데이터 고속전송 시스템 구현)

  • Jin, Duseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.506-507
    • /
    • 2021
  • 대용량 실험데이터를 생성하는 가속기, 전자현미경, 전파망원경 등과 같은 첨단 실험장비들의 기술적 발전으로, 생성되는 실험데이터의 규모가 폭발적으로 증가하고 있다. 이에 따라, 데이터 분석연구에 대용량 데이터의 저장이 가능하고, 데이터 분석에 필요한 고성능 계산 서버를 갖춘 전문 데이터센터의 활용이 증가하고 있다. 본 논문에서는 이러한 전문 데이터센터를 연계한 데이터 분석 연구환경구축에서 가장 기본이 되는 데이터수집을 위한 고성능 데이터 전송 시스템을 구현하고, 이를 적용한 사례를 통해 제안하는 시스템의 효율성을 검증한다.

Declustering Policies Using Spatial-Temporal Proximity in Moving Objects DataBases (이동체 데이터베이스에서 시공간 근접성을 고려한 디클러스터링 정책)

  • 홍은석;서영덕;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.118-120
    • /
    • 2003
  • 이동체 데이터베이스에서 이동체 궤적의 양은 엄청나게 많아서 기존의 단일 디스크 기반에서는 특정영역의 질의에 대한 빠른 응답과 처리율의 향상을 볼수 없다. 따라서 고성능 질의 처리를 위한 시스템의 성능 향상을 위해서는 병렬 처리 기법의 도입이 필요하다. 이런 병렬 처리 기법 중, 기존의 디클러스터링 방법에서는 시간이 지남에 따라 연속적으로 보고되는 이동체 특성을 고려하지 않고 있다. 그러므로 대용량 이동체 데이터에 대하여 고성능 질의 처리를 위한 새로운 디클러스터링 방법이 필요하다. 이 논문에서는 대용량 이동체 데이터베이스에 대한 고성능 질의 처리를 위한 새로운 디클러스터링 정책을 제시하였다. 이동체 데이터의 MBB중 공간 좌표의 근접성만을 고려하여 하나의 SemiAllocation Disk 값을 설정하고 그 값과 시간 도메인을 다시 고려하여 근접성을 계산함으로써 디클러스터링을 할 수 있다. 또한 디스크별 Load Balancing을 고려하여 보다 정확한 디클러스터링 효과를 가지도록 하였다. 이와 같이 이동체의 특성을 고려한 새로운 디클러스터링 정책으로 시스템의 성능을 향상 시킬 수 있다.

  • PDF

Introduction to general purpose GPU computing (GPU를 이용한 범용 계산의 소개)

  • Yu, Donghyeon;Lim, Johan
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.5
    • /
    • pp.1043-1061
    • /
    • 2013
  • Recent advances in computer technology introduce massive data and their analysis becomes important. The high performance computing is one of the most essential part in analysis of massive data. In this paper, we review the general purpose of the graphics processing unit and its application to parallel computing, which has been of great interest in statistics communities.

Optimisation of multiplet identifier processing on a $PLAYSTATION^{(R)}$ 3 (플레이스테이션 3 상에서 수행되는 멀티플렛 식별자의 최적화)

  • Hattori, Masami;Mizuno, Takashi
    • Geophysics and Geophysical Exploration
    • /
    • v.13 no.1
    • /
    • pp.109-117
    • /
    • 2010
  • To enable high-performance computing (HPC) for applications with large datasets using a $Sony^{(R)}$ $PLAYSTATION^{(R)}$ 3 ($PS3^{TM}$) video game console, we configured a hybrid system consisting of a $Windows^{(R)}$ PC and a $PS3^{TM}$. To validate this system, we implemented the real-time multiplet identifier (RTMI) application, which identifies multiplets of microearthquakes in terms of the similarity of their waveforms. The cross-correlation computation, which is a core algorithm of the RTMI application, was optimised for the $PS3^{TM}$ platform, while the rest of the computation, including data input and output remained on the PC. With this configuration, the core part of the algorithm ran 69 times faster than the original program, accelerating total computation speed more than five times. As a result, the system processed up to 2100 total microseismic events, whereas the original implementation had a limit of 400 events. These results indicate that this system enables high-performance computing for large datasets using the $PS3^{TM}$, as long as data transfer time is negligible compared with computation time.

On parallel computation for 3-d analysis of flow/wave field (3차원 유동/파동장 해석을 위한 병렬계산에 관한 고찰)

  • Lee, Woo-Dong;Hur, Dong-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.88-88
    • /
    • 2019
  • 컴퓨터 성능향상과 수치해석기법의 발달로 인해 Navier-Stokes 방정식에 기초한 수치모델을 활용한 3차원 유동/파동장 해석이 증가하고 있는 추세이다. 그러나 아직까지 Navier-Stokes 방정식 모델의 계산부하를 PC에서 소화하기에는 무리가 따른다. 게다가 실험실 스케일을 벗어나, 실제 현장을 계산영역으로 설정할 경우에는 계산량이 엄청나게 증가하게 된다. 이것을 극복하기 위해서는 반듯이 병렬계산을 수행하여야 한다. 본 연구에서는 계산부하가 큰 Navier-Stokes 방정식 기반의 3차원 수치모델 LES-WASS-3D를 활용한 대용량 병렬계산체계를 구축한다. 나아가 3차원 정밀 또는 광역의 유동/파동장 해석에 있어서 병렬계산체계의 성능과 적용성을 검토한다. 현재 보급되고 있는 PC들은 모두 멀티프로세서가 장착됨으로 손쉽게 병렬계산을 수행할 수 있다. 그러나 정밀 또는 광역해석을 위해서는 대용량 병렬계산 컴퓨터가 요구된다. 따라서 본 연구에서는 보조프로세서를 장착한 공유메모리 환경의 고성능 병렬계산체계를 구축한다. 나아가 포트란 기반의 순차코드로 구축된 기존 3차원 Navier-Stokes 방정식 모델 LES-WASS- 3D를 병렬코드로 변환한다. 병렬계산 성능 및 적용성을 검토하기 위한 수치해석을 수행한다. 이상의 과정을 통해 본 연구에서 구축한 병렬계산체계의 성능 및 적용성을 확인할 수 있었다. 그리고 3차원 유동/파동장 해석에 있어서 정확도 향상뿐 아니라, 계산영역을 확장할 수 있는 계기가 마련되었다. 또한 유동/파동 해석보다 많은 계산시간이 필요한 지형변동 해석에도 충분히 적용될 수 있다고 판단된다.

  • PDF

Design and Performance Analysis of an Active QoS Allocation Scheme for large File Transfer (대용량 파일 전송을 위한 능동적인 QoS 제공 방안의 설계 및 성능분석)

  • 김국한;이만희;변옥환;유인태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04d
    • /
    • pp.283-285
    • /
    • 2003
  • 슈퍼컴퓨터 사용자들은 FTP(File Transfer Protocol)을 이용해서 대용량의 파일을 전송한다. 전송되는 데이터들은 승용차나 비행기 설계, 의약품 개발. 기상 예보 그리고 복잡한 수학적 계산 등과 같이 다양한 분야에 걸친 연구관련 데이터로서 고성능 슈퍼컴퓨터에 의한 연산 처리가 요구된다 기존의 FTP 는 네트워크 상태에 따라 전송 지연이나 데이터 손실 등의 문제로 사용자의 불편을 초래하였다. 이에 전송 성능을 효율적으로 높이고 데이터 손실을 최소화를 제공하는 연구가 필요하다. 근래의 TCP (Transmission Control Protocol) 성능 향상 연구에 관한 연구들의 관심은 크게 두 가지이다. 하나는 윈도우 사이즈 조절(auto-tuning)이고, 다른 하나는 Multi-stream 이다. 본 연구에서는 파일 전송 성능 향상을 위한 방법으로 윈도우 사이즈 조절 방법을 사용하였고, 네트워크 상태에 따라 QoS(quality of Service)를 제공한다. 이런 성능 향상 결과로 신뢰성 있는 네트워크를 제공하여 사용자들은 신속하게 데이터를 전송하며 연산처리 결과가 더욱 정확하다고 신뢰할 수 있다. 본 고에서는 대용량 파일을 전송 할 때 성능을 향상시키는 관련 연구를 알아보고 대용량 파일 전송 중 네트워크 상태에 따라 005를 능동적으로 작용하여 테스트하고 성능을 분석하였다.

  • PDF

Volume Data Compression Using Daubechies Wavelet Transforms (Daubechies 웨이블릿 변환을 이용한 볼륨 데이터 압축)

  • Hur, Young-Ju;Park, Sang-Hun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.1411-1414
    • /
    • 2005
  • 볼륨 데이터는 시뮬레이션 통해 생성되거나 고성능 측정 장비를 이용해 측정된 값으로 구성되는 고차원 데이터의 한 형태로서 다양한 자연과학과 공학분야에서 폭넓게 활용되고 있다. 최근에는 각 분야에서 생성되는 계산 데이터의 용량이 점점 더 증가하고 있기 때문에 이런 대용량의 볼륨 데이터를 효과적으로 처리하기 위한 기법들에 관한 연구가 수행되고 있으며, 특히 대용량 볼륨 데이터 압축 기법에 대한 필요성이 증가하고 있다. 본 논문에서는 Daubechies 웨이블릿 변환과 zerobit 인코딩 스킴을 응용한 새로운 볼륨 데이터 압축 기법을 제안한다. 이 방법은 기존의 압축 방법에 비해 복원 데이터의 손실이 낮기 때문에 정밀한 영상을 요구하는 대용량 데이터 압축에 유용하게 사용될 수 있다.

  • PDF

Designing a Web-based Grid PSE Portal (웹 기반 그리드 PSE 포탈 설계)

  • 오희정;김영지;최윤정;김윤희;박형우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10e
    • /
    • pp.202-204
    • /
    • 2002
  • 그리드(Grid)〔1〕는 지리학적으로 분산되어 있는 고성능 컴퓨팅 자원을 네트워크로 상호 연동하여 조직과 지역에 관계없이 사용할 수 있는 환경으로 고속 네트워킹과 컴퓨팅 능력의 향상에 힘입어 주목할만한 발전을 이루고 있다. 이러한 그리드 기술은 고성능 및 대용량의 계산 능력을 필요로 하는 과학 및 공학 응용 연구와, 상호 협력 작업을 가능하게 하는 협업 환경을 가능하게 해준다. 따라서 그리드 기술을 기반으로 분산된 자원을 사용자가 쉽게 사용할 수 있도록 해주는 문제해결환경(PSE : Problem Solving Environment)에 대한 개발이 요구되고 있다. 이 논문은 현존하는 PSE의 기능을 분석하고, PSE 개발 시 좀더 편리하고 유연성 있는 환경을 제공하는 웹 기반의 PSE 포탈 구조를 제시하였다.

  • PDF

Developing a NT Computing Grid PSE Portal Server (NT 컴퓨팅 그리드 PSE 포탈 서버 구축)

  • 허정민;김윤희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10c
    • /
    • pp.592-594
    • /
    • 2004
  • 그리드(Grid)[1] 환경은 분산되어 있는 고성능 컴퓨팅 자원과 방대한 데이터를 네트워크로 상호 연동하여 지역적으로 분산되어있다는 제약을 받지 않고 효과적으로 활용할 수 있는 환경으로 최근에 많은 연구가 이루어지고 있다. 이러한 그리드 기술은 고성능 및 대용량의 계산 능력을 필요로 하는 과학 및 공학 응용 연구와, 상호 협력 작업을 가능하게 하는 협업 환경을 가능하게 해준다. 따라서 그리드 기술을 기반으로 분산된 자원을 사용자가 쉴게 사용할 수 있도록 해주는 문제해결환경(PSE Problem Solving Environment)에 대한 개발이 요구되고 있다. 이 논문은 현존하는 PSE의 기능을 분석하고, NT응용에서 사용 할 수 있는 포탈을 구축하고 활용하는 과정에서 실제 그리드 환경을 제공하는 서버측의 내용을 기술하였다.

  • PDF