Abstract
HDF5 data format is used to effectively store and distribute large volume of Geostationary Ocean Color Imager(GOCI) satellite data. The Korea Ocean Satellite Center has developed and provided a GOCI Data Processing System(GDPS) for general users who are not familiar with HDF5 format. Nevertheless, it is not easy to merge and process Hierarchical Data Format version5(HDF5) data that requires an understanding of satellite data characteristics, needs to learn how to use GDPS, and stores location and attribute information separately. Therefore, the open source R and rhdf5, data.table, and matrixStats packages were used to develop algorithm that could easily utilize satellite data in HDF5 format without the need for the process of using GDPS.
해양관측 정지궤도 위성인 GOCI(Geostationary Ocean Color Imager) 데이터는 대용량 산출물을 효과적으로 저장, 배포하기 위해 HDF5 자료 형식을 사용하고 있다. 해양위성센터에서는 HDF5(Hierarchical Data Format version5) 포맷에 익숙지 않은 일반 사용자를 위해 GDPS(GOCI Data Processing System)를 개발하여 관측자료와 함께 제공하고 있다. 그럼에도 불구하고 위성데이터 특성에 대한 이해와 GDPS의 사용법을 익혀야 하는 점, 그리고 위치정보와 속성정보가 분리되어 있는 HDF5 형식의 자료를 병합하고 가공하는 일은 쉽지 않은 일이다. 따라서 본 연구에서는 오픈소스 R과 rhdf5, data.table, matrixStats 패키지를 이용하여 GDPS를 이용하는 과정 없이도 HDF5 형식의 위성데이터를 손쉽게 활용할 수 있는 알고리즘을 개발하였다.