딥러닝 기반 지하수위 예측 모델 개발에 있어 데이터 부족 문제 해결을 위한 전이학습의 응용

Applying Transfer Learning to Improve the Performance of Deep Learning-based Groundwater Level Prediction Model with Insufficient Training Data

  • Jiho Jeong (Department of Geology, Kyungpook National University) ;
  • Jina Jeong (Department of Geology, Kyungpook National University)
  • 투고 : 2024.09.26
  • 심사 : 2024.10.11
  • 발행 : 2024.10.29


인공신경망과 같은 데이터 기반 모델을 활용하여 지하수위를 예측하기 위해서는 일반적으로 충분한 양의 데이터가 필요하다. 그러나 지하수위 모니터링 관정이 새로 개발되거나 유효하지 않은 데이터(예를 들어, 결측치 또는 이상치)가 다수 관찰되는 경우, 예측 모델을 적절히 학습하기 위한 데이터셋을 확보하기가 어려우며, 이는 예측 정확도의 저하로 이어진다. 본 연구에서는 이러한 학습 데이터 부족 문제를 해결하기 위해 전이 학습(Transfer Learning)을 기반으로 하는 방법을 제안하였다. 게이트 순환 유닛(Gated Recurrent Unit, GRU)을 예측을 위한 기본 데이터 기반 모델로 사용하였다. 전이학습 과정을 위한 GRU 기반 사전 학습 네트워크(Pretrained network)는 국내 전역의 89개 모니터링 지점에서 수집된 지하수위 및 이에 대응하는 강우 데이터를 활용하여 개발되었다. 그 후, 타겟 모니터링 관정에서 확보된 소량의 학습 데이터를 사용하여 사전 학습된 네트워크에 대한 미세 조정(Fine-tuning) 을 통해 최종 예측 모델을 개발하였다. 전이학습 알고리즘의 효과를 검증하기 위해 두 가지 서로 다른 지하수위 예측 모델을 비교 평가하였다: 1) 타겟 관정의 불충분한 데이터를 사용하여 학습된 GRU 기반 지하수위 예측 모델 및2) 전이학습 알고리즘을 기반으로 한 GRU 기반 예측 모델. 두 개의 다른 위치에 존재하는 관정에서 획득한 지하수위 자료에 대한 비교 검증이 이루어졌으며, 전이학습 알고리즘을 활용한 모델이 다른 모델에 비해 우수한 성능을 보였다. 이를 통해 사용 가능한 학습 데이터의 양에 상관없이 전이학습 알고리즘이 지하수위 예측 모델 성능 향상에 크게 기여할 수 있음을 확인하였다.

Predicting groundwater levels with data-driven models like artificial neural networks typically requires a substantial amount of data. However, when groundwater monitoring wells are newly developed or when a significant portion of the data is invalid (for example, due to missing values or outliers), acquiring an adequate dataset for training prediction models becomes challenging, leading to diminished prediction accuracy. This study proposes a method based on transfer learning to address the issue of insufficient training data. The Gated Recurrent Unit (GRU) was used as the primary data-driven model for predictions. A GRU-based pretrained network for the transfer learning process was developed using groundwater level and corresponding rainfall data collected from 89 monitoring stations nationwide. Subsequently, this pretrained network was fine-tuned using a small amount of training data obtained from the target monitoring well to develop the final prediction model. To verify the effectiveness of the transfer learning algorithm, two different groundwater level prediction models were evaluated: 1) a GRU-based model trained with insufficient data from the target well, and 2) a GRU-based model utilizing the transfer learning algorithm. Comparative verification was conducted with groundwater level data obtained from wells at two different locations, where the model using the transfer learning algorithm demonstrated superior performance compared to the other. This study confirms that the transfer learning algorithm can significantly enhance the performance of groundwater level prediction models, irrespective of the amount of available training data.



이 논문은 2023학년도 경북대학교 연구년 교수 연구비에 의하여 연구되었음


