DOI QR코드

DOI QR Code

머신러닝 기법을 활용한 낙동강 하구 염분농도 예측

Nakdong River Estuary Salinity Prediction Using Machine Learning Methods

  • 이호준 (동아대학교 컴퓨터AI공학부 컴퓨터공학과) ;
  • 조민규 (동아대학교 컴퓨터AI공학부 컴퓨터공학과) ;
  • 천세진 (동아대학교 컴퓨터AI공학부) ;
  • 한정규 (동아대학교 컴퓨터AI공학부)
  • 투고 : 2022.03.07
  • 심사 : 2022.03.22
  • 발행 : 2022.03.31

초록

하천의 염분 변화를 신속히 예측하는 것은 염분 침투로 인한 농업, 생태계의 피해를 예측하고 재해 방지 대책을 수립하기 위해서 중요한 작업이다. 머신러닝 기법은 물리 기반 수리 모델에 비해 계산량이 훨씬 적기 때문에, 비교적 짧은 시간에 염분농도를 예측 가능하여 물리 기반 수리 모델의 보완 기법으로 연구되고 있다. 해외에서는 머신러닝 기법 기반 염분 예측 연구들이 활발히 연구되고 있으나, 대한민국의 공공데이터에 머신러닝 기법을 적용한 연구는 충분치 않다. 낙동강 하구의 환경 정보에 관한 공공데이터와 함께, 본 연구는 여러 종류의 머신러닝 기법의 염분농도에 대한 예측 성능을 측정하였다. 실험 결과에서, 결정 트리 기반의 LightGBM 알고리즘은 평균 RMSE 0.37의 예측 정확도와 타 알고리즘 대비 2-20배 빠른 학습 속도를 보여주었다. 따라서 국내 하천의 염분농도 예측에도 머신러닝 기법을 적용할 수 있다고 판단된다.

Promptly predicting changes in the salinity in rivers is an important task to predict the damage to agriculture and ecosystems caused by salinity infiltration and to establish disaster prevention measures. Because machine learning(ML) methods show much less computation cost than physics-based hydraulic models, they can predict the river salinity in a relatively short time. Due to shorter training time, ML methods have been studied as a complementary technique to physics-based hydraulic model. Many studies on salinity prediction based on machine learning have been studied actively around the world, but there are few studies in South Korea. With a massive number of datasets available publicly, we evaluated the performance of various kinds of machine learning techniques that predict the salinity of the Nakdong River Estuary Basin. As a result, LightGBM algorithm shows average 0.37 in RMSE as prediction performance and 2-20 times faster learning speed than other algorithms. This indicates that machine learning techniques can be applied to predict the salinity of rivers in Korea.

키워드

과제정보

이 논문은 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (No.1711140476).

참고문헌

  1. 낙동강유역물관리위, "낙동강 하구 기수생태계 복원방안 의결," 2022.
  2. 오정원, 김행곤, 김일태. "머신러닝 적용 과일 수확시기 예측시스템 설계 및 구현," 스마트미디어저널, 제8권, 제1호, 74-78쪽, 2019. https://doi.org/10.30693/SMJ.2019.8.1.74
  3. 김정준, 채범석, 이영관, 조기환. "에너지저장시스템에서 발전량 예측을 통한 능동적 배터리 충전 관리 방안," 스마트미디어저널, 제9권, 제1호, 84-89쪽, 2020 https://doi.org/10.30693/SMJ.2020.9.1.84
  4. 박동주, 김병우, 정영선, 안창욱. "Deep Neural Net work 기반 프로야구 일일 관중 수 예측: 광주-기아 챔피언스 필드를 중심으로." 스마트미디어저널, 제7권, 제1호, 16-23쪽, 2018. https://doi.org/10.30693/SMJ.2018.7.1.16
  5. 김상현, 이한범, 전성완, 김대연, 이상정, "LTSM 신경망을 이용한 당뇨병 입원환자의 혈당 예측," 정보과학회논문지, 제47권, 제12호, 1120-1125쪽, 2020년 12월
  6. D. Won, S. Kim, Y. Kim, and G. Song, "Prediction of Fine Dust in Gyeonggi-do Industrial Complex using Machine Learning Methods." Journal of KIISE, Vol. 48, No.7, pp.764-773, Jul. 2021. https://doi.org/10.5626/JOK.2021.48.7.764
  7. S.K. Park, T.Y. Noh, D.H. Kim, and C.S. Han, "The Study of Salinity Distribution at Nakdong River Estuary," Proceedings of the 18th Korean Society of Coastal and Ocean Engineers Conference, pp. 109-112, Busan, Republic of Korea, Nov. 2009.
  8. M.H. Choo, Y.D. Kim, and W.M. Jeong, "Prediction of Salinity Changes for Seawater Inflow and Rainfall Runoff in Yongwon Channel," Journal of Korea Water Resources Association, vol. 47, no. 3, pp. 297-306, Mar., 2014. https://doi.org/10.3741/JKWRA.2014.47.3.297
  9. T. Rajkumar and M. L. Johnson, "Prediction of salinity in San Francisco bay delta using neural network," IEEE Int'l Conf. on Systems, Man and Cybernetics. e-Systems and e-Man for Cybernetics in Cyberspace, Vol. 1, pp. 329-334, 2001.
  10. C. Qiu and Y. Wan, "Time series modeling and prediction of salinity in the Caloosahatchee River Estuary," Water Resources Research, Vol. 49, No. 9, pp. 5804-5816, Jul., 2013. https://doi.org/10.1002/wrcr.20415
  11. A. M. Melesse, K. Khosravi, J. P. Tiefenbacher, S. Heddam, S. Kim, A. Mosavi, and B. T. Pham, "River Water Salinity Prediction Using Hybrid Machine Learning Models," Water, Vol. 12, No. 10, pp. 2951-2971, Oct., 2020. https://doi.org/10.3390/w12102951
  12. D. Tran, M. Tsujimura, N. Ha, V. Nguyen, D. Binh, T. Dang, Q. Doan, D. Bui, T. Ngoc, L. Phu, P. Thuc, and T. Pham, "Evaluating the predictive power of different machine learning algorithms for groundwater salinity prediction of multi-layer coastal aquifers in the Mekong Delta, Vietnam," Ecological Indicators, Vol. 127, Aug. 2021.
  13. J. Hamrick, "A Three-Dimensional Environmental Fluid Dynamics Computer Code; Theoretical and Computational Aspects," Virginia Institute of Marine Science Special Report, May 1992.
  14. Blumberg, A.F. "A primer for ECOMSED version 1.3 users manual," HydroQual, Inc., USA. Feb., 2002.
  15. F. Murtagh, "Multilayer perceptrons for classifica tion and regression," Neurocomputing, Vol. 2, Issues. 5-6, pp. 183-197, Jul. 1991. https://doi.org/10.1016/0925-2312(91)90023-5
  16. T. Chen and C. Guestrin. "XGBoost: A Scalable Tree Boosting System," Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. pp. 785-794, San Francisco, USA, Aug. 2016.
  17. G. Ke, Q. Meng, T. Finley, T. Wang, W. Chen, W. Ma, Q. Ye, and T.-Y. Liu, "LightGBM: A Highly Efficient Gradient Boosting Decision Tree," Proceedings of the 31st International Conference on Neural Information Processing Systems, pp. 3149-3157, Long Beach, USA. Dec., 2017.
  18. From Algorithms to Z-Scores: Probabilistic and Statistical Modeling in Computer Science, http://uilis.unsyiah.ac.id/oer/items/show/139 (accessed Mar., 6, 2022)