I. Introduction
한국, 북한, 일본, 러시아 4개국이 접하고 있는 수역인 동해는 해저 자원, 해상운송을 위한 통항로 등의 측면에서 연안국들에게 매우 중요한 전략적 해양공간이다. 그리고 평균수심이 1,684m에 이르면서 해류의 특성도 다양하여 잠수함 작전 및 대잠전(Anti-Submarine Warfare) 측면에서의 군사적 중요성과 유용성 또한 매우 크다[1].
지난 20세기 초 잠수함이 등장한 이후 대잠전은 해군의 여러 임무들 가운데서도 기술적으로 가장 어려운 분야 중 하나였다. 그 이유는 존재를 노출 시키지 않기 위해 수중에서 활동하며 은밀하고 기습적으로 상대방의 전력을 공격할 수 있는 잠수함을 대상으로 하기 때문이다. 특히, SLBM(Submarine Launched Ballistic Missile)을 통해 핵무기의 수중 배치 및 운용이 가능해지면서 잠수함의 군사적 위협 능력은 더욱 강화되었으며 이러한 이유로 군사ㆍ안보 측면에서 잠수함 작전 및 대잠전의 중요성이 더욱 부각되고 있다[2].
수중에서 활동하는 잠수함을 탐지하기 위해서는 주로 소나(SONAR, Sound Navigation and Ranging)를 사용한다. 소나는 음향신호를 탐지하는 수동소나와 음파를 송신하여 반사되는 음파를 탐지하는 능동소나가 있다. 수중음파전달은 음속과 밀접한 연관성을 가지며 Mackenzie(1981)의 음속 계산식인 식(1)[3]에 따르면 음속은 해수의 수온, 염분, 수심에 따라 결정되지만 수온의 영향이 가장 크다.
c = 1448.96 + 4.591T - 5.304 × 10-2T2
+ 2.374 × 10-4T3 + 1.340(S-35)
+ 1.630 × 10-2D + 1.675 × 10-7D2
- 1.025 × 10-2T(S-35)
- 7.139 × 10-13TD3 (1)
c : 음속(m/s), T : 수온(℃), S : 염분(PSU), D : 수심(m)
한편, 해수면으로부터 음속이 최대가 되는 수심을 음향 층심도(SLD : Sonic Layer Depth)라고 한다. 해군이 현장에서 음향 층심도를 결정하는 일반적인 방법은 Fig. 1과 같이 XBT(eXpendable Bathythermograph, 소모성 연직 수온측정기)로 수온의 수직구조를 측정하고 염분은 해역평균값으로 설정한 후 음속을 계산하거나 수온 수직구조 만을 가지고 혼합층 깊이(MLD : Mixed Layer Depth)를 산출하여 음향 층심도로 전용하여 사용하고 있다[4].
Fig. 1. Temperature Data Acquisition Using XBT
잠수함 작전 및 대잠전에서 음향 층심도가 중요한 이유는 음향 층심도 내에 해표면 도파관(Surface Duct)이 형성되어 음파가 원거리까지 전달될 수 있고 Fig. 2[5]와 같이 음향 층심도 상부에서는 음파가 상향굴절하고 하부에서는 하향굴절하면서 음파가 제대로 전달되지 않는 음영구역(Shadow Zone)이 형성되기 때문이다. 잠수함은 대잠전력으로부터 피탐을 방지하고자 이러한 음영구역 내에서 기동하게 되는데 이때의 잠항심도를 최적심도(BD : Best Depth)라고 하며 식(2)[5]와 같이 산출할 수 있다.
\(\begin{aligned}Best Depth=17 \sqrt{S L D}\; if\; S L D<60 m, \; and\\ Best Depth =S L D+60 m\; if\; S L D>60 m\\\end{aligned}\) (2)
Fig. 2. Sonic Layer
따라서 수직 수온분포 예측은 잠수함 작전 및 대잠전에 필수적인 음향 층심도, 음영구역 등의 수중환경 정보를 사전에 제공하여 효율적인 전력 운용 및 전장 가시화를 보장하고 임무를 성공적으로 완수할 수 있도록 해준다. 이러한 필요성에 따라 본 논문은 XBT 데이터와 기계학습 모델을 이용하여 동해 특정해역의 해수면부터 수심 200m까지의 수온을 예측하였다.
이후 Ⅱ장에서는 인공지능 모델 기반의 수온예측 관련 선행연구를 고찰하고 Ⅲ장에서는 실험에 사용된 XBT 데이터, 기계학습 모델, 성능 평가지표 및 그래프를 통해 분석한 실험결과를 정리한다. 마지막으로 Ⅳ장에서는 향후 연구방향을 제시하고 결론을 맺는다.
II. Related Works
과거에는 대부분 수치 모델을 이용하여 수온을 예측하였지만 최근 인공지능 모델을 사용한 수온예측 연구가 활발히 이루어지고 있다.
Zhang et al. (2017)은 기존 수치 모델의 복잡성, 예측을 위한 계산에 요구되는 많은 소요시간, 다양한 해역마다 각기 다른 모델을 적용해야 하는 한계점에 대하여 설명하였다. 데이터는 NOAA High-Resolution SST Data를 사용했고 LSTM(Long Short-Term Memory) Layer를 Fully-Connected Layer와 결합한 모델을 사용하여 중국연안의 해수면 온도를 예측하였다[6].
Liu et al. (2018)은 시간의 흐름과 수온 변화의 상관관계를 반영할 수 있는 TD-LSTM(Temporal Dependence Based LSTM) 모델을 제안하였다. 이 모델은 시간 간격(Closeness, Period, Trend)을 구분하여 적용할 수 있다. Global Ocean Argo Grid Dataset(BOA_Argo Data)을 사용하여 산호해, 태평양, 남중국해의 0m, 50m, 100m, 200m, 500m 수심의 수온을 예측하였으며 LSTM, SVR(Support Vector Regression), MLPR(Multilayer Perceptron Regressor) 모델과의 비교를 통해 제안하는 모델의 성능이 우수함을 검증하였다[7].
Liu et al. (2019)은 수온과 염분 데이터를 사용하여 수온을 예측했으며 수온과 염분 데이터의 관계를 반영하기 위해 Convolutional Neural Network와 LSTM 모델을 결합한 Thermocline Convolutional LSTM 모델을 제안하였다. China Argo Real-Time Data Center의 BOA_Argo Grid Dataset을 사용하여 태평양 해역의 0m, 50m, 100m, 200m, 500m 수심의 수온을 예측하였으며 입력 데이터로 수온 데이터만을 사용한 모델보다 수온과 염분 데이터의 합성곱을 사용한 모델이 더욱 우수한 성능을 나타내고 GRU(Gradient Recurrent Unit) 모델보다 LSTM 모델이 높은 정확도를 보였다[8].
Jeong et al. (2020)은 우리나라 남해의 해수면 온도를 예측하고 고수온 현상에 대한 예측 가능성을 분석하기 위해 LSTM 모델과 Convolutional LSTM 모델을 사용하여 비교 실험을 진행하였다. 데이터는 Copernicus Marine Environment Monitoring Service에서 제공하는 OSTIA(Operational Sea Surface Temperature and Sea Ice Analysis) 해수면 온도 합성자료를 사용하였다. 해수면 온도 예측에서는 LSTM 모델보다 Convolutional LSTM 모델이 더욱 우수한 성능을 보였으며 고수온 탐지의 경우 시계열 자료 기반의 모델 특성상 예측 기간이 길어질수록 과소 및 과대 추정을 하는 경향이 있음을 확인하였다[9].
Ko et al. (2021)은 이어도 해양과학기지에서 관측한 기상 데이터 및 수심별 수온 데이터를 기반으로 LSTM 모델을 사용하여 수심 38m 지점의 수온을 예측하였다. 중층 (20.5m) 수온 데이터를 이용하여 저층 수온을 예측하는 경우 가장 높은 정확도가 달성되었으며 해수면 온도 및 기상 데이터를 사용하여 저층 수온 예측이 가능함을 확인하였다[10]. Ko et al. (2022)의 후속 연구는 고성, 양양, 강릉 및 영덕의 해양 관측 부이에서 관측된 5m, 20m, 30m의 수심별 수온 데이터와 LSTM, Bidirectional LSTM, GRU 모델을 사용하여 30m 수심의 수온을 예측하였다. 실험결과 Bidirectional LSTM과 GRU 모델이 LSTM 모델보다 우수한 성능을 보이는 것으로 나타났고 수심에 따른 예측정확도 분석에서는 모든 연구지점에서 20m에서 30m로 수심이 깊어지면서 오차도 더욱 커지는 것으로 확인되었다[11].
태평양, 남중국해 등을 대상으로 한 국외 연구의 경우 다양한 데이터를 사용하여 해수면 온도뿐만 아니라 깊은 수심의 수온까지 예측하는 연구들이 많이 진행되고 있으나 한반도 주변 해역의 경우 해수면 온도를 예측하거나 연안에서 관측된 데이터를 사용하여 50m 이내의 특정 수심의 수온을 예측하는 연구가 대부분이다.
한편, 예측 모델의 정확도를 비교, 분석하고 평가하기 위한 많은 평가지표가 있지만, 대표적으로 RMSE(Root Mean Square Error)와 MAE(Mean Absolute Error)가 사용되고 있다.
Willmott et al. (2005)은 RMSE와 MAE를 비교하는 연구를 진행하였다. RMSE는 예측값과 실제값에서 발생하는 오차의 제곱합에 대한 평균값의 제곱근으로 모델의 정확도를 나타내기에 명확하지 못한 부분이 있다. 반면 MAE는 예측값과 실제값에서 발생하는 오차에 대한 절대값의 평균으로 오차의 크기를 그대로 반영하기 때문에 정확도를 해석하기에 직관적이며 명확한 부분이 있다[12].
Hodson, T. O. (2022)의 연구를 통해서는 정규분포 데이터의 경우 RMSE로 평가하는 것이 적합하나 정규분포가 아닌 라플라스 분포를 나타내는 데이터의 경우에는 MAE로 평가하는 것이 더욱 적합한 방법임을 알 수 있다[13]. 수온 데이터는 다수의 첨두를 가지고 있는 분포 형태를 나타내기 때문에 정규분포로 가정 후 분석하는 경우에는 큰 오차가 발생한다[14].
III. The Proposed Scheme
본 논문에서 기계학습 모델을 이용하여 동해의 수직 수온분포를 예측하는 전체적인 과정은 Fig. 3에서 보는 바와 같다. 먼저 데이터를 전처리 후 학습 데이터와 평가 데이터로 분리하였고 학습 데이터를 사용하여 모델을 학습시켰다. 이때 모델의 정확도 향상을 위해 하이퍼파라미터를 튜닝하여 설정하였다. 마지막으로 학습된 모델과 평가 데이터를 사용하여 예측값을 산출하고 성능평가지표와 그래프를 사용하여 모델의 정확도를 평가하였다.
Fig. 3. Flow Chart of Main Process
1. Data
XBT는 바다에 투하되어 센서가 침강하면서 수심별 수온을 측정하는 장치이다. 연구에 사용된 XBT 데이터는 해양정보단으로부터 제공 받았으며 2011년부터 2021년까지 동해 중부 특정해역에서 해군 전력에 의해 측정되었다.
Fig. 4는 해수면부터 수심 200m까지 50m 단위로 구분하여 표시한 연도별 수온 변화 그래프를 보여주고 있다. 해수면 온도는 완벽히 대칭적이진 않지만 사인(Sine) 곡선형태의 모습을 보였으나 50m 이상의 수심에서는 이러한 특징은 관찰되지 않았다.
Fig. 4. Annual Trend of Sea Water Temperature on Multiple Depths
2. Methodology
수직 수온분포를 예측하기 위해 기계학습 모델 중 회귀분석이 가능하고 높은 정확도와 빠른 속도로 인해 다양한 분야에서 널리 사용되고 있는 세 가지 모델을 선정하였다.
RandomForest는 의사결정트리의 조합으로 각 트리는 독립적으로 샘플링되고 모든 트리에 대해 동일한 분포를 가지는 랜덤 벡터값에 의존하는 모델이다[15].
XGBoost(eXtreme Gradient Boosting)는 트리 부스팅을 사용하는 확장 가능한 기계학습 모델로서 기계학습 및 데이터 마이닝과 관련된 문제 해결에 있어 우수한 성능을 발휘하고 있다[16].
LightGBM(Light Gradient Boosting Machine)은 기존 GBDT(Gradient Boosting Decision Tree) 모델이 고차원의 큰 데이터를 처리할 때 소요되는 수행시간을 단축하고자 개발되었으며 GOSS(Gradient based One Side Sampling)와 EFB(Exclusive Feature Bundling) 기술을 적용하여 정확도는 유지하면서 처리속도는 더욱 향상된 모델이다[17].
3. Experiments
3.1 Experiments Environment & Data Preprocessing
실험은 Windows 10 Home 64bit 운용체제, Intel(R) Core(TM) i5-8520U CPU, 8G RAM 사양의 노트북에서 Google Colaboratory를 사용하여 진행하였다.
XBT 데이터는 측정 시점과 위치에 따라 측정한 수심이 상이하여 해수면부터 수심 200m까지 10m 단위로 수심별 수온 데이터를 추출하는 과정을 먼저 수행하였다. 그러나 특정해역 내에서 다양한 해군 전력들이 비주기적 그리고 고정되지 않은 위치에서 측정한 데이터이기 때문에 위도 차이, 해류 등의 영향으로 결측치 및 이상치가 발생하였다. 이러한 결측치 및 이상치를 처리하기 위해서 수심별 평균 수온과 표준편차, 선형보간법을 사용하여 데이터를 전처리한 후 실험에 사용하였다.
Table 1은 전처리 전ㆍ후의 데이터, 정선해양 관측자료 중 해수면부터 수심 200m까지 50m 단위로 나타낸 수심별 수온 데이터의 최소 수온과 최대 수온이다. 해양수산부 국립수산과학원에서 주관하는 정선해양 관측(Regular Line Observation)은 선박을 사용하여 연 6회(2월, 4월, 6월, 8월, 10월, 12월) 지정된 관측정점에 대하여 수행하는 해양조사이다. Table 1의 정선해양 관측자료는 2011년부터 2021년까지 동해 107-04 정점(38.21˚N-129.05˚E)에서 관측된 수온 데이터로 XBT 데이터가 측정된 해역과 근접한 위치의 정점이다. 전처리 전ㆍ후의 데이터와 정선해양 관측자료의 수심별 최소/최대 수온을 비교하였으며 전처리 전의 데이터보다 전처리 후의 데이터가 실제 해양의 수온과 더욱 유사함을 확인하였다. Fig. 5는 전처리 후 실험에 사용한 데이터 중 해수면부터 수심 200m까지 50m 단위로 표시한 연도별 수온 변화 그래프이다.
Table 1. Sea Water Temperature on Raw/Preprocessed and Regular Line Observation Data
Fig. 5. The Changes in Sea Water Temperature on Preprocessed Data
3.2 Data Division & Model Training
측정된 XBT 데이터 중 2011년부터 2020년까지의 데이터를 학습 데이터로 2021년 데이터를 평가 데이터로 사용하였으며 학습 데이터는 8,408회 측정되었고 평가 데이터는 501회 측정되었다. 15회 측정된 데이터를 이용하여 다음 1회의 수직 수온분포를 예측하도록 모델을 학습시키기 위해 15회 측정된 데이터가 한 번에 입력될 수 있도록 시계열 데이터 구조로 변경하여 실험하였다.
3.3 Parameter Setting
모델의 정확도 향상을 위한 최적의 하이퍼파라미터를 선정하기 위해 파이썬 라이브러리(Python Library)의 ‘scikit-learn'에서 이용 가능한 RandomizedSearchCV를 사용하였으며 실험에 사용한 모델별 하이퍼파라미터는 Table 2에서 보는 바와 같다.
Table 2. Used Hyperparameters on Experiments
4. Results
본 논문에서는 MAE를 사용하여 모델의 정확도를 평가하였으며 MAE가 크면 예측정확도가 낮아지는 것이고 MAE가 작으면 예측정확도가 높아지는 것이다. 계산식은 식(3)과 같으며 At는 t번째 측정한 실제 수온 값이고 Ft는 t번째의 수온 예측값이다.
\(\begin{aligned}\mathrm{MAE}=\sum_{t=1}^{N} \frac{\left|A_{t}-F_{t}\right|}{N}\end{aligned}\) (3)
파라미터 세팅 후 모델을 학습시키고 평가 데이터와 MAE를 사용하여 모델의 정확도를 비교한 결과는 Table 3에서 보는 바와 같으며 모델별 MAE는 RandomForest : 0.6144, XGBoost : 0.6192, LightGBM : 0.6189로 산출되어 RandomForest, LightGBM, XGBoost 순으로 높은 정확도를 보였다. 파라미터 세팅 전과 후의 MAE를 비교해보면 RandomForest : –0.0125, XGBoost : –0.0049, LightGBM은 : –0.0072만큼 파라미터 세팅 후 모든 모델의 정확도가 향상되었다. 모델의 파라미터 세팅 전에는 XGBoost, LightGBM, RandomForest 순으로 높은 정확도를 보였지만 파라미터 세팅 후에는 RandomForest, LightGBM, XGBoost 순으로 높은 정확도를 보였다.
Table 3. Comparison of MAE in Different Methods
정확도가 가장 우수한 RandomForest를 사용하여 평가 데이터인 2021년의 해수면부터 수심 200m까지 수심 50m 단위로 예측값과 실제값을 비교한 그래프는 Fig. 6에서 보는 바와 같다. 수심별 MAE는 0m : 0.8090, 50m : 0.9506, 100m : 0.6390, 150m : 0.3005, 200m : 0.1312로 산출되었고 상대적으로 시간에 따른 수온 변화가 큰 100m 이내의 수심에서 오차가 크게 나타났다.
Fig. 6. Comparison of Prediction and True Sea Water Temperature in Multiple Depths
2021년의 월별 특정 일자의 예측값과 실제값을 비교한 수직 수온분포 그래프는 Fig. 7에서 보는 바와 같다. 예측값과 실제값이 상당히 유사하였으며 이러한 결과는 XBT데이터와 기계학습 모델을 사용하여 동해의 수직 수온분포를 1℃ 미만의 오차로 예측 가능함을 확인시켜 준다.
Fig. 7. Comparison of Prediction and True Vertical Sea Water Temperature Profile by Month
IV. Conclusions
잠수함 작전 및 대잠전은 해양 안보 측면에서 매우 중요하며 음향 층심도는 잠수함 작전 및 대잠전을 효율적으로 수행하기 위한 핵심적인 요소이다. 그리고 음향 층심도를 파악하기 위해서는 수직 수온분포 정보가 필수적이므로 수직 수온분포 예측은 효율적인 전력 운용 및 전장 가시화를 위해 반드시 선행되어야 한다. 이에 본 논문에서는 XBT 데이터와 RandomForest, XGBoost, LightGBM 모델을 사용하여 동해의 수직 수온분포를 예측하였다.
모델의 정확도 비교를 위한 지표는 MAE를 사용하였고 정확도 향상을 위해 파라미터 세팅을 수행한 후 전과 후의 MAE를 비교하였다. 그 결과 파라미터 세팅한 이후 모든 모델의 정확도가 향상되었고 RandomForest의 MAE가 0.6144로 가장 높은 정확도를 나타냈다. 이는 기계학습 기반 예측 연구에 있어 파라미터 세팅의 필요성을 확인시켜준다.
수심에 따른 예측값과 실제값 비교한 결과 상대적으로 수온 변화가 큰 100m 이내 수심에서 더 큰 오차가 발생하였고 월별 수직 수온분포 그래프를 통해 예측값과 실제값을 비교한 결과 상당히 유사한 결과가 도출되었다. 이를 통해 XBT 데이터와 기계학습 모델을 사용하여 수직 수온분포 예측이 가능함을 확인하였다.
본 논문 연구를 진행하는 과정에서 XBT 데이터를 사용하여 더욱 정확하게 수온을 예측하기 위해서는 측정 방법 및 데이터 수집 방법에 대한 개선이 필요함을 인식하였다. 그러나 XBT 데이터는 해군 전력이 측정하기 때문에 측정방법 개선은 작전, 전력 운용 등 많은 요소가 고려되어야 하므로 향후에는 수온예측을 위한 효율적인 XBT 데이터 구축 방안과 관련된 연구를 진행할 계획이다.
또한, 적용하는 모델별로 하이퍼파라미터 종류가 매우 다양하므로 객관적인 모델의 정확도 비교를 위한 파라미터 세팅 방법과 관련된 연구도 추가적으로 진행할 예정이다.
References
- H. Y. Kim, "Maritime Conflicts in East Asia and the Implications for South Korea," The Journal of Social Science, Vol. 24, No. 2, pp. 247-248, June. 2017, DOI: 10.46415/JSS.2017.06.24.2.239
- J. Y. Kim, "Conducting Strategic Anti-submarine Warfare at the Korean Peninsula," The Journal of Strategic Studies, Vol. 24, No. 1, p. 135, March. 2017.
- Mackenzie. K.V, "Nine-term Equation for Sound Speed in the Oceans," the Journal of the Acoustic Society of America, Vol. 70, No. 3, pp. 807-812, June. 1981, DOI: 10.1121/1.386920
- S. H. Im, "Analysis of Differences between the Sonic Layer Depth and the Mixed Layer Depth in the East Sea, "Journal of the Korea Institute of Information and Communication Engineering, Vol. 19, No. 5, p. 1260, May. 2015. DOI: 10.6109/JKIICE.2015.19.5.1259
- Joseph Hall, "Principles of Naval Weapons Systems," US Naval Academy, p. 186, 2000.
- Q. Zhang, H. Wang, J. Dong, G. Zhong and X. Sun, "Prediction of Sea Surface Temperature Using Long Short-Term Memory," IEEE Geoscience and Remote Sensing Letter, Vol. 14, No. 10, pp. 1745-1749, Oct. 2017, DOI: 10.1109/LGRS.2017.2733548.
- J. Liu, T. Zhang, G. Han and Y. Gou, "TD-LSTM: Temporal Dependence-Based LSTM Networks for Marine Temperature Prediction," Sensors 2018, Vol. 18, No. 11, pp. 1-13, Nov. 2018, DOI: 10.3390/s18113797
- J. Liu, T. Zhang, Y. Gou, X. Wang, B. Li and W. Guan, "Convolutional LSTM Networks for Seawater Temperature Prediction," 2019 IEEE International Conference on Signal Information and Data Processing (ICSIDP), pp. 1-5, Chongqing, China, Dec. 2019, DOI: 10.1109/ICSIDP47821. 2019.9173301
- S. J. Jeong, Y. J. Kim, S.M. Park and J. H. Im, "Prediction of Sea Surface Temperature and Detection of Ocean Heat Wave in the South Sea of Korea Using Time-series Deep-learning Approaches," Korean Journal of Remote Sensing, Vol. 26, No. 5-3, pp. 1077-1093, Oct. 2020, DOI: 10.7780/kjrs.2020.36.5.3.7
- K. S. Ko, Y. W. Kim, S. H. Byeon, and S. J. Lee, "LSTM Based Prediction of Ocean Mixed Layer Temperature Using Meteorological Data," Korean Journal of Remote Sensing, Vol. 37, No. 3, pp. 603-614, June. 2021, DOI: 10.7780/ kjrs.2021.37.3.19
- K. S. Ko, S. H. Byeon and Y.W. Kim "Prediction of Sea Water Temperature by Using Deep Learning Technology Based on Ocean Buoy," Korean Journal of Remote Sensing, Vol. 38, No. 3, pp. 299-309, June. 2022, DOI: 10.7780/kjrs.2022.38.3.6
- CJ. Willmott, K. Matsuura, "Advantages of the Mean Absolute Error(MAE) over the Root Mean Square Error (RMSE) in Assessing Average Model Performance," Climate Research, Vol. 30, pp. 79-82, Dec. 2005, DOI: 10.3354/cr030079
- Hodoson, T. O, "Root-mean-square error(RMSE) or mean absolute error(MAE): when to use them or not," Geoscientific Model Development, Vol. 15, No. 14, pp. 5482-5483, Jul. 2022, DOI:10.5194/gmd-15-5481-2022
- S. T. Jeong, H. Cho, D. H. Ko, N. S. Oh and K. P. Son, "Estimation of Probability Distribution Fuctions for Water Tempearture Data in Korean Coasts," Journal of Korean Society of Coastal and Ocean Engineers, Vol. 25, No. 1, p.11, Feb. 2013, DOI: 10.9765/kscoe.2013.25.1.11
- L. Breiman, "Random Forests," Machine Learning, Vol. 45, pp. 5-32, April. 2001, DOI: 10.1023/A:1010933404324
- T. Chen, C. Guestrin, "XGBoost: A Scalable Tree Boosting System," 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD '16), pp. 785-794, New York, USA, August. 2016, DOI: 10.1145/2939672.2939785
- G. Ke, Q. Meng, T. Finley, T. Wang, W. Chen,W. Ma, Q. Ye and TY. Liu, "Lightgbm: A Highly Efficient Gradient Boosting Decision Tree," Advances in Neural Information Processing Systems, No. 30, pp. 3146-3154, Long Beach, CA, USA, Dec. 2017.