DOI QR코드

DOI QR Code

ARIMA 모델을 이용한 수막재배지역 지하수위 시계열 분석 및 미래추세 예측

Time-series Analysis and Prediction of Future Trends of Groundwater Level in Water Curtain Cultivation Areas Using the ARIMA Model

  • Baek, Mi Kyung (Jeju Regional Headquarter, Korea Rural Community Corporation) ;
  • Kim, Sang Min (Department of Agricultural Engineering (Institute of Agriculture and Life Science), Gyeongsang National University)
  • 투고 : 2022.08.26
  • 심사 : 2022.12.21
  • 발행 : 2023.03.31

초록

This study analyzed the impact of greenhouse cultivation area and groundwater level changes due to the water curtain cultivation in the greenhouse complexes. The groundwater observation data in the Miryang study area were used and classified into greenhouse and field cultivation areas to compare the groundwater impact of water curtain cultivation in the greenhouse complex. We identified the characteristics of the groundwater time series data by the terrain of the study area and selected the optimal model through time series analysis. We analyzed the time series data for each terrain's two representative groundwater observation wells. The Seasonal ARIMA model was chosen as the optimal model for riverside well, and for plain and mountain well, the ARIMA model and Seasonal ARIMA model were selected as the optimal model. A suitable prediction model is not limited to one model due to a change in a groundwater level fluctuation pattern caused by a surrounding environment change but may change over time. Therefore, it is necessary to periodically check and revise the optimal model rather than continuously applying one selected ARIMA model. Groundwater forecasting results through time series analysis can be used for sustainable groundwater resource management.

키워드

Ⅰ. 서론

수막용수는 겨울철에 많은 양의 지하수 양수가 이루어지고 온도 유지에 사용한 후에는 농수로를 통해 하천으로 배출되는 것이 일반적이며, 동절기에 다량의 지하수를 집중적으로 양수하게 되므로 일시적인 지하수 고갈 문제가 발생하고 있다(KIGAM, 2010; Moon et al., 2012). 수막재배단지는 주로 하천 주변에 대규모 단지 형태로 집중되어 있어 제한된 영역에서의 수막용수 과다사용은 지하수위의 고갈을 초래하며 이에따라 지속적인 수막용수 확보에 어려움을 겪고 있으며(Chang et al., 2016), 농업용수로 사용되는 지하수 중 상당량이 수막재배에 사용되고 있는 것으로 추정되고 있다(Kim et al., 2007).

지하수 관측망을 통한 지하수자원의 효과적인 관리 및 운영을 위해 지하수위 변화를 분석하고 예측하는 것이 필요하다. 시계열 분석은 연속적으로 측정된 자료에 대한 통계적인 해석 방법으로 모델 수립을 통한 관측자료의 패턴 분류와 이를 통한 예측을 수행할 수 있다(Adamowski and Harmory, 1983; Furbish, 1991; Tankersley et al., 1993; Knotters and van Walsum, 1997; Bierkens et al., 1999; Yi and Lee, 2004). 지하수 위 예측 방법으로 크게 물리 모델링 기법 및 시계열 모델링 기법을 들 수 있다(Yoon et al., 2013). 물리 모델링 기법은 지하수 유동에 대한 물리적 개념을 바탕으로 수학적인 지배방정식을 세우고 이를 해석적 혹은 수치적으로 풀이하는 방법으로(Rai and Singh, 1995; Knotters and Bierkens, 2000) 대상지역의 지하수위에 대한 장기적인 시공간 분포 모의가 가능하지만 정확한 예측을 위해 매질의 물성값에 대한 정확한 측정 자료가 요구된다(Yoon et al., 2011). 시계열 모델링 기법은 지하수위 시계열 관측 자료를 출력변수로, 지하수위 변화에 영향을 주는 강우, 하천수위 등의 시계열 관측 자료를 입력변수로 하여 입⋅출력 변수 간의 반응 관계를 바탕으로 지하수 위의 변화를 예측한다. 지하수위에 대한 시계열 모델링을 위해서는 입⋅출력 변수에 대한 연속적인 시계열 관측자료가 필요하지만, 대상 영역의 물성값에 대한 정보가 필요하지 않으며 특히 단기 예측에 대해 뛰어난 성능을 보이는 것으로 알려져 있다(Yoon et al., 2014).

Box and Jenkins(1976)에 의해 고안된 선형 모델인 자기회귀누적이동평균 모델 및 전이함수 잡음 모델을 적용하는 연구들이 국내외에서 수행되어왔다(Tankersley et al., 1993; Yi and Lee, 2004; Yi et al., 2004). 최근에는 입⋅출력 간의 비선형성을 고려할 수 있는 기계학습 기법을 활용한 지하수위 시계열 예측 모델 개발 및 적용 연구가 진행되고 있다(Coulibaly et al., 2001; Coppola et al., 2005; Gill et al., 2007; Behzad et al., 2010; Yoon et al., 2011). 시계열 모델을 이용한 예측방법은 크게 직접예측(direct prediction)과 반복예측(recursive prediction)의 두 가지로 나눌 수 있다(Ji et al., 2005; Herrera et al., 2007). 직접예측은 자기회귀성분, 즉 지하수위를 포함한 입력자료에 대해 과거 관측값만을 이용하여 예측을 수행하는 방법으로 지하수위 예측 분야의 적용에 있어 비교적 긴 관측주기 자료나 실시간 관측 시스템 자료에 적용할 때 유용하다. 그러나 각 미래 예측 시간(lead time)에 모델을 구성해야 하므로 장기 예측에는 적합하지 않다. 반복예측은 일반적으로 최소 단위 미래 예측 시간에 대한 직접 예측 모델을 구성하고 입력자료 중 자기회귀성분에 대해 예측된 값을 반복적으로 예측하는 방법으로 직접 예측보다 단기 예측 능력은 비교적 떨어지지만 장기 예측 및 임의 입력자료에 대한 지하수위 변화 모의가 가능하다(Yoon et al., 2014). 현재까지 진행된 시계열 모델 기반 지하수위 변화 예측 연구들은 직접예측 방법을 이용한 사례가 대부분이었다.

지하수위에 대한 시계열 분석에 대한 국내연구를 살펴보면 Yi et al. (2004)은 지하수위 시계열 분석에 적용된 모델에 대한 이론적 배경과 근거를 검토하고 국가지하수 관측소 중 한강권역 내 대표 관측정의 수위자료의 변동 패턴을 분류, 각 패턴에 대한 시계열 모델을 분석하였다. 그 결과 상당부분은 AR 모델, MA 모델, ARMA 모델, ARIMA 모델 혹은 계절 ARIMA 모델 등으로 적합 시킬 수 있는 것으로 나타났으며, 강우에 의한 변동이 우세한 관측소의 지하수위는 ARMA 모델으로 식별이 가능하였으며, 보다 장기적인 예측을 위해서는 계절형 ARIMA 모델이 유리한 것으로 발표하였다. Lee et al.(2009)는 경남 창원시 대산면에 위치한 강변여과 취수장 부근 11개 관측정의 5년간의 지하수위 자료를 이용한 지하수위를 설명하는 시계열 모델의 개발에 관한 연구에서 분단위 자료를 월자료로 변환하고, 결측치를 보완하여 Box-Jenkins 방법에 따라 시계열 분석을 실시한 결과 대상지역의 지하수위 자료는 계절형 ARIMA 모델로 잘 설명되는 것이 입증한 바 있다.

시설재배지역의 지하수 사용량 증가로 인한 지하수 부족문제에 접근하고 원인과 대책을 마련하기 위한 지하수 관측과 분석 및 예측에 관한 연구는 지속되어 왔으나 시설재배지역 내의 지하수 관측을 목적으로 설치된 관측정이 별로 없는 상태였다. 그러나, 밀양지역에 보조지하수관측망이 구축되면서 강변 시설재배지역 내에 충분한 관측정이 설치되어 강변으로부터 이격거리에 따른 관측, 충적과 암반으로 구분된 관측, 다중심도 관측 등이 가능해졌다. 본 연구에서는 겨울철 수막용수 사용으로 인해 지하수 사용량이 증가하는 시설재배 단지를 대상으로 시계열분석을 통해 지하수위의 변동특성을 분석하고 미래추세를 예측하였다. 이를 통해 시설재배단지에서의 지하수 사용의 지속가능성을 평가할 수 있다. 또한, 일반 농업지역과의 비교를 통해 시설재배단지의 지하수 사용의 특성을 평가하였다.

Ⅱ. 재료 및 방법

1. 대상지역 및 지하수 관측공

본 연구의 대상지역은 경상남도 밀양시 일원으로 남쪽 경계로 낙동강이 위치하고 고도가 높은 북서쪽 산내면에서 발원된 동천이 밀양강으로 합류하여 상남들과 하남들을 지나 낙동강으로 합류된다(Fig. 1). 시설재배지역은 주로 강변에 위치하며 낙동강과 밀양강변에 위치한 하남읍의 하남들과 상남면의 상남들, 삼랑진읍 거족들 일대에 위치한다. 이 지역은 동절기 수막재배를 위해 대부분 지하수를 개발하여 이용중에 있으며 동절기 집중사용으로 인해 동절기 동안 일대의 지하수위가 떨어지고, 지하수 이용량이 증가할수록 충적관정에서 암반관정으로 지하수 개발 심도가 증가하고 있고 심부 지층에 포함된 염분의 상승으로 지하수의 전기전도도가 상승하기도 한다. 대규모 시설농업단지가 집중되어 있는 낙동강과 밀양강 인근의 상남면, 하남면, 삼랑진읍의 강변지역에 총 2,306공의 관정이 설치되어 있으며 대부분 충적지하수를 이용하는 충적관정이고, 생육용수와 수막재배용으로 사용된다. 시설재배단지가 가장 밀접되어 있는 하남읍의 경우 지하수 관정은 총 1,031공이고 그 중 92.6%인 955공이 농업용으로 대부분 시설재배용수와 수막재배용수로 사용 중이다(Miryang, 2020).

NGHHCI_2023_v65n2_1_f0001.png 이미지

Fig. 1 Streams and overview map of riverside Sangnamdeul, Hanamdeul, where huge greenhouse complexes are located

본 연구의 대상지역인 밀양지역은 보조지하수관측망 총 31개소가 운영중에 있으며, 국가지하수관리계획의 하부계획인 ‘경상남도 지하수관리계획(2017∼2023)’에 의거 2012년에 6개소의 관측공 설치를 시작으로, 2013년 7개소, 2014년 10개소, 2015년 8개소를 설치하였고, 2016년부터 2019년 현재까지 관측⋅운영 중이다(Miryang, 2019). 시설재배지역의 수막재배로 인한 지하수 영향분석을 위해 시설재배지역과 일반농업지역과 구분하여 지하수 수위 변화 특성을 분석하였다. 대상지역의 31공의 관측공을 농업유형과 위치, 고도 등에 따라 시설재배지역은 강변 15개소, 일반농업지역은 평지 10개소, 산악 6개소로 분류하였다. 다음의 Fig. 2는 대상지역의 유형별 지하수 관측공을 분류한 결과를 보여주고 있다. 일반농업지역은 초동면, 무안면, 부북면, 산외면, 상동면 등 평지지역과 청도면 단장면, 산내면 등 산악지역으로 주로 논과 밭농사가 대부분이며 관개시설 기반이 되어있고 일부 비 관개지역은 지하수 등으로 농업용수를 공급받고 있다.

NGHHCI_2023_v65n2_1_f0002.png 이미지

Fig. 2 The location of 31 groundwater monitoring wells categorized by agricultural type(‘MYM-’ was omitted from the site number shown)

2. 시계열 분석

가. 시계열 자료

시계열 자료는 일반적으로 동일한 시간간격(Fixed time interval)으로 이루어진 벡터로서, 그 특징은 시계열 자료들이 독립이 아니라 상호 연관되어 있다는 점이다. 시계열 자료를 대상으로 하는 시계열 분석은 (1) 시계열 자료의 구조를 파악하고, (2) 분석 대상인 시계열 자료의 구조와 특성을 토대로 미래의 값을 예측하고, (3) 생성된 시스템을 제어하는 데 그 목적이 있다.

시계열 분석의 주요한 개념은 크게 3가지로 구분된다. 첫째, 추세(Trend)로 대부분 시계열 자료는 추세가 없는 독립적인 것으로 가정한다. 시계열 자료가 일정하게 상승, 또는 하강하는 추세를 가지면, 분석하기 전에 이를 제거하도록 한다. 둘째, 연속의존성(Serial dependence)으로 대부분 시계열 자료는 인접한 자료들 사이에 상관성이 없는 것으로 가정한다. 시계열 자료가 인접한 자료들 사이에 상관관계가 있으면, 분석하기 전에 이를 통제한다. 셋째, 정상성(Stationary)으로 일반적으로 시계열은 어느 시점에서나 같은 성질을 가지는 것으로 가정한다.

시계열 자료는 정상성 구분 측면에서 정상시계열과 비정상 시계열로 구분되는데 일반적으로 시계열 자료가 다음의 조건인 식 (1)을 만족하는 경우, 시계열 자료의 정상성이 있는 것으로 판단되며, 이러한 시계열 자료는 정상시계열로 정의된다.

f(yt, yt+1, ⋯ yt+k) = f(yt+m, yt+m+1, ⋯ yt+m+k)

E(yt) = E(yt+m)

Var(yt) = Var(yt+m)       (1)

정상시계열 자료는 Random Process(또는 Stochastic process)를 나타내는 정도를 표현하는 것으로, 시계열 자료가 평균치를 중심으로 평형을 이루고, 일정한 분산을 가지며 공분산은 시계열 자료의 시간차이(Time lag)에만 영향을 받는 시계열 자료로 요약된다. 즉, 평균, 분산, 자기공분산 등이 시간변화에 따라 일정한 경우를 정상, 아닌 경우를 비정상시계열로 분류한다.

예측 등을 수행하기 위해서는 비정상시계열 자료를 정상시계열로 변환해야 하는데 비정상시계열에 대하여 n차 차분(Difference)을 수행하고, 차분을 수행하여도 정상성이 없는 시계열은 log변환, Root변환, Box-Cox변환, power변환 등을 수행한다. 주기성이 존재하는 경우는 분해(Decompose)를 통해 정상성을 확보한다. 지하수관측의 시계열 자료는 비정상 시계열이 대부분으로 정상시계열 변환을 위해 차분을 하거나 분해를 수행하였다.

나. 지하수 변동 예측

비정상시계열을 차분, 분해 등으로 정상시계열로 바꾸고 나면 적합한 예측모델을 확정하고 그 모델로 예측을 수행하게 된다. 예측을 위해서는 먼저 그 시계열에 적합한 모델을 결정해야 한다. 예측을 위한 시계열 분석의 모델(모델)은 정상시계열과 비정상시계열 두가지에 적용하는 모델이 다르다. 정상시계열 모델에는 AR, MA, ARMA 모델이 있다. AR 모델(Autocorrelation Model)은 변수에 대해 이전값이 이후의 값에 영향을 미치는 경우에 적용하는 모델이고, MA 모델(Moving Average Model)은 시간이 지나면서 변수의 평균값이 지속적으로 감소하거나 증가하는 경향이 있는 경우에 적용하는 모델이며, ARMA 모델(Autoregressive Moving Average Model)은 AR과 MA의 복합모델이다. 비정상시계열 모델에는 ARIMA, SARIMA 모델이 있다. 주기성이 있는 비정상시계열의 예측을 위해 ARIMA 모델(Autoregressive Integrated Moving Average Model)을 적용하는데 ARMA 모델이 과거의 데이터를 사용하는 것에 비해 ARIMA 모델은 과거의 데이터가 갖는 추세(Movement)도 반영하여 데이터가 비정상인 경우에도 차분 등의 안정화 과정을 거쳐 적용할 수 있다. 또, 계절성이 존재하는 비정상시계열에는 Seasonal ARIMA(SARIMA) 모델을 적용한다.

각 모델을 표현하는 차수(차수)가 있는데 모델명 뒤 괄호안에 표현하게 되며 정상시계열 모델은 AR(p), MA(q), 비정상시계열은 ARIMA(p,d,q), SARIMA(p,d,q)(P,D,Q)s로 SARIMA 모델의 경우 주기성이 없는 소문자와 주기성이 있는 대문자를 적용한다. p는 AR 모델의 독립변수인 lag을 의미하고, q는 MA 모델의 연속 오차을 의미하고, d는 차분(Difference) 횟수를 의미한다.

본 연구지역의 시계열은 대부분 비정상으로 ARIMA와 SARIMA 모델이 활용되며, 이 모델들은 1970년 Box와 Jenkins에 의하여 기존의 AR 모델과 MA 모델을 하나로 통합한 모델로, 예측과정은 (1) 모델의 식별(Model Identification), (2) 차수의 추정(Parameter Estimation), (3) 모델의 진단(Diagnostic Checking), (4) 최종모델 선택(Optimum Model Selection), (5) 예측(Forecasting)의 5단계로 수행되며, 다음의 Fig. 3은 MYM-002 관측정의 Box-Jenkins의 ARIMA 예측과정을 모식도로 표현한 것이다.

NGHHCI_2023_v65n2_1_f0003.png 이미지

Fig. 3 Flowchart of Box-Jenkins ARIMA procedure (MYM-002)

Ⅲ. 결과 및 고찰

1. 지하수 유형별 시계열 분석

지형별로 선정된 관측정에 대해 시계열 분석으로 시간에 따른 변화를 확인하고 ① 시계열을 시각화, 정상성을 확인하고 ② 적절한 차수와 예측모델을 선택하고 ③ 모델을 검정한 후 ④ 예측을 수행하였다. 이를 위해 지형별로 2개의 대표 관측정을 선정하였다(Table 1).

Table 1 Selected representative wells by cultivation type for time series analysis

NGHHCI_2023_v65n2_1_t0001.png 이미지

가. 시설재배지역

(1) 모델의 선정

시설재배지역의 대표관측정으로 선정된 MYM-002와 MYM-003의 관측수위 시계열 자료를 시각화하였다. MYM-002와 003은 주기성과 계절성이 강하게 나타나는 비정상 시계열로 정상성 검정을 수행한 결과 정상성이 없어 차분이나 분해를 통해 정상성을 확보하였다. 주기성과 계절성 확인을 위해 요소분해를 시행한 결과 관측 원본(Observed), 추세(Trend), 계절성(Seasonal), 우연변동(Random)의 4가지 분해결과를 보여준다(Fig. 4). 추세는 강하지 않으나 계절성은 강하게 나타나는 것을 확인할 수 있으므로 계절성을 제거하면 정상시계열로 변환할 수 있다.

NGHHCI_2023_v65n2_1_f0004.png 이미지

Fig. 4 Result of decomposition of MYM-002

시계열 자료의 계절성을 확인한 후 적정 모델의 차수를 결정한다. ARIMA예측모델의(p,d,q) 차수는 일반적으로 ACF, PACF를 확인하면 알 수 있다. p값은 PACF에서 결정하며, q는 ACF에서 구하게 된다. 이를 통해 선정 가능한 예측모델은 ARIMA(2,1,3)이었으며, 계절성이 있으므로 계절성에 대한 부분인(P,D,Q)도 존재할 것이라는 예상을 해볼 수 있다. 차수와 시계열의 적합 모델을 선정하는 함수인 auto.arima()함수를 이용한 결과 ARIMA(2,1,3)(0,1,0)[365] 모델이 도출되었다.

ARIMA 모델이 적합한지 검정을 위해 R의 checkresiduals()를 활용하여 잔차(residuals)를 분석하였다. 모델이 적합하다면 잔차의 ACF 결과가 95% 신뢰수준에 포함되고 잔차의 분포가 평균이 0인 정규분포를 따라야 하고 잔차는 서로 독립이어야 한다. 계절 ARIMA(2,1,3)(0,1,0)[365] 모델의 잔차 검정결과 잔차의 ACF에서 주기성을 보여주어 95% 신뢰수준에 일부를 제외하고는 대부분 포함되고(Fig. 5), 잔차의 독립성 검정(Box-Ljung test) 결과 검정통계량(𝒙2)이 0.0017이고, P-value가 0.9668로 잔차가 서로 독립이라는 것을 보여준다.

NGHHCI_2023_v65n2_1_f0005.png 이미지

Fig. 5 Residuals check result of ARIMA(2,1,3)(0,1,0)[365] model

예측결과가 유사한 3개의 모델에 대해 ARIMA 예측 과정을 수행하고 잔차를 분석하였다. 선정된 예측모델 중 AIC와 RMSE 비교 결과 가장 낮은 값을 보이고, 잔차의의 독립성 검정을 위한 Box-Ljung test 결과 높은 p-value를 도출한 ARIMA(2,1,3)(0,1,0)[365] 모델이 가장 적합한 것으로 판단되었다(Table 2).

Table 2 Comparison of prediction error accuracy of 4 models for MYM-002

NGHHCI_2023_v65n2_1_t0002.png 이미지

(2) 지하수위 변화 예측

선택된 ARIMA(2,1,3)(0,1,0)[365] 모델로 R 프로그램의 forecast를 이용하여 2019년까지의 관측자료를 기반으로 향후 2년간의 지하수위를 예측하고, 예측결과와 2021년까지의 실제 관측결과를 비교하였다. Fig. 6은 파란선이 예측치이고 음영부분의 짙은 부분이 95% 신뢰구간, 바깥쪽 옅은 음영 부분이 신뢰도 80% 구간을 나타낸다. 예측결과가 95% 신뢰수준 내에 포함되는 것을 볼 수 있어 MYM-002의 예측모델로 ARIMA(2,1,3)(0,1,0)[365] 모델이 적합한 것으로 판단된다.

NGHHCI_2023_v65n2_1_f0006.png 이미지

Fig. 6 Forecast of ARIMA(2,1,3)(0,1,0)[365] model for MYM-002

MYM-003의 예측과정을 수행한 결과 ARIMA(4,0,4)(0,1,0)[365] 모델이 가장 적합한 모델로 선정되었고 2019년까지의 관측자료를 기반으로 향후 2년을 예측하였다. 예측결과 95% 신뢰수준 내에 포함되는 것을 볼 수 있어 MYM-003의 예측모델로 적합한 것으로 판단된다(Fig. 7).

NGHHCI_2023_v65n2_1_f0007.png 이미지

Fig. 7 Forecast of ARIMA(4,0,4)(0,1,0)[365]model for MYM-003

같은 위치에 설치된 충적관측정과 암반관측정은 모두 계절 ARIMA 모델로 도출되었다. 두 모델이 비슷한 예측 패턴을 보이지만 암반관측정이 비 계절 부분(p,d,q)에서 더 큰 차수를 보여준다. 따라서 동일 위치에서는 암반관측정이 자기상관이 크고 주기성이크며 예측결과의 신뢰구간이 더 좁으므로 예측수행 시 더 적합한 모델을 도출해 낼 수 있다.

나. 일반농업지역

(1) 모델의 선정

일반농업지역의 관측정에 대해 평지지역의 MYM-015, MYM-016, 산악지역의 MYM-013, MYM-028에 대해 시설재배지역의 관측정과 같은 순서로 예측과정을 수행하였고 MYM-015의 예측과정 수행결과는 Table 3과 같다.

Table 3 Comparison of prediction error accuracy of 4 models for MYM-015

NGHHCI_2023_v65n2_1_t0003.png 이미지

먼저, 평지지역 MYM-015의 경우 auto.arima()로 선택된 ARIMA(3,1,0) 모델의 예측결과 2021년까지의 관측결과(붉은 점선)를 예측선(파란 실선)과 중첩 시킨 결과 80% 신뢰구간을 벗어나는 예측치도 있었다. 2021년까지의 실제 관측치에서 계절성과 주기성이 관찰되므로 AIC와 RMSE가 ARIMA(3,1,0) 모델 다음 순위로 낮게 도출된 계절성을 가지는 ARIMA (3,1,0)(0,1,0)[365] 모델에 대해서도 예측을 수행하였다. 예측 결과 ARIMA(3,1,0) 모델보다 실제 관측치와 더 잘 맞는 것으로 도출되어 계절성이 있는 관측정은 계절 ARIMA 모델이 더 잘 부합된다는 것을 보여준다(Fig. 8).

NGHHCI_2023_v65n2_1_f0008.png 이미지

Fig. 8 Comparison of the left ARIMA(3,1,0) model and right ARIMA(3,1,0)(0,1,0)[365] model of MYM-015 (red dashed line: observed, blue line: forecast)​​​​​​​

MYM-016의 경우 선택된 ARIMA(5,1,2) 모델로 예측과정 수행 후 실제 관측치를 중첩 시킨 결과 예측 초기 2019년 6월∼7월 관측결과의 일부가 80% 신뢰구간에 포함되지 않았고, 계절성이 추가된 ARIMA(5,1,2)(0,1,0) 모델이 관측치와 더 잘 부합되는 것으로 나타나 더 적합한 모델로 판단된다(Fig. 9).

NGHHCI_2023_v65n2_1_f0009.png 이미지

Fig. 9 Comparison of the left ARIMA(5,1,2) model and right ARIMA(5,1,2)(0,1,0)[365] model of MYM-016 (red line: observed, blue line: forecast)​​​​​​​

두 모델 모두 낮은 AIC와 RMSE값을 보여주지만(Table 4), 계절성이 있는 모델이 더 잘 부합되는 것을 볼 수 있다.

Table 4 Coefficient comparison with ARIMA(5,1,2) and ARIMA(5,1,2)(0,1,0)[365] model​​​​​​​

NGHHCI_2023_v65n2_1_t0004.png 이미지

MYM-016의 경우 2019년까지의 관측자료로 2년 후를 예측한 결과는 ARIMA(5,1,2)(0,1,0)[365] 모델이 적합한 반면 2021년까지의 관측자료로 예측한 결과는 ARIMA(0,1,0) 모델이 적합한 것으로 도출되었다. 2021년까지의 실제 관측자료로 ARIMA(0,1,0)(0,1,0) 모델을 이용해 2023년까지 예측을 수행한 결과, 2019년 까지의 관측자료를 기반으로 한 ARIMA(5,1,2)(0,1,0) 모델과 비슷한 양상을 보이지만 신뢰구간의 세로 폭이 더 넓어져 2021년까지의 관측자료로 2023년까지 예측한 자료보다는 2019년까지의 자료로 2021년까지 예측한 자료가 더 부합되는 것으로 나타났다. 또한, 분해 후 계절성이 확인된 모델의 auto.arima() 수행결과 비계절성 모델이 적합한 것으로 도출되었으나 계절성(P,D,Q)이 있는 모델을 추가로 예측을 수행한 결과 2021년 이후의 시계열 자료는 AIC와 RMSE 및 잔차의 적합성은 다소 낮아 예측 모델에 적합하지 않는 것으로 판단된다.

일반농업지역 중 산악지역의 MYM-013의 예측과정 수행결과 ARIMA(0,1,0) 모델의 예측결과가 Fig. 10의 왼쪽 그림과 같다. 계절성이 있는 ARIMA(0,1,0)(0,1,0) 모델을 추가로 예측을 수행한 결과 신뢰구간이 약 600m∼650m로 ARIMA(0,1,0) 모델의 623m∼627m보다 신뢰구간이 확대되어 신뢰도가 다소 떨어져 계절성을 추가한 모델은 예측모델로 적합하지 않는 것으로 판단된다. ARIMA(0,0,0)(0,1,0) 모델로 예측을 수행한 결과(Fig. 10의 오른쪽 그림) 신뢰구간이 ARIMA(0,1,0) 모델과 차이가 없고, 실제 관측치와 거의 유사하다. AIC, RMSE 값이 유사한 모델 중 가장 크고 잔차의 정상성과 독립성이 낮지만 계절성이 있는 두 모델 중에는 신뢰구간이 좁게 나타나므로 예측모델로 관리할 필요가 있다고 판단된다.

NGHHCI_2023_v65n2_1_f0010.png 이미지

Fig. 10 Comparison of the left ARIMA(0,1,0) model and right ARIMA(0,0,0)(0,1,0) model of MYM-013 (red dashed line: observed, blue line: forecast)​​​​​​​

산악지역의 MYM-028의 예측결과 최종 두 모델을 선정했는데, 그 중 비계절성ARIMA(3,1,1) 모델을 적용하여 예측을 수행한 결과 실제 관측치의 대부분이 80% 신뢰구간에도 포함되지 않아 예측모델로 적합하지 않으나, 계절성이 추가된 ARIMA(3,1,1)(0,1,0)[365] 모델로 예측을 수행한 결과 비계절성 모델보다 더 적합하다는 것을 보여준다(Fig. 11).

NGHHCI_2023_v65n2_1_f0011.png 이미지

Fig. 11 Comparison of the left ARIMA(3,1,1) model and right ARIMA(3,1,1)(0,1,0)[365] model of MYM-028 (red dashed line: observed, blue line: forecast)​​​​​​​

Ⅳ. 요약 및 결론

시설재배지역은 동절기 수막용 지하수 집중이용으로 지하수위 부족문제가 증가하고 있고, 대책을 위한 관측과 연구가 진행되고 있다. 그러나 시설재배지역 내 지하수 관측을 위한 전용 관측정이 부족한 상태였으나, 본 연구지역은 보조지하수관측망이 구축되면서 강변 시설재배지역 내에 충분한 관측정이 설치되어 일반농업지역과 비교하여 시계열분석을 통해 지하수위의 변동특성을 분석하고 미래추세를 예측하여 시설재배지역내 지하수관리에 활용코자하였다.

지하수 관측공의 위치에 따라 지형별로 시설재배지역의 강변, 일반농업지역의 평지, 산악으로 분류하였다. 관측된 지하수 자료를 이용한 시계열 분석을 통해 두 지역을 유형별 지하수 시계열 자료의 구조를 파악하고, 이를 토대로 미래의 값을 예측하였다. 본 연구의 결과를 요약하면 다음과 같다.

본 연구에서는 시계열 분석을 통해 대상지역의 지형별 지하수 시계열 자료의 특성을 파악하고 최적의 모델을 선정하였다. 시계열 분석은 통계프로그램 R을 이용하였으며 절차는 다음과 같다. ① 시계열 자료의 시각화와 KPSS test를 통해 정상성을 확인하고 비정상시계열은 정상시계열로 변환하였다. ② R의 arima 함수를 통해 자동으로 도출된 모델을 토대로 AIC와 RMSE를 이용하여 적절한 차수의 예측모델을 추가로 선정하였다. ③ 선정된 모델은 잔차의 ACF와 정규분포 여부를 통해 정상성을 확인하고, Box-Ljung test를 통해 독립성을 검정한 후 최적 모델을 선정하였다. ④ 선정된 모델을 이용하여 예측을 수행하고 실제 관측치가 예측치의 80%, 95% 신뢰구간 내에 포함되는지 확인하여 예측의 정확도를 분석하였다. 지형별 대표 지하수 관측정을 2개씩 선정하고 2019년 5월까지의 자료를 기반으로 향후 2년간의 시계열 분석을 수행하였다.

시설재배지역의 강변관측정의 지하수위 변화는 계절성과 주기성이 뚜렷하고, 예측결과 AIC와 RMSE가 낮고 p-value가 높다. 비계절 ARIMA 모델보다 계절 ARIMA 모델이 최적 모델로 선정되었고 같은 위치의 충적관측정보다 암반관측정의 비계절 ARIMA 모델의 차수가 증가하는 경향을 보이며, 암반 관측정이 실 관측치와 더 유사한 것으로 나타났다. 시설농업지역은 초기에 충적관정 설치이용 후 지하수 부족 등으로 수량확보를 위해 심도를 더 깊이 설치하는 등 암반관측정이 늘어나는 추세이므로 충적관측정과 암반관측정을 동시에 설치하여 심도별로 관리할 필요가 있다.

일반농업지역 중 평지와 산악관측정은 ARIMA 모델과 Seasonal ARIMA 모델이 최적 모델로 선정되었다. 강변관측정의 경우 실측치가 예측치의 95% 신뢰수준에 모두 포함되었으며, 평지와 산악관측정은 실측치가 예측치의 80% 또는 95% 신뢰수준에 포함되는 등 지점별 편차를 보였고, 일부 신뢰구간을 벗어나는 지점도 있었다. 평지와 산악에 위치한 관측정의 ARIMA 예측모델 중 AIC와 RMSE가 작고 잔차의 정상성과 독립성이 확인된 모델들은 예측결과 신뢰구간 80% 이상에 예측치가 대부분 포함된다. 그러므로 하나의 모델만을 선정하고 관리하기 보다 유사모델들을 함께 예측모델로 선택하여 예측할 필요가 있다. Seasonal ARIMA 모델의 경우 비 계절성차수인 (p,d,q)를 (0,0,0)으로 설정하여 예측을 수행했을 때 신뢰구간 폭이 좁아져 더 신뢰성이 높아지는 것으로 나타났다. 따라서 예측 모델을 한 모델로 한정되는 것이 아니라 시간이 흐름에 따라 예측모델을 수정할 필요가 있다고 판단된다. 따라서, 선정된 하나의 ARIMA 모델을 계속해서 적용하기보다 주기적으로 최적의 모델을 확인하고 수정할 필요가 있는 것으로 판단된다.

시설재배지역은 수막용 지하수를 동절기에 집중사용하여 지하수의 부족현상을 야기하여 일반농업지역과 다른 이용특성을 보이며, 최저기온의 변화에 따라 이용기간, 이용량 등의 변화를 보인다. 따라서 지하수의 적정관리를 위하여 시설재배지역내에 충분한 관측정을 설치하고, 충적과 암반관측정을 구분한 예측관리가 필요하며, 시간에 따라 예측모델을 수정 적용하여 주변상황 변화와 함께 계절적인 요인을 반영할 수 있어야 하며, 계절 ARIMA 모델에 기계학습 등으로 더 적정한 예측 모델을 선정하고 관리할 수 있을 것으로 사료된다.

감사의 글

이 성과는 정부 (과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임 (No. 2020R1F1A1048261).

참고문헌

  1. Adamowski, K., and T. Harmony, 1983. A stochastic systems model of groundwater level fluctuations. Journal of Hydrology 62: 129-141.  https://doi.org/10.1016/0022-1694(83)90099-9
  2. Behzad, M., K. Asghari, and E. A. Coppola Jr., 2010. Comparative study of SVMs and ANNs in aquifer water level prediction. Journal of Computing in Civil Engineering 24(5): 408-413.  https://doi.org/10.1061/(ASCE)CP.1943-5487.0000043
  3. Bierkens, M. F. P., M. Knotters, and F. C. van Geer, 1999. Calibration of transfer function-noise models to sparsely or irregularly observed time series. Water Resources Research 35: 1741-1750.  https://doi.org/10.1029/1999WR900083
  4. Box, G. E. P., and G. M. Jenkins, 1976. Time Series Analysis-Forecasting and Control. Holden-Day, San Francisco, California, USA, 575p. 
  5. Chang, S. W., I. M. Chung, Y. C. Kim, and S. H. Moon, 2016. Long-term groundwater budget analysis based on integrated hydrological model for water curtain cultivation site: Case study of Cheongweon, Korea. Journal of the Geological Society of Korea 52(3): 201-210. (in Korean).  https://doi.org/10.14770/jgsk.2016.52.3.201
  6. Coppola, E., A. J. Rana, M. M. Poulton, F. Szidarovszky, and V. V. Uhl, 2005. A neural network model for predicting aquifer water level elevations. Ground Water 43(2): 231-241.  https://doi.org/10.1111/j.1745-6584.2005.0003.x
  7. Coulibaly, P., F. Anctil, R. Aravena, and B. Bobee, 2001. Artificial neural network modeling of water table depth fluctuations. Water Resources Research 37(4): 885-896.  https://doi.org/10.1029/2000WR900368
  8. Furbish, D. J., 1991. The response of water level in a well to a time series of atmospheric loading under confined conditions. Water Resources Research 27: 557-568.  https://doi.org/10.1029/90WR02775
  9. Gill, M. K., T. Asefa, Y. Kaheil, and M. McKee, 2007. Effect of missing data on performance of learning algorithms for hydrologic predictions: implications to an imputation technique. Water Resources Research 43, W07416. doi:10.1029/2006WR005298. 
  10. Herrera, L. J., H. Pomares, I. Rojas, A. Guillen, A. Prieto, and O. Valenzuela, 2007. Recursive prediction for long term time series forecasting using advanced models. Neurocomputing 70(16-18): 2870-2880.  https://doi.org/10.1016/j.neucom.2006.04.015
  11. Ji, Y., J. Hao, N. Reyhani, and A. Lendasse, 2005. Direct and recursive prediction of time series using mutual information selection. Lecture Notes in Computer Science 3512: 1010-1017. 
  12. KIGAM, 2010. Integrated technologies in securing and applying groundwater resources to cope with earth environmental changes. GP2009-009-01-2010(2): 347p. 
  13. Kim H. J., S. Y. Lee, J. H. Lee, E. Bak, H. Jeon, M. H. Cho, I. H. Yu, H. R. Rhu, K. D. Kim, and J. S. Park, 2007. Technology for vinyl house water curtain cultivation. National Institute of Horticultural & Herbal Science, 88p. (in Korean). 
  14. Knotters, M., and M. F. P. Bierkens, 2000. Physical basis of time series models for water table depths. Water Resources Research 36(1): 181-188.  https://doi.org/10.1029/1999WR900288
  15. Knotters, M., and P. E. V. van Walsum, 1997. Estimating fluctuation quantities from time series of water-table depths using models with a stochastics component. Journal of Hydrology 197: 25-46.  https://doi.org/10.1016/S0022-1694(96)03278-7
  16. Lee, S. I., S. K. Lee, and S. Y. Hamm, 2009. A model for groundwater time-series from the well field of riverbank filtration. Journal of Korea Water Resources Association 42(8): 673-680. (in Korean). doi:10.3741/JKWRA.2009.42.8.673. 
  17. Miryang, 2019. Report on the observation network of supplementary wells. Gyeongnam, Korea. (in Korean). 
  18. Miryang, 2020. Report on the additive installment of monitoring wells and detailed inspection. Gyeongnam, Korea. (in Korean). 
  19. Moon, S. H., K. Ha, Y. Kim, P. Yoon, 2012. Analysis of groundwater use and discharge in water curtain cultivation areas: Case study of the Cheongweon and Chungju areas. The Journal of Engineering Geology 22(4): 387-398. (in Korean).  https://doi.org/10.9720/KSEG.2012.4.387
  20. Rai, S. N., and R. N. Singh, 1995. Two-dimensional modeling of water table fluctuation in response to localized transient recharge. Journal of Hydrology 167: 167-174.  https://doi.org/10.1016/0022-1694(94)02607-D
  21. Tankersley, C. D., W. D. Graham, and K. Hatfield, 1993, Comparison of univariate and transfer function models of groundwater fluctuations. Water Resources Research 29(10): 3517-3533.  https://doi.org/10.1029/93WR01527
  22. Yi, M. J., and K. K. Lee, 2004. Transfer function-noise modelling of irregularly observed groundwater heads using precipitation data. Journal of Hydrology 288(3-4): 272-287.  https://doi.org/10.1016/j.jhydrol.2003.10.020
  23. Yi, M. J., G. B. Kim, Y. C. Sohn, J. Y. Lee, and K. K. Lee, 2004. Time series analysis of groundwater level data obtained from National Groundwater Monitoring Stations. Journal of the Geological Society of Korea 40(3): 305-329. (in Korean). 
  24. Yoon, H., S. C. Jun, Y. Hyun, G. O. Bae, and K. K. Lee, 2011. A comparative study of artificial neural network and support vector machines for predicting groundwater levels in a coastal aquifer. Journal of Hydrology 396: 128-138.  https://doi.org/10.1016/j.jhydrol.2010.11.002
  25. Yoon, H., Y. Kim, K. Ha, and G. B. Kim, 2013. Application of groundwater-level prediction model using data-based learning algorithms to National Groundwater Monitoring Network data. The Journal of Engineering Geology 23(2): 137-147. (in Korean).  https://doi.org/10.9720/kseg.2013.2.137
  26. Yoon, P., H. Yoon, Y. Kim, and G. B. Kim, 2014. A comparative study on forecasting groundwater level fluctuations of National Groundwater Monitoring Networks using TFNM, ANN, and ANFIS. Journal of Soil and Groundwater Environment 19(3): 123-133. (in Korean).  https://doi.org/10.7857/JSGE.2014.19.3.123