DOI QR코드

DOI QR Code

Pedestrian GPS Trajectory Prediction Deep Learning Model and Method

  • Yoon, Seung-Won (Dept. of Computer Science, Chung-nam National University) ;
  • Lee, Won-Hee (Dept. of Computer Science, Chung-nam National University) ;
  • Lee, Kyu-Chul (Dept. of Computer Science, Chung-nam National University)
  • Received : 2022.08.01
  • Accepted : 2022.08.21
  • Published : 2022.08.31

Abstract

In this paper, we propose a system to predict the GPS trajectory of a pedestrian based on a deep learning model. Pedestrian trajectory prediction is a study that can prevent pedestrian danger and collision situations through notifications, and has an impact on business such as various marketing. In addition, it can be used not only for pedestrians but also for path prediction of unmanned transportation, which is receiving a lot of spotlight. Among various trajectory prediction methods, this paper is a study of trajectory prediction using GPS data. It is a deep learning model-based study that predicts the next route by learning the GPS trajectory of pedestrians, which is time series data. In this paper, we presented a data set construction method that allows the deep learning model to learn the GPS route of pedestrians, and proposes a trajectory prediction deep learning model that does not have large restrictions on the prediction range. The parameters suitable for the trajectory prediction deep learning model of this study are presented, and the model's test performance are presented.

본 논문에서는 딥러닝 모델 기반 보행자의 GPS 경로를 예측하는 시스템을 제안한다. 보행자 경로 예측은 보행자의 위험 및 충돌 상황들을 알림을 통해 방지할 수 있으며, 다양한 마케팅 등 비즈니스 면에서도 영향을 끼치는 연구이다. 또한 보행자 뿐 아니라 많은 각광을 받고 있는 무인 이동수단의 경로 예측에도 활용될 수 있다. 다양한 경로 예측 방식들 중 본 논문은 GPS 데이터를 활용하여 경로를 예측하는 연구이다. 시계열 데이터인 보행자의 GPS 경로를 학습하여 다음 경로를 예측하도록 하는 딥러닝 모델 기반 연구이다. 본 논문에서는 보행자의 GPS 경로를 딥러닝 모델이 학습할 수 있도록하는 데이터 셋 구성 방식을 제시하였으며, 예측 범위에 큰 제약이 없는 경로 예측 딥러닝 모델을 제안한다. 본 연구의 경로 예측 딥러닝 모델에 적합한 파라메터들을 제시하였으며, 우수한 예측 성능을 보이는 결과를 제시한다.

Keywords

I. Introduction

보행자의 경로는 관측치가 시간적 순서를 가지는 시계열 데이터이다. 시계열 데이터는 이전 데이터가 다음 데이터에 영향을 끼치는 종속적인 관계이다. 이전 경로가 다음경로 위치에 영향을 끼치는 것이다. 즉, 이전 경로의 패턴 등을 파악하고 학습하면 다음 경로 예측이 가능하다는 것이다. 본 연구에서는 이전 경로들을 학습하여 다음 경로 위치를 예측하는 딥러닝 모델을 생성하였다.

보행자의 경로를 예측하는 연구는 보행자들에게 많은 도움을 줄 수 있다. 위험상황, 위험객체 및 인물과의 접촉여부 등을 예측할 수 있어 보행자의 위험 정도를 파악할 수 있으며, 위험정도에 따라 알람 등을 통해 다양한 사건사고 등을 예방할 수 있다. 또한 보행자들의 경로들을 학습 및 예측을 통해 보행자들의 생활 패턴을 파악하여 다양한 마케팅 비즈니스에 접목 할 수 있어, 기업과 보행자들에게 많은 편의들을 제공할 수 있다. 또한 해당 연구 메커니즘을 발전하여 보행자 뿐 아니라 자동차, 무인기 등의 충돌방지 시스템 개발 또한 가능하다.

보행자의 경로를 예측하는 연구는 활용하는 데이터에 따라 영상을 통한 예측과 GPS 데이터를 통한 예측으로 나눌 수 있다. 본 연구팀은 예측 범위에 제한 없이 가장 넓은 범위의 보행자 경로를 예측할 수 있는 GPS 데이터를 통한 보행자 경로 예측 연구를 진행하였다. 본 연구팀은 경로예측을 위하여 다음과 같은 방법을 제시한다. 이전 경로의 범위를 ‘Look_back’ 이라 지정하였고, 해당 Look_back 길이만큼을 딥러닝 모델이 학습하도록 하였다. 학습 이후 경로를 예측하는 위치를 바로 다음 위치가 아닌 ‘Forward_length’ 만큼의 길이를 설정하여 해당 길이 이후를 예측하도록 하였다. 본 연구의 모델은 경로 예측 위치 범위를 늘리는 것이 가능하다.

본 연구팀은 우수한 성능의 보행자 경로 예측 딥러닝 모델을 생성하였다. 또한 딥러닝 모델을 위한 학습 및 테스트 데이터 방법 또한 제시한다. 추가적으로 다양한 실험을 통해 보행자 데이터 최적의 파라메터들을 제시하고, 시계열 데이터 예측에 특화된 딥러닝 모델들과 성능을 비교평가 하였다.

본 논문의 구성은 2장에서는 시계열 예측 및 보행자 경로 예측 관련연구에 대해 제시하고, 3장에서는 데이터 구성 및 딥러닝 모델에 대해 제시하고, 4장에서는 결론 및 향후 연구를 제시한다.

II. Preliminaries

1. Time-series Regression Related Works

GPS 경로 데이터는 시계열 데이터이다. 시계열 데이터는 시간의 경과와 함께 일정한 간격마다 값이 기록되어 있는 데이터를 말한다. 시계열 데이터는 관측치가 시간적 순서를 가지게 된다. 시계열 데이터 분석을 통해서 과거에서의 의존성 패턴을 알아내어, 그 패턴을 이용하여 미래를 예측할 수 있다. 이를 시계열 예측이라고 한다. 시계열 예측은 주어진 시계열을 보고 수학적인 모델을 만들어서 미래에 일어날 것들을 예측하는 것을 뜻한다. 시계열 데이터를 잘 분석한다는 것은, 불규칙성을 가지는 시계열 데이터에 특정한 기법이나 모델을 적용하여 규칙적 패턴을 적용하거나, 혹은 예측할 수 있도록 하는 것을 의미한다. 불규칙성을 띠는 시계열 데이터에 규칙성을 부여하는 방법으로는 ARIMA 모델[1] 등의 분석 방법을 적용하는 것이 기존에 가장 많이 활용되었다.

ARIMA(Autoregressive Integrated Moving Average)모델은 ARMA모델에서 Integrated라는 개념을추가한 모델이다. ARMA모델은 과거의 상태와 오차값을 사용해 현재의 상태를 예측하는 모델이다. 하지만 이 모델역시 불규칙적 시계열 데이터를 제대로 예측하지 못한다는 한계가 있다. 그래서 ARMA[2]에서는 한걸음 더 나아가, 불규칙적 시계열 데이터를 조금 더 잘 분석할 수 있는 방법을 적용한다. ARIMA 모델은 관측치 사이의 차분(Difference)이라는 개념을 통해 불규칙적 시계열 데이터를 규칙적 시계열 데이터로 활용할 수 있도록 하는 과정을 거친다. 현재 상태의 변수에서 바로 전 상태의 변수를 빼주는 것을 차분이라고 한다.

이러한 수학적 모델과 더불어 시계열 데이터 예측에는 은닉 마르코프 모델이 많이 활용되어 왔다. 은닉 마르코프 모델[3](HMM, Hidden Markov Model)은 마르코프 체인 [4](MC, Markov Chain)의 단점을 보완하여 확장한 모델이다. 마르코프 체인은 마르코프 성질을 지닌 이산 확률과정을 의미한다. 마르코프 성질은 현재 상태는 오직 바로 직전의 상태, 혹은 그 이전 일정 기간의 상태에만 영향을받는 것을 의미한다. 이는 가장 먼저 각 상태를 아래[Fig.1]과 같이 정의하게 된다. 상태(state)는 V 로 정의하고, m개의 상태가 존재하게 되는 것이다. 그 다음은 상태전이 확률(State transition Probability)을 정의할 수 있다. 상태 전이 확률이란 각 상태에서 각 상태로 이동할 확률을 말한다. 마르코프 체인의 핵심은 한 상태의 확률은 단지 그 이전 상태에만 의존한다는 것이다. 즉 상태에서 다른 상태로의 전이는 바로 직전 상태에서의 전이로 추정할 수 있다는 것이다.

CPTSCQ_2022_v27n8_61_f0001.png 이미지

Fig. 1. Markov Chain State Transition Probability and State Transition Diagram

CPTSCQ_2022_v27n8_61_f0002.png 이미지

Fig. 2. Support Vector Machine model

CPTSCQ_2022_v27n8_61_f0003.png 이미지

Fig. 3. Example of image-based path prediction research

이러한 마르코프 체인을 전제로한 모델이 시계열 데이터를 다루는데 강점을 지닌 은닉 마르코프 모델(Hidden Markov Model) 이다. 은닉 마르코프 모델은 각 상태들이 마르코프 체인을 따르되 은닉(Hidden)되어 있다고 가정한다. 그러기에 출력치만 관측되고 상태의 흐름은 관측을 못 한다. 따라서 아무리 먼 과거의 예측도 현재에 영향을 미치는 특징을 갖는다. 은닉 마르코프 모델은 주로 음성인 식, 광학문자인식, 자연어처리, 주식예측 등 시계열 데이터 처리에 사용된다[5].

또한 시계열 데이터 예측에는 SVM모델도 사용되었다. SVM은 두 카테고리 중 어느 하나에 속한 데이터의 집합이 주어졌을 때, SVM 알고리즘은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 카테고리에 속할지 판단하는 비확률적 이진 선형 분류 모델을 만든다. 만들어진 분류 모델은 데이터가 사상된 공간에서 경계로 표현되는데 SVM 알고리즘은 그 중 가장 큰 폭을 가진 경계를찾는 알고리즘이다[6].

2. Trajectory Prediction Related Works

1.1 Image-based path prediction deep learning model study

딥러닝 모델을 통하여 보행자의 경로를 예측하는 연구는 어떤 데이터를 활용하느냐에 따라 크게 두가지로 구분된다. 영상을 통한 예측과 GPS를 통한 예측이다. 영상기반 경로 예측 연구는 ETH[7], UCY[8], Stanford Drone Dataset[9], Birds-eye view[10] 오픈데이터 셋 위주로 연구가 이루어진다. 보행자들을 Social pooling layer로 연결하여 다음 경로를 예측하는 Social-LSTM 연구[11], 시공간적 구조를 파악하여 radar도 함께 고려하여 보행자의 경로를 예측하는 연구[12] 등이 있다. 해당 영상기반 연구들은 카메라 프레임 안에서 객체를 인식하여 해당 객체가 다음에 어느 위치로 진행 할 것인지를 예측하는 연구이다. 하지만, 객체의 경로 예측 범위는 카메라를 벗어날 수 없어, 넓은 범위의 객체 경로 예측이 불가능하다는 제약점이 있다.

1.2 GPS-based path prediction deep learning model study

GPS 데이터를 통한 경로 예측 딥러닝 모델 연구는 보행자의 경로 GPS 데이터를 기반으로 다음 보행자의 위치를 GPS 좌표로 예측하는 연구이다. GPS 기반 연구는 GPS 데이터를 어떤 방식으로 모델에 입력하는지에 따라 두 가지로 분류할 수 있다. 먼저, 지도를 그리드(grid)화 하여해당 경로 GPS 값을 그리드화 된 값으로 매칭하여 모델에 입력하는 방식이다[13][14]. 해당 방법 은 복잡한 GPS 값들을 그리드된 지도의 id 값으로 단순하게 처리하여 모델의 학습이 수월하다는 장점이 있으나,보행자가 다니는 지도에 대해 전부 그리드화를 진행해야하는 제약이 존재한다. 대표 연구로는 지도를 [Fig. 4]와 같이 보르누이 다이어그램 방식으로 그리드화 하여 딥러닝 모델에 입력한 연구가 있다.

CPTSCQ_2022_v27n8_61_f0004.png 이미지

Fig. 4. Trajectory prediction research through map grid

이외 다른 GPS 기반 연구는 GPS 데이터 경로 자체를 학습하고 예측하는 연구이다. 해당 연구는 지도 그리드를 통한 연구보다는 딥러닝 입력이 복잡하여 딥러닝 모델 학습에 어려움이 있을 수 있지만, 우수한 컴퓨팅 파워 기반의 딥러닝 모델을 통하여 준수한 예측 성능을 보일 수 있 다. GPS 경로 데이터 자체를 활용하기에 데이터 전처리에 많은 비용이 들지 않으며, 다른 연구방법들과 달리 경로 예측 범위에 제약을 받지 않는다. 본 연구는 제약없는 보행자의 넓은 범위의 경로를 예측하기 위하여 해당 GPS 자체를 학습하는 예측 방식을 적용하여 연구를 진행하였다.

III. The Proposed Scheme

1. Dataset

1.1 Dataset Description

본 연구에서 활용한 데이터 셋은 마이크로소프트 연구소가 수집한 GeoLife(Ver1.3)[15] 오픈 데이터 셋이다. 해당 데이터 셋은 182명의 대상자들의 경로로 이루어져있으며, 5년 동안 수집된 경로 데이터 셋이다. 총 17,621개의경로 데이터 셋으로 이루어져 있다. 본 연구팀은 해당 데이터 셋들 중 보행자의 데이터이며 온전히 경로 데이터 셋이 끊기지 않은 데이터를 선별하여 해당 딥러닝 모델에 학습데이터로 활용하였다. 해당 모델 학습을 위해 선정된 데이터는 2초 단위로 수집된 3,185개의 GPS 좌표(위도,경도)들로 이루어진 경로 데이터 셋이다.

1.2 Data set setup for training and performance measurement

본 연구진은 해당 경로 데이터 학습을 위하여 경로 데이터 셋의 구성을 ‘Look_back’ 과 ‘Forward_length’ 개념을 제시하여 구성하였다. 딥러닝 모델이 일정 단위만큼을 학습하도록 하기 위하여, 일정 단위만큼의 경로 데이터를 학습데이터들로 구성되도록 하였다. 여기서 일정 단위가 Look_back의 개념이다. Look_back 만큼의 경로 데이터가 X데이터가 되는 것이다. 딥러닝 모델이 일정 단위만큼의 X데이터를 학습 후 이후 경로를 예측하도록 해야 하는데, 마지막 X데이터에서부터 Forward_length 이후의 GPS 좌표를 Y데이터로 설정하였다. 이러한 개념으로 [Fig.5]과 같이 딥러닝 모델의 학습데이터 셋을 구성하였다. 딥러닝 모델 학습이 된 이후 성능평가를 위해 테스트 데이터를 생성하였는데, 테스트 데이터 구성 또한 같은 개념으로 생성하였다. 학습데이터의 마지막 경로 이후 데이터들을 테스트 데이터로 구성하였으며, 학습된 모델이 테스트 셋의 X 데이터를 보고 Forward_length 이후의 위치를 예측하도록 하였다. 테스트 데이터는 [Fig.6]와 같이 구 성하였다.

CPTSCQ_2022_v27n8_61_f0005.png 이미지

Fig. 5. Our train data structure

CPTSCQ_2022_v27n8_61_f0006.png 이미지

Fig. 6. Our test data structure

2. Deep Learning Model

2.1 Scaling GPS data sets for model input

위에서 언급한 GPS 좌표를 모델의 입력 데이터로 활용하였다. 원본데이터가 가지고 있는 고유의 특성과 분포를 그대로 딥러닝 모델이 학습하도록 하면 학습이 느리거나 문제가 발생하게 된다. 그리하여 딥러닝 모델에 데이터를 입력하기 전에 스케일링을 통하여 데이터의 오버플로우나 언더플로우를 방지함으로써 최적화과정에서의 안정성 및 수렴 속도를 향상시켜 딥러닝 모델의 학습을 돕는다. 스케일링의 종류에는 크게 4가지가 있다. 평균과 표준편차를 사용하는 StandardScaler, 기본 스케일링과 최대 최소값이 각각 1과 0이 되도록하는 MinMaxScaler[16], 최대 절대값과 0이 각각 1과 0이 되도록하는 MaxAbsScaler, 마지막으로 중앙값(median)과 IQR(Interquartile range)를 사용하여 아웃라이어의 영향을 최소화하는 RobustScaler[17] 가 있다. 본 연구에서는 아웃라이어가 없는 정제된 데이터를 활용하여 모델을 생성하기에 데이터들을 0과 1 사이에 있도록 하는 MinMaxScaler를 활용하여 x,y 좌표를 생성한 모델에 직접 입력하였다. 그리하여 본 연구팀은 복잡한 GPS 데이터 셋을 MinMaxScaler를 적용하여 모델이 경로를 학습하는데 도움이 되도록 하였다.

2.2 Pedestrian Trajectory Prediction Model

경로 데이터와 같은 시계열 데이터 예측은 앞에서 언급 하였듯이, 바로 이전의 데이터를 기반으로 예측하는 Hidden Markov 모델 등과 같은 수학적 확률 예측 모델이 주로 활용되었다. 그러나 이런 수학적 확률 모델은 많은 이전 데이터를 학습 할 수 없는 문제점이 있다. 딥러닝 모델은 확률 모델들 보다 더 많은 이전 데이터들을 학습할 수 있으며, 비선형적 활성함수들을 통해서 기존 해결할 수 없던 문제들을 해결할 수 있도록 한다.

대표적으로 딥러닝 모델 중 시계열 데이터 분석에 특화된 RNN(Recurrent Neural Networks)[18] 모델은 은닉층 또는 출력층에서 입력층으로 정보가 피드백되는 구조를 지니고 있어서 네트워크가 단기 기억능력을 지닐 수 있다. 하지만 이전 데이터와 그 데이터를 사용하는 지점 사이의 거리가 멀 경우 그래디언트가 점차 줄어 학습능력이 크게 저하되는 기울기 소실 문제(Vanishing Gradient)가 발생하는 문제점이 있다.

본 연구팀은 시계열 데이터인 경로 데이터를 예측하기 위해서 LSTM(Long Short Term Model)[19]을 개발하였 다. LSTM [Fig.5] 모델은 시계열 모델에 특화된 RNN(Recurrent-Neural Network)모델의 기울기 소실 문제(vanishing gradient) 문제를 어느 정도 해결한 모델이다. 기울기 소실 문제는 이전 데이터와 그 데이터를 사용하는 지점의 거리가 멀 경우 이전 데이터의 그래디언트가 크게 줄어 학습능력이 크게 줄게 되는 문제이다.

하지만, LSTM 딥러닝 모델은 이러한 기울기 소실 문제를 해결하여 장기 기억능력 또한 제공한다. LSTM 모델도 RNN과 마찬가지로 체인구조를 가지고 있다. 하지만 반복되는 모듈은 다른 구조를 갖고 있다. LSTM은 RNN과 같이 단일 뉴럴네트워크 레이어를 가지는 것 대신에, 4개의 상호작용 가능한 특별한 방식의 구조를 가지고 있다. LSTM의 핵심은 셀 스테이트(cell state)이다. 셀 스테이트는 부수적인 선형 연산들을 거치고 전체 체인을 관통한다. 이러한 구조로 인해 정보는 계속적으로 다음 단계에 전달되게 된다.

LSTM은 핵심이 되는 셀 스테이트를 보호하고 컨트롤하는 과정을 거친다. LSTM의 첫 스텝은 셀 스테이트에서 어떤 정보를 버릴지 선택하는 과정이다. 이는 포겟 게이트에서 시그모이드 레이어로 만들어진다. 또한 어떤 새로운 정보가 셀 스테이트에 저장될 지를 결정한다[Fig.8]. 이후[Fig.9]과 같이 이전의 셀 스테이트(C_t-1)를 새로운 셀 스테이트(C_t)로 업데이트하는 과정을 거쳐 출력값을 결정하는 과정을 거친다.

CPTSCQ_2022_v27n8_61_f0007.png 이미지

Fig. 7. LSTM Deep Learning Model

CPTSCQ_2022_v27n8_61_f0008.png 이미지

Fig. 8. Forget gate of LSTM

CPTSCQ_2022_v27n8_61_f0009.png 이미지

Fig. 9. Cell state of LSTM

본 연구 딥러닝 모델의 최적화 함수는 아담(Adam) 최적화 함수를 활용하였다. 딥러닝에서 최적화 기법은 학습속도를 빠르게 하며 안정적이게 한다. 딥러닝 모델의 학습과 그 결과에 따른 손실함수(loss function)의 값을 최소화하는 방향으로 파라미터의 값을 찾는 것이 최적화의 목표이다. 아담 최적화 함수는 그래디언트가 커져도 스텝사이즈는 어느 정도 정해져있어 어떤 목적함수를 사용한다고 하더라도 안정적인 최적화를 위한 하강이 가능하도록 하기에 대부분의 딥러닝 연구들에서 활용되고 있다.

손실함수는 실제 GPS 좌표와 모델이 예측한 좌표와의 거리를 최소화 하기위해 평균제곱오차(MSE)[20]를 활용하였다[Fig.9]. 딥러닝 모델의 최종적인 목표는 높은 정확도를 끌어내는 파라메터를 찾는 것이다. 딥러닝 모델을 학습하는 것은 최적의 파라메터를 탐색할 때 손실함수의 값을 가능한 작게 하는 매개변수를 찾는 것이다. 이 때, 위에서 언급한 그래디언트를 계산하고 이를 토대로 값을 갱신하는 과정을 반복한다. 손실함수는 파라메터의 변화에 따라 연속적으로 변한다. 손실함수와 달리 정확도는 파라메터 변화에 둔감하고, 변화가 있다고 하더라도 불연속적으로 변화하기에 그래디언트를 구하는 미분을 할 수 없다. 미분이 되지 않으면 최적화를 할 수 없으므로 정확도가 아닌 손실함수를 지표를 삼아 학습을 하는 것이다. 평균제곱오차는 예측모델의 정확성 측정 방법으로 주로 활용된다.

FIg. 10. MSE loss function

2.3 Deep Learning Model Hyperparameter Configuration

본 연구 모델은 수많은 실험들을 거쳐 다음과 같은 최적의 초매개변수를 구성하였다. 딥러닝 모델은 5개의 LSTM 레이어로 구성하였으며, 전체 학습 횟수를 나타내는 에폭(Epoch)은 200, 학습 개수 단위인 배치(Batch)사이즈는 70으로 설정하였다. 총 3,185개의 보행자 경로 데이터들을 8:2 비율로 학습과 테스트 데이터를 구성하였다. 본 연구의 실험은 IIntel(R) Core(TM) i7-7700 CPU @ 3.60GHz, 32GB RAM, GeForce GTX 1080 Ti GPU 환경에서 진행하였다.

3. Model Evaluation

3.1 Performance of Our Trajectory prediction model

본 연구진은 최적의 Look_back 길이를 찾기 위해 먼저Forward_length를 0으로 고정시키고, 다양한 실험을 통해서 해당 경로 예측 딥러닝 모델에 적합한 look_back 길이는 30 임을 확인하였다. look_back 길이가 30일 때 테스트 데이터를 예측한 정확도는 98.67이며, 평균제곱오차(MSE)는 0.01032의 우수한 예측 성능을 보임을 확인하였다. Look_back 길이를 계속해서 늘려가며 성능을 측정하였지만, 정확도는 [Table 1]과 같이 97 이상이 나오는 우수한 경로 예측 딥러닝 모델임을 알 수 있다.

Table 1. Deep learning model performance table according to look_back length

CPTSCQ_2022_v27n8_61_t0001.png 이미지

이후 [Table 2]에서는 Forward_length 증가에 따른 성능 또한 평가하였다. Forward_length는 앞서 설명하였듯, 최종 학습 지점으로부터 해당 길이 이후의 위치를 예측하는 것이다. 가장 좋은 성능을 보이는 look_back 길이를 30으로 고정하고 실험을 진행하였다. Forward_length 가 길어지면 예측할 위치가 최종 학습데이터로부터 멀어지는 것이기에 성능치는 감소할 수 밖에 없을 것이다. 본 연구의 모델은 해당 실험에 대해 [Table 2]와 같은 성능을 보였으며, 예상과 같이 Forward_length가 길어질수록 예측 성능은 감소하였으나, 97, 96이상의 정확도를 보이며 우수한 예측성능을 보이는 모델임을 증명하였다. 즉, 본 모델은 보행자의 현재까지 위치를 기반으로 바로 다음 위치가 아닌 일정 시간 이후의 위치 또한 우수한 성능으로 예측함을 알 수 있다.

Table 2. Deep Learning Model Performance Table by Forward_length

CPTSCQ_2022_v27n8_61_t0002.png 이미지

3.2 Presenting the performance of this path prediction model

본 연구진은 추가적으로 실제적으로 시계열 데이터에 특화된 딥러닝 모델인 RNN, GRU, LSTM 모델을 예측모델로 하여 실험을 진행하였다. 두 모델은 앞서 설명하였고, GRU 모델은 LSTM 모델의 구조를 조금 더 간단하게 개선한 모델로써, 3개의 게이트(Forget, Input, Output)를 활용하는 LSTM과 달리 2개의 게이트(Reset, Update) 만을 사용한다는 특징을 갖는다.

실험은 모델들의 성능 비교이기에, Forward_length는0으로 지정하였으며, look_back은 10[Table 3]과 30[Table 4]으로 지정하여 성능 비교 실험을 진행하였다. 두 실험 모두 본 연구의 모델이 가장 성능이 우수했으며, look_back이 10일때는 GRU, 30일때는 RNN이 그 다음으로 우수한 성능을 보였다. 그리하여 다른 시계열 예측에 특화된 딥러닝 모델들 중 본 연구에서 활용한 본 연구의 모델이 보행자 경로 예측연구에 적합함을 확인 할 수 있었다.

Table 3. Time Series Prediction Deep Learning Model Performance Comparison Table (look_back=10)

CPTSCQ_2022_v27n8_61_t0003.png 이미지

Table 4. Time Series Prediction Deep Learning Model Performance Comparison Table (look_back=30)

CPTSCQ_2022_v27n8_61_t0003.png 이미지

IV. Conclusions

본 연구는 딥러닝 모델 기반 보행자의 GPS 경로를 예측하는 연구이다. 본 논문은 시계열 예측 관련연구들과 경로 예측 관련연구들을 제시하였으며, 딥러닝 모델 생성을 위해 경로 데이터를 Look_back과 Forward_length 개념을 생성하여 학습, 테스트 데이터를 구성하였다. 우수한 예측 성능을 보이는 딥러닝 모델을 다양한 실험을 통하여 제시하였다. 해당 보행자의 최적의 Look_back 길이를 제시하였으며, 본 연구의 모델이 다른 시계열 예측 딥러닝 모델보다 우수한 성능을 보임을 제시하였다. 본 연구의 보행자경로 예측 모델은 현재 시점까지의 학습된 경로를 기반으로 바로 다음 위치 뿐아니라 일정 시간 이후에 있을 위치까지도 예측할 수 있는 우수한 경로예측 모델이다.

본 연구를 통하여 보행자의 위험상황, 충돌 상황 등을 미리 예측하여 예방할 수 있다. 또한 보행자 뿐 아니라 다양한 무인 이동체의 경로예측 딥러닝 모델연구에도 많은 기여를 할 수 있는 연구이다. 본 연구진은 해당 연구를 더욱 발전하여 다양한 이동수단의 경로예측 딥러닝 연구를 진행할 것이며, 그에 적합한 Look_back, Forward_length를 찾는 실험을 진행할 것이다. 또한 단순한 거리 기반 손실함수가 아닌, 전체적인 흐름 등을 고려하는 경로 예측에 더욱 적합한 손실함수에 관한 연구를 심화하여 진행할 예정이다.

References

  1. Piccolo, Domenico. "A distance measure for classifying ARIMA models." Journal of time series analysis 11.2: 153-164, March 1990. DOI: 10.1111/j.1467-9892.1990.tb00048.x
  2. McLeod, Allan I., and William K. Li. "Diagnostic checking ARMA time series models using squared-residual autocorrelations." Journal of time series analysis 4.4: 269-273, July 1983. DOI:10.1111/j.1467-9892.1983.tb00373.x
  3. Eddy, Sean R. "Accelerated profile HMM searches." PLoS computational biology 7.10: e1002195, October 2011. DOI: 10.1371/journal.pcbi.1002195
  4. Geyer, Charles J. "Practical markov chain monte carlo." Statistical science: 473-483, November 1992. DOI: 10.1214/ss/1177011137
  5. Gun-Tae Son, Jeong-Hwa Jeong, and Min-Wook Park. "Study of Hidden Markov Model for Speech Recognition1." CSAM (Communications for Statistical Applications and Methods) 5.1 (1998): 155-165.
  6. Cherkassky, Vladimir, and Yunqian Ma. "Practical selection of SVM parameters and noise estimation for SVM regression." Neural networks 17.1: 113-126, January 2004. DOI: 10.1016/S0893-6080(03)00169-2
  7. Ouyang, Wanli, and Xiaogang Wang. "Single-pedestrian detection aided by multi-pedestrian detection." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, June 2013. DOI: 10.1109/cvpr.2013.411
  8. Giuliari, Francesco, et al. "Transformer networks for trajectory forecasting." 2020 25th international conference on pattern recognition (ICPR). IEEE, January 2021. DOI: 10.1109/ICPR48806.2021.9412190
  9. ANDLE, Joshua J., et al. The Stanford Drone Dataset is More Complex than We Think: An Analysis of Key Characteristics. IEEE Transactions on Intelligent Vehicles, April 2022. DOI: 10.1109/TIV.2022.3166642
  10. Z. Yang, M. Sun, H. Ye, Z. Xiong, G. Zussman and Z. Kostic, "Bird's-eye View Social Distancing Analysis System," 2022 IEEE International Conference on Communications Workshops (ICC Workshops), May 2022, pp. 427-432, doi: 10.1109/ICCWorkshops53468.2022.9814627.
  11. Varshneya, Daksh, and G. Srinivasaraghavan. "Human trajectory prediction using spatially aware deep attention models." arXiv preprint arXiv:1705.09436, May 2017. DOI: 10.48550/arXiv.1705.09436
  12. Endo, Yuki, et al. "Predicting destinations from partial trajectories using recurrent neural network." Pacific-Asia Conference on Knowledge Discovery and Data Mining. Springer, Cham, April 2017. DOI: 10.1007/978-3-319-57454-7_13
  13. Duives, Dorine C., Guangxing Wang, and Jiwon Kim. "Forecasting pedestrian movements using recurrent neural networks: An application of crowd monitoring data." Sensors19.2 : 382, January 2019. DOI: 10.3390/s19020382
  14. LI, Zhe, et al. Grid map construction and terrain prediction for quadruped robot based on c-terrain path. IEEE Access, March 2020. DOI: 10.1109/ACCESS.2020.2977396
  15. Hassan, Md Rafiul, and Baikunth Nath. "Stock market forecasting using hidden Markov model: a new approach." 5th International Conference on Intelligent Systems Design and Applications (ISDA'05). IEEE, September 2005. DOI: 10.1109/isda.2005.85
  16. Shaheen, Hera, Shikha Agarwal, and Prabhat Ranjan. "MinMaxScaler binary PSO for feature selection." First international conference on sustainable technologies for computational intelligence. Springer, Singapore, November 2020. DOI: 10.1007/978-981-15-0029-9_55
  17. Qian, Huajie, et al. "RobustScaler: QoS-Aware Autoscaling for Complex Workloads." arXiv preprint arXiv:2204.07197, April 2022. DOI: 10.48550/arXiv.2204.07197
  18. Cho, Kyunghyun, et al. "Learning phrase representations using RNN encoder-decoder for statistical machine translation." arXiv preprint arXiv:1406.1078, September 2014. DOI: 10.48550/arXiv.1406.1078
  19. Yu, Yong, et al. "A review of recurrent neural networks: LSTM cells and network architectures." Neural computation 31.7: 1235-1270, July 2019. DOI: 10.1162/neco_a_01199
  20. Hodson, Timothy O. "Root-mean-square error (RMSE) or mean absolute error (MAE): when to use them or not." Geoscientific Model Development 15.14, July 2022. DOI: 10.5194/gmd-15-5481-2022