Abstract
As the IoT technology is more developed, it is more important for the accuracy of IoT data. Since the IoT data supports a different formats and protocols, it is often happened that the IoT system is failed or the incorrect data is generated with the unreliable IoT devices(sensor, actuator). Because the abnormality of IoT device or the user situation is not detected correctly, this problem makes the user to be unsatisfied with the IoT system. This study proposes the decision methodology of IoT data consistency whether the IoT data is generated in normal range or not by using the mathematical functions('gradient descent function' and 'linear regression function'). It may be concluded that the gradient function method is suitable for the IoT data which the 'increasing velocity' is related with the next generated pattern(eg. sensor devices), the linear regression function method is suitable for the IoT data which the 'the difference from linear regression function' is related with the next generated pattern in case the data has a linear pattern(eg. water meter, electric meter).
사물인터넷의 발달에 따라 IoT 기기에서 처리되는 데이터의 정확성도 중요시되고 있다. 사물인터넷에서 생산되는 데이터는 센서마다 다양한 포맷과 프로토콜을 사용하고 있기에 수집된 센서 데이터에 이상이 발생하면 정규화하고 통합하는 과정에서 데이터 오류로 인해 실패하거나 잘못된 데이터를 구성하게 된다. 사용자의 상황이나 IoT 기기의 이상 증상은 정확하게 판단되지 않기 때문에 사용자 서비스 장애가 발생하거나 실패하는 문제가 발생한다. 본 논문은 IoT 환경에서 발생되는 다양한 형태의 데이터가 IoT 기기의 특성을 반영하여 정상적인 범주 내에서 변화되는지를 수학적 함수로 산출하여 데이터의 정합성을 탐지하는 방법을 제안한다. IoT 데이터의 발생 특성을 파악하기 위해 '기울기 분석'을 활용한 방법과 '선형 회귀 분석'을 활용한 방법을 각각 제시하고 실험하였다. 기울기를 활용하는 방법은 '증가하는 속도'가 다음에 일어나는 현상에 영향을 미치는 IoT 데이터(센서 기기)에 적합하며, 선형 회귀를 활용하는 방법은 선형적으로 데이터가 움직일 때 '선형 회귀 함수로부터의 차이'가 다음에 일어나는 현상에 영향을 미치는 데이터(수도, 전기 계량기)에 적합하였다.