Abstract
Collection and storing of multiple time series data in real time requires large memory space. To solve this problem, the usage of varying sample size is proposed in the compression scheme using discrete cosine transform technique. Time series data set has characteristics such that a higher compression ratio can be achieved with smaller amount of value changes and lower frequency of the value changes. The coefficient of variation and the variability of the differences between adjacent data elements (VDAD) are presumed to be very good measures to represent the characteristics of the time series data and used as key parameters to determine the varying sample size. Test results showed that both VDAD-based and the coefficient of variation-based scheme generate excellent compression ratios. However, the former scheme uses much simpler sample size decision mechanism and results in better compression performance than the latter scheme.
실시간으로 여러 시계열 데이터를 수집, 저장하는 데는 많은 저장 공간을 요구하게 된다. 이러한 공간 문제를 해결하는 방안으로, 이산 코사인 변환 압축에서 가변 샘플 크기를 사용하는 방안을 제안하였다. 시계열 데이터 셋은 값의 변화가 작을수록, 그리고 변화의 빈도가 낮을수록 압축률이 높아지는 특성을 가지고 있으며 이러한 특성을 잘 반영할 수 있는 척도로 변동 계수와 인접 요소 간 변동성 계수를 사용하여 가변 샘플 크기를 결정하는 데 사용하였다. 여러 실제 데이터 셋을 대상으로 시험한 결과, 두 방식 모두 양호한 압축률을 보이고 있다. 그러나 인접 요소간 변동성 계수 기반 압축 방식이 변동 계수 기반 방식 보다 샘플 크기 결정 방식이 훨씬 간단할 뿐만 아니라 보다 나은 압축률을 보임을 확인하였다.