T-Cache: a Fast Cache Manager for Pipeline Time-Series Data

T-Cache: 시계열 배관 데이타를 위한 고성능 캐시 관리자

  • 신제용 (경북대학교 컴퓨터공학과) ;
  • 이진수 (경북대학교 컴퓨터공학과) ;
  • 김원식 (경북대학교 컴퓨터공학과) ;
  • 김선효 (경북대학교 컴퓨터공학과) ;
  • 윤민아 (경북대학교 컴퓨터공학과) ;
  • 한욱신 (경북대학교 컴퓨터공학과) ;
  • 정순기 (경북대학교 컴퓨터공학과) ;
  • 박세영 (경북대학교 컴퓨터공학과)
  • Published : 2007.10.31

Abstract

Intelligent pipeline inspection gauges (PIGs) are inspection vehicles that move along within a (gas or oil) pipeline and acquire signals (also called sensor data) from their surrounding rings of sensors. By analyzing the signals captured in intelligent PIGs, we can detect pipeline defects, such as holes and curvatures and other potential causes of gas explosions. There are two major data access patterns apparent when an analyzer accesses the pipeline signal data. The first is a sequential pattern where an analyst reads the sensor data one time only in a sequential fashion. The second is the repetitive pattern where an analyzer repeatedly reads the signal data within a fixed range; this is the dominant pattern in analyzing the signal data. The existing PIG software reads signal data directly from the server at every user#s request, requiring network transfer and disk access cost. It works well only for the sequential pattern, but not for the more dominant repetitive pattern. This problem becomes very serious in a client/server environment where several analysts analyze the signal data concurrently. To tackle this problem, we devise a fast in-memory cache manager, called T-Cache, by considering pipeline sensor data as multiple time-series data and by efficiently caching the time-series data at T-Cache. To the best of the authors# knowledge, this is the first research on caching pipeline signals on the client-side. We propose a new concept of the signal cache line as a caching unit, which is a set of time-series signal data for a fixed distance. We also provide the various data structures including smart cursors and algorithms used in T-Cache. Experimental results show that T-Cache performs much better for the repetitive pattern in terms of disk I/Os and the elapsed time. Even with the sequential pattern, T-Cache shows almost the same performance as a system that does not use any caching, indicating the caching overhead in T-Cache is negligible.

지능형 배관 검사체(PIG)는 가스나 기름 배관 안을 지나가며 검사체에 장착된 여러 센서로부터 신호(센서 데이타로 불림)들을 취합하는 장치이다. PIG로부터 취합된 센서데이타들을 분석함으로써, 배관의 구멍, 뒤틀림 또는 잠재적으로 가스 폭발의 위험을 가지고 있는 결함들을 발견할 수 있다. 배관의 센서 데이타를 분석가가 분석을 할 때에는 주로 두 가지 분석 패턴을 사용한다. 첫 번째는 센서 데이터를 순차적으로 분석하는 순차적 분석 패턴이고, 두 번째는 특정한 구간을 반복해서 분석하는 반복적 분석 패턴이다. 특히, 센서 데이타를 분석할 때 반복적 분석 패턴이 많이 사용된다. 기존의 PIG 소프트웨어들은 사용자의 요청이 있을 때 마다 서버로부터 센서 데이타들을 오므로, 매 요청마다 네트워크 전송비용과 디스크 액세스 비용이 든다. 이와 같은 방법은 순차적 분석 패턴에는 효율적이지만, 분석 패턴의 대부분을 차지하는 반복적 분석 패턴에는 비효율적이다. 이와 같은 문제는 서버/클라이언트 환경에서 다수의 분석가가 동시에 분석을 할 경우에는 매우 심각해진다. 이러한 문제점을 해결하기 위해 본 논문에서는 배관 센서 데이타들을 여러 개의 시계열 데이타로 생각하고, 효율적으로 시계열 데이타를 캐싱 하는 T-Cache라 부르는 주기억장치 고성능 캐시 관리자를 제안한다. 본 연구는 클라이언트 측에서 시계열 데이타를 캐싱하는 최초의 연구이다. 먼저, 고정된 거리의 시계열 데이타들의 집합을 캐싱 단위로 생각하는 신호 캐시 라인이라는 새로운 개념을 제안하였다. 다음으로, T-Cache에서 사용되는 스마트 커서와 여러 알고리즘을 포함하는 여러 가지 자료구조를 제안한다. 실험 결과, 반복적 분석 패턴의 경우 T-Cache를 사용하는 것이 디스크 I/O측면과 수행 시간 측면에서 월등한 성능 향상을 보였다. 순차적 분석 패턴의 경우에도 T-Cache를 사용하지 않은 경우와 거의 유사한 성능을 보였다. 즉, 캐시를 사용함으로써 발생하는 추가비용은 무시할 수 있음을 보였다.

Keywords

References

  1. SCADA in the Energy Industry -- A Janus View, EnergyPulse, 2004. (also available at http://www.newton-evans.com/news/EnergyPulseArticle.pdf)
  2. http://www.businessweek.com/magazine/content/02\_17/b3780129.htm
  3. R. Agthoven, 'Ultrasonic Inspection of Riser a New and Simple Approach,' European Conference on Non-Destructive Testing (ECNDT), Vol.3, No.11, Nov. 1998
  4. BJ Pipeline Inspection Services, GEODENT/GEODISPLAY Software Manual, 1997
  5. S. Westwood and D. Hektner, Data Integration Ensures Integrity, BJ Services company, Mar. 2003
  6. P. Michailides et al., NPS 8 Geopig: Inertial Measurement and Mechanical Caliper Technology, BJ Services company, June 2002
  7. http://www.tuboscopepipeline.com/Products.htm
  8. D.K. Kim et al., 'Development of the Caliper System for a Geometry PIG Based on Magnetic Field Analysis,' KSME International Journal, Vol.17, No.12, pp. 1835-1843, 2003
  9. http://www.gepower.com/pii
  10. http://www.3p-services.com
  11. W. Han, K. Whang, and Y. Moon, 'A Formal Framework for Prefetching Based on the Type-Level Access Pattern in Object-Relational DBMSs,' IEEE Transactions on Knowledge and Data Engineering, Vol.17, No.10, pp. 1436-1488, Oct. 2005 https://doi.org/10.1109/TKDE.2005.156
  12. A. Kemper and D. Kossman, 'Dual-Buffering Strategies in Object Bases,' In Proc. Int'l Conf. Very Large Data Bases (VLDB), 1994
  13. W. Han and et al., 'A Scalable Pipeline Data Processing Framework Using Database and Visualization Techniques,' In Proc. Int'l Conf. on Intelligent Computing, pp. 334-344, Aug. 2007
  14. T. H. Cormen et al., Introduction to Algorithms, MIT Press and McGraw-Hill, 2001