DOI QR코드

DOI QR Code

임의 접근을 지원하는 간단한 정수 배열 코드 시스템

A Simple Integer Sequence Code System Supporting Random Access

  • 투고 : 2017.03.07
  • 심사 : 2017.08.13
  • 발행 : 2017.10.15

초록

정수 형태의 배열로 이루어진 데이터가 주식 시장과 같은 원본으로부터 셀 수 없을 정도로 매일 생성되고 있다. 정수 배열을 저장하는 데에 감마 코드, 델타 코드, 피보나치 코드 등을 포함한 범용 코드가 일반적으로 사용된다. 이 배열을 적은 공간을 차지하게 하면서 빠른 시간에 특정 원소에 접근하는 연산을 수행할 수 있게 하려는 시도가 진행되었다. 본 논문에서는 간결한 자료구조의 특성을 활용하여 부호화된 정수 배열에서의 임의 접근을 가능하도록 한 코드 시스템을 제시한다. 이는 코드 시스템에 사용되는 구획 문자 비트열을 압축하면서 질의 수행 시간을 상수 시간에 지원하는 자료구조를 통해 구현되었다. 실험 결과를 통해 범용 코드 시스템보다 더 적은 공간과 시간을 사용해 정수 배열을 표현할 수 있다는 것을 보인다.

Tremendous quantities of numerical data are generated every day from various sources, including the stock market. Universal codes such as Elias gamma coding, Elias delta coding and Fibonacci coding are generally used to store arrays of integers. Studies have been conducted to support fast access to specific elements in an integer array, while occupying less space. We suggest an improved code system that utilizes the concepts of succinct data structures. This system is based on a data structure that allows compressing a delimiter bit array while supporting queries in constant time. The results of an experiment show that the encoded array uses lower space, while not sacrificing time efficiency.

키워드

과제정보

연구 과제 주관 기관 : 서울대학교

참고문헌

  1. G. Jacobson, "Space-efficient Static Trees and Graphs," Proceedings of FCS 1989, pp. 549-554, 1989.
  2. R. Raman, V. Raman, S. R. Satti, "Succinct Indexable Dictionaries with Applications to Encoding k-ary Trees, Prefix Sums and Multisets," ACM Transactions on Algorithms, Vol. 3, No. 4, Nov. 2007.
  3. P. Elias, "Universal Codeword Sets and Representations of the Integers," IEEE Transactions on Information Theory, Vol. 21, No. 2, pp. 194-203, Mar. 1975. https://doi.org/10.1109/TIT.1975.1055349
  4. A. S. Fraenkel and S. T. Klein, “Robust Universal Complete Codes for Transmission and Compression,” Discrete Applied Mathematics, Vol. 64, No. 1, pp. 31-55, Nov. 1996. https://doi.org/10.1016/0166-218X(93)00116-H
  5. S. W. Golomb, “Run-length Encodings,” IEEE Transactions on Information Theory, Vol. 12, No. 3, pp. 399-401, Jul. 1966. https://doi.org/10.1109/TIT.1966.1053907
  6. R. F. Rice and J. R. Plaunt, “Adaptive Variable-Length Coding for Efficient Compression of Spacecraft Television Data,” IEEE Transactions on Communication Theory, Vol. 19, No. 6, pp. 889-897, Dec. 1971. https://doi.org/10.1109/TCOM.1971.1090789
  7. S. Vigna, "Quasi-succinct Indices," Proceedings of WSDM 2013, pp. 83-92, 2013.
  8. J. Seo, M. Han, K. Park, "Efficient Accessing and Searching in a Sequence of Numbers," Proceedings of WAAC 2014, pp. 95-103, 2014.
  9. N. R. Brisaboa, S. Ladra, G. Navarro, "Directly Addressable Variable-Length Codes," Proceedings of SPIRE 2009, pp. 122-130, 2009.
  10. F. Claude and G. Navarro, "Practical Rank/Select Queries over Arbitrary Sequences," Proceedings of SPIRE 2008, pp. 176-187, 2008.
  11. S. Kim, J. Lee, S. R. Satti, B. Moon, "SBH: Super Byte-aligned Hybrid Bitmap Compression," Information Systems, Vol. 62, pp. 155-168, Dec. 2016. https://doi.org/10.1016/j.is.2016.07.004
  12. D. Okanohara and K. Sadakane, "Practical Entropycompressed Rank/select Dictionary," Proceedings of ALENEX 2007, pp. 60-70, 2007.
  13. S. Gog, T. Beller, A. Moffat, M. Petri, "From Theory to Practice: Plug and Play with Succinct Data Structures," Proceedings of SEA 2014, pp. 326-337, 2014.
  14. StockWiz, "Historical Stock Data" [Online], Available: http://pages.swcp.com/stocks (Retrieved 2017.01.23).