An Implementation of Efficient M-tree based Indexing on Flash-Memory Storage System

플래시 메모리 저장장치에서 효율적인 M-트리 기반의 인덱싱 구현

  • Published : 2010.01.15

Abstract

As the storage capacity of the flash memories increased portable devices began to store mass amount of multimedia data on flash memory. Therefore, there has been a need for an effective data management scheme by indexing structure. Among many indexing schemes, M-tree is well known for it's suitability for multimedia data with high dimensional matrix space. Since flash memories have writing operation restriction, there is a performance limitation in indexing scheme with frequent write operation. In this paper, a new node split method with reduced write operation for m-tree indexing scheme in flash memory is proposed. According to experiments the proposed method reduced the write operation to about 7% of the original method. The proposed method will effectively construct an indexing structure for multimedia data in flash memories.

최근 플래시 메모리의 용량이 빠른 속도로 증가하면서 휴대 기기 환경에서 대량의 멀티미디어 데이터를 저장하는 것이 가능하게 되었다. 따라서 플래시 메모리 상에서 인덱스 구조를 통한 데이터 관리 기법이 필요하게 되었다. 여러 인덱싱 방법 중 M-tree는 고차원 거리 공간에 적합하기 때문에 멀티미디어 데이터의 특징 데이터에 대한 인덱싱 방법으로 가장 많이 쓰이고 있다. 그러나 플래시 메모리는 쓰기 연산의 제한을 갖기 때문에, 잦은 쓰기가 발생하는 트리 구조의 인덱싱을 구축 시 심각한 성능 저하가 발생한다. 본 논문에서는 플래시 메모리 상에서 M-tree를 구현함에 있어서 노드 분할 방법을 통하여 쓰기 연산의 횟수를 감소시켜 입출력 성능을 향상시키는 방법을 제안하였다. 실험에 의하면 쓰기 횟수를 약 7%정도로 현저히 감소시킨 것으로 나타났다. 본 논문에서 제안한 방법을 사용하여 플래시 메모리 상에서 대량의 데이터에 대한 인덱싱을 효율적으로 구축할 수 있을 것이다.

Keywords

References

  1. Yianilos, P. N., "Excluded middle vantage point forests for nearest neighbor search," Tech. rep., NEC Research Institute, 1999. Presented at the Sixth DIMACS Implementation Challenge: Near Neighbor Searches workshop, Jan. 1999.
  2. P. N. Yianilos, "Data structures and algorithms for nearest neighbor search in general metric spaces," in Proceedings of Fourth Annu. ACM-SIAM Symp. Discrete Algorithms, pp.311-321, 1993.
  3. T. Bozkaya and Z. M. Ozsoyoglu, "Distance-based indexing for high-dimensional metric spaces," in Proceedings of ACM-SIGMOD international conference on Management of data, pp.357-368, 1997.
  4. P. Ciaccia, M. Patella, F. Rabitti, and P. Zezula, "Indexing metric spaces with M-tree," in Proceedings of the 23rd International Conference on Very Large Data Bases (VLDB 1997), pp. 426-435, 1997.
  5. C. Traina, Jr., A. J. M. Traina, B. Seeger, and C. Faloutsos, "Slim-trees: High performance metric trees minimizing overlap between nodes," in proceedings 7th EDBT 2000, pp.51-65, 2000.
  6. X. Zhou, G. Wang, J.Y. Xu, G. Yu, "M+-tree: A new dynamical multidimensional index for metric spaces," in Proceedings of the 14th Australasian Database Conference (ADC'03), pp.161-168, 2003.
  7. A. B. Bityutskiy. JFFS3 design issues. http://www. linux-mtd.infradead.org.
  8. K. Han-Joon and L. Sang-goo, "A new flash memory management for flash storage system," in Proceedings of the Computer Software and Applications Conference (COMPSAC 1999), pp.284-289, 1999.
  9. Samsung Electronics. Nand flash memory & smartmedia data book, 2004.
  10. Siwoo Byun, "F-Tree:Flash Memory based Indexing Scheme for Portable Information Devices," in Proceedings Journal of Information Technology Applications & Management, vol.13, no.4, pp. 257-271, 2006.
  11. D. Kang, D. Jung, J.-U. Kang, and J.-S. Kim, "${\mu}-tree:$ an ordered index structure for nand flash memory," in Proceedings of the 7th ACM & IEEE international conference on Embedded software (EMSOFT '07), pp.144-153, 2007
  12. Chin-Hsien Wu, Li-Pin Chang, Tei-Wei Kuo, "An efficient r-tree implementation over flash-memory storage systems," in Proceedings of the 11th ACM international symposium on Advances in geographic information systems, pp.17-24, 2003.