In-network Aggregation Query Processing using the Data-Loss Correction Method in Data-Centric Storage Scheme

데이터 중심 저장 환경에서 소설 데이터 보정 기법을 이용한 인-네트워크 병합 질의 처리

  • 박준호 (충북대학교 정보통신공학과) ;
  • 이효준 (충북대학교 정보통신공학과) ;
  • 성동욱 (충북대학교 정보통신공학과) ;
  • 유재수 (충북대학교 정보통신공학과)
  • Received : 2010.08.23
  • Accepted : 2010.09.27
  • Published : 2010.12.15

Abstract

In Wireless Sensor Networks (WSNs), various Data-Centric Storages (DCS) schemes have been proposed to store the collected data and to efficiently process a query. A DCS scheme assigns distributed data regions to sensor nodes and stores the collected data to the sensor which is responsible for the data region to process the query efficiently. However, since the whole data stored in a node will be lost when a fault of the node occurs, the accuracy of the query processing becomes low, In this paper, we propose an in-network aggregation query processing method that assures the high accuracy of query result in the case of data loss due to the faults of the nodes in the DCS scheme. When a data loss occurs, the proposed method creates a compensation model for an area of data loss using the linear regression technique and returns the result of the query including the virtual data. It guarantees the query result with high accuracy in spite of the faults of the nodes, To show the superiority of our proposed method, we compare E-KDDCS (KDDCS with the proposed method) with existing DCS schemes without the data-loss correction method. In the result, our proposed method increases accuracy and reduces query processing costs over the existing schemes.

센서 네트워크에서 발생하는 데이터를 저장하고, 효율적으로 질의를 처리하는 기법에 대한 많은 연구가 이루어지고 있다. 대표적인 연구로 데이터 중심 저장 기법이 있다, 데이터 중심 저장 기법의 경우 질의를 효과적으로 처리하기 위해 수집한 데이터 값에 따라 저장 될 센서 노드를 지정하고, 질의 처리를 위해 질의에 해당하는 데이터를 저장하는 노드에서만 데이터를 수집한다. 하지만 노드의 결함이 발생하면 결함 노드에 저장되어 있는 전체 데이터가 소설 됨에 따라 질의 결과 정확도가 저하 되는 문제점이 발생한다. 이러한 문제를 해결하기 위해, 본 논문에서는 데이터 중심 저장 기법에서 노드 결함에 따른 데이터 소실이 발생하여도 높은 정확도를 보이는 인 네트워크 병합 질의 처리 기법을 제안한다. 데이터 소실이 발생 하였을 경우 선형 회귀 분석 기법을 이용하여 소설 된 영역에 해당하는 보정 모델을 생성하고, 이를 통해 가상의 데이터를 포함한 질의 결과를 반환한다. 제안하는 기법의 우수성을 보이기 위해 시뮬레이션을 통해 소설 데이터 보정 기법을 적용한 KDDCS(E-KDDCS) 기법과 기존의 데이터 중심 저장 기법과 성능을 비교하였다. 그 결과 기존 기법에 비해 질의 결과 정확도가 향상되었고, 질의 처리 시 에너지 소모를 감소시켰다.

Keywords

References

  1. Cerpa, A., Elson, J. Estrin, D., Girod, L., Hamilton, M. and Zhao, J. "Habitat Monitoring: Application Driver for Wireless Communications Technology," Proc. of ACM Workshop on Data Communications in Latin America and the Caribbean, pp.20-41, 2001.
  2. Culler, D., Estrin, D., and Srivastava, M., "Guest Editors' Introduction: Overview of Sensor Networks," IEEE Computer, vol.37, issue 8, pp.41-49, 2004.
  3. Madden, S., Franklin, M. J. Hellerstein, J, M., and Hong, W., "TAG: a Tiny AGgregation service for ad-hoc sensor networks," Proc. of the 5th Symposium on Operating Systems Design and Implementation, pp.131 -146, 2002.
  4. Ratnasamy, S., Karp, B., Shenker, S., Estrin, D., Govindan, R, Yin, L., Yu, F., "Data-Centric Stroage in Sensormets with GHT, a geographic hash table," Mobile Networks and Applications, vol.8, issue 4, pp.427-442, 2003. https://doi.org/10.1023/A:1024591915518
  5. Ratnasamy, S., Karp, Yin, L., Yu, F., Estrin, D., Govindan, R, Shenker, S., "GHT: A Geographic Hash Table for Data-Centric Storage," Proc. of the 1st ACM international workshop on Wireless sensor networks and applications, pp.78-87, 2002.
  6. Li, X., Kim, Y. J., Govindan, R, Hong, W., "Multi-Dimensional Range Queries in Sensor Networks," Proc. of the 1st international conference on Embedded networked sensor systems, pp.63-75, 2003.
  7. Aly, M., Pruhs, K., Chrysanthis, P.K., "KDDCS: A Load-Balanced In-Network Data-Centric Storage Scheme for Sensor Networks," Proc. of the 15th ACM international conference on Information and knowledge management, pp.317-326, 2006.
  8. Aly, M., Morsillo, N., Chrysanthis, P.K., Pruhs, K., "Zone Sharing: A Hot-Spots Decomposition Scheme for Data Centric Storage in Sensor Networks," Proc. of the 2nd international workshop on Data management for sensor networks, pp.21-26, 2005 .
  9. Lai, Y., Chen, H., Wang, Y., "Dynamic Balanced Storage in Wireless Sensor Networks," Proc. of the 4th workshop on Data management for sensor networks: in conjunction with 33rd International Conference on Very Large Data Bases, pp.7-12, 2007.
  10. Cheng, M.-Y., Peng, L., "Simple and Efficient Improvements of Multivariate Local Linear Regression," Journal of Multivariate Analysis, vol.97, issue.7, pp.1501-1524, 2006. https://doi.org/10.1016/j.jmva.2005.05.006
  11. Live from Earth and Mars (LEM) Project, http://www-k12.atmos.washington.edu/k12/grayskies