DOI QR코드

DOI QR Code

An Algorithm for Improving the Accuracy of Privacy-Preserving Technique Based on Random Substitutions

랜덤대치 기반 프라이버시 보호 기법의 정확성 개선 알고리즘

  • 강주성 (국민대학교 수학과) ;
  • 이창우 (국민대학교 수학과) ;
  • 홍도원 (한국전자통신연구원 지식정보보안연구부)
  • Published : 2009.10.31

Abstract

The merits of random substitutions are various applicability and security guarantee on the view point of privacy breach. However there is no research to improve the accuracy of random substitutions. In this paper we propose an algorithm for improving the accuracy of random substitutions by an advanced theoretical analysis about the standard errors. We examine that random substitutions have an unpractical accuracy level and our improved algorithm meets the theoretical results by some experiments for data sets having uniform and normal distributions. By our proposed algorithm, it is possible to upgrade the accuracy level under the same security level as the original method. The additional cost of computation for our algorithm is still acceptable and practical.

랜덤대치 기법은 실용적인 프라이버시 보호 방법으로 다양한 응용 가능성과 프라이버시 손상 관점의 안전성을 보장할 수 있다는 장점이 있다. 하지만 데이터 유용성을 위한 랜덤대치 기법의 정확성을 향상시키는 방법에 대해서는 그동안 면밀히 연구되지 않았다. 본 논문에서는 랜덤 대치 기법의 표준오차에 대한 보다 진전된 이론적 분석을 실시함으로써 정확성을 개선할 수 있는 알고리즘을 제안한다. 다양한 실험을 통하여 균등분포와 정규분포를 따르는 원본 데이터에 대한 랜덤대치 기법의 적용이 실용적이지 못한 정확성을 나타낸다는 사실과 함께 개선된 알고리즘의 정확성 향상 정도를 확인한다. 우리가 제안하는 알고리즘은 기존의 랜덤대치 기법과 동일한 프라이버시 수준을 유지한 상태에서 정확성을 원하는 수준만큼 높일 수 있는 방법이며, 이를 위해 추가로 소요되는 계산량은 실용적인 면에서 여전히 수용 가능한 것임을 밝힌다.

Keywords

References

  1. R. Agrawal, R. Srikant, “Privacy preserving data mining”, ACM SIGMOD Conference on Management of Data, Dallas, TX, 2000, pp.439-450. https://doi.org/10.1145/335191.335438
  2. Y. Lindell, B. Pinkas, “Privacy preserving data mining”, CRYPTO 2000, pp.36-54.
  3. J. Vaidya, C. Clifton, “Privacy-Preserving Data Mining:Why, How, and When”, IEEE Security & Privacy, 2004, www.computer.org/security/ https://doi.org/10.1109/MSP.2004.108
  4. O. Goldreich, “Secure Multi-Party Computation (Final Draft, Version 1.4)”, http://www.wisdom.weizmann.ac.il /home/oded/public_html/foc.html, 2002.
  5. S. Agrawal and J. Haritsa, “A Framework for High-Accuracy Privacy-Preserving Mining”, Proceedings of the 21st International Conference on Data Engineering (ICDE 2005), IEEE, 2005. https://doi.org/10.1109/ICDE.2005.8
  6. S. Agrawal and J. Haritsa, “A framework for high-accuracy privacy-preserving mining”, Tech- nical Report TR-2004-02, Database Systems Lab, Indian Institute of Science, 2004.
  7. S. Agrawal, J. Haritsa, and B. Prakash, “FRAPP: a framework for high-accuracy privacy- preserving mining”, Data Mining and Knowledge Discovery, Springer, Vol.18, No.1, 2009, pp.101-139. https://doi.org/10.1007/s10618-008-0119-9
  8. A. Evfimievski, J. Gehrke, and R. Srikant, “Limiting Privacy Breaches in Privacy Preserving Data Mining”, Proc. of ACM Symp. on Principles of Database Systems (PODS), 2003. https://doi.org/10.1145/773153.773174
  9. D. Agrawal and C. Agrawal, “On the design and quantification of privacy preserving data mining algorithms”, Proceedings of the 20th Symposium on Principles of Database Systems, May, 2001. https://doi.org/10.1145/375551.375602
  10. J. Dowd, S. Xu, and W. Zhang, “Privacy- Preserving Decision Tree Mining Based on Random Substitutions”, ETRICS2006, LNCS 3995, Springer-Verlag, pp.145-159, 2006. https://doi.org/10.1007/11766155_11
  11. 강주성, 안아론, 홍도원, “행렬기반 랜덤화를 적용한 프라이버시 보호 기술의 안전성 및 정확성 분석”, 한국정보보호학회논문지, 제18권 4호, pp.53-68, 2008.