Privacy Preserving Clustering

프라이버시를 보존하는 군집화

  • Yoo Hyun-Jin (Dept. of Information and Communication, Gwangju Institute of Science and Technology) ;
  • Kim Min-Ho (Dept. of Information and Communication, Gwangju Institute of Science and Technology) ;
  • Ramakrishna R.S. (Dept. of Information and Communication, Gwangju Institute of Science and Technology)
  • 유현진 (광주과학기술원 정보통신공학과) ;
  • 김민호 (광주과학기술원 정보통신공학과) ;
  • 라마크리쉬나 (광주과학기술원 정보통신공학과)
  • Published : 2004.11.01

Abstract

본 논문에서는 프라이버시를 침해 하지 않는 데이터 마이닝에 대해 다룬다. 방대한 데이터에서 유용한 정보를 추출하는 데이터 마이닝분야에서 데이터로부터 프라이버시 보존의 중요성이 부각되고 있다. 그래서 프라이버시의 침해를 막기 위한 방법으로 실제 데이터를 사용하지 않고 잡음이 들어간 데이터를 사용한다. 그리고 프라이버시를 침해하지 않기 위해 잡음이 들어간 데이터로부터 데이터의 확률 밀도 함수(PDF)만을 복원한다. 이렇게 복원된 확률 밀도 함수만을 이용하여 데이터 마이닝기술, 예를 들면 분류화에 곧바로 적용함으로써 프라이버시를 보존하는 것이다. 하지만 분류화에 사용되는 데이터의 1차원적인 확률 밀도 함수만 가지고는 군집화에 사용하기가 부적절하다. 따라서 본 논문에서는 군집화를 하기 위해 잡음이 들어간 데이터로부터 결합 확률 밀도 함수(Joint PDF)를 복원하고, 복원된 결합 확률 밀도 함수만 가지고 군집화를 할 수 있는 방법을 다룬다.

Keywords