• 제목/요약/키워드: 재식별화

검색결과 96건 처리시간 0.034초

빅데이터 환경에서 개인정보 비식별화에 대한 위험성 제기 및 대응 방안 제시 (Raising Risk and Suggesting Solution about Personal Information De-identification in Big-Data Environment)

  • 이수림;장웅태;배재영;신찬호;현범수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.297-300
    • /
    • 2016
  • 최근 빅데이터 산업이 발전하고 있는 상황에서 빅데이터 산업에 활용되는 개인정보의 보호에 관한 문제가 대두하고 있다. 빅데이터 산업에서 개인정보를 활용하기 위해서는 비식별화 조치를 해야 한다. 하지만 비식별화는 비식별화 평가 모델 자체의 취약성과 더불어 비식별화된 개인정보를 재식별화 하는 위험성도 존재한다. 본 논문은 적정성 평가 모델, 비식별화 조치 기술, 재식별에 관한 위험성을 연구하고 각 위험성에 대한 대응 방안을 통해 재식별화의 문제를 해결하여 빅데이터 산업에서 비식별화된 개인정보가 안전히 쓰일 수 있도록 해야 한다.

빅데이타 비식별화 기술과 이슈 (De-identification Techniques for Big Data and Issues)

  • 우성희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.750-753
    • /
    • 2017
  • 최근 스마트폰, SNS, 사물인터넷이 확산되면서 생겨나는 빅데이타의 처리와 활용이 ICT 분야의 새로운 성장 동력으로 부상하고 있다. 하지만 이러한 빅데이터의 활용을 위해서는 개인정보 비식별화가 이루어져야한다. 비식별화는 개인의 데이터가 특정인과 연결되지 않도록 데이터 셋으로부터 식별정보를 제거하는 것으로 정보를 수집, 처리, 보관 혹은 배포하는데 있어 발생할 수 있는 개인정보노출의 위험을 줄이며 그 정보를 활용하고 공유하는데 그 목적을 두고 있다. 비식별화된 정보는 또한 재식별화되어 개인정보보호의 논란이 되고 있지만 빅데이터등의 개인정보가 비식별 처리되어 활용되는 사례는 점차 증가하고 있다. 또한 많은 비식별화 가이드라인의 등장과 함께 개인정보 비식별화 방법이 제시되고 있다. 따라서 본 연구에서는 빅데이타 비식별화 과정과 사후관리를 서술, 비식별화 방법을 비교분석하고 비식별화와 개인정보보호 관련 이슈와 해결과제를 제시한다.

  • PDF

비식별화 정책 비교 및 빅데이터 산업 활성화 방안 (De-identification Policy Comparison and Activation Plan for Big Data Industry)

  • 이소진;진채은;전민지;이조은;김수정;이상현
    • 문화기술의 융합
    • /
    • 제2권4호
    • /
    • pp.71-76
    • /
    • 2016
  • 본 논문에서는 미국, 영국, 일본, 중국, 한국의 비식별화 정책비교를 통하여 향후 비식별화 규제의 방향과 빅데이터 산업 활성화 방안을 제시한다. 비식별화 기술과 적정성 평가기준을 효율적으로 활용할 경우, 개인의 사생활을 침해하지 않고 개인정보보호법 제약을 피하면서 개인정보를 산업적으로 활용하여 서비스와 기술을 발전시킬 수 있다. 역작용으로는 비식별화 된 데이터들의 집합체로서 개인을 재식별 할 수 있는 재식별화 문제가 발생할 수 있다. 비즈니스 관점에서는 빅데이터 산업이 활성화되기 위해서 규제의 해소와 빅데이터 활용 등을 위한 제도완화가 필요하며 정보보호 측면에서의 보안강화 조치와 제도정비도 필요하다.

정적/동적 분석 기반의 재사용 메트릭과 가시화 구축 (Constructing A Visualization & Reusable Metrics based on Static/Dynamic Analysis)

  • 변은영;손현승;문소영;장우성;박보경;김영철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.621-624
    • /
    • 2017
  • 소프트웨어의 적용 분야가 다양화되면서 시장 환경의 변화와 사용자 요구사항의 다양화가 급속도로 진행되고 있다. 하지만 부족한 시간, 예산, 인력 문제로 고품질의 소프트웨어 개발은 더 어려워졌다. 이런 문제의 해결을 위해 레거시 시스템의 모듈을 재사용하여 고품질화하고자 한다. 기존에는 정적 분석 기반의 재사용 모듈/덩어리 식별만 이루어졌지만, 실제 실행 환경에서 적용되는 동적 분석 기반의 재사용 식별이 더욱 중요하다. 이를 위해, 재사용 메트릭을 정의하고 재사용 모듈/덩어리 자동식별 및 가시화를 제안한다. 이는 새로운 프로젝트 개발의 재사용성을 높여, 신뢰성과 생산성 향상시키고 품질 개선에 기여한다.

통계모형의 정확도에 기반한 비식별화 데이터의 품질 측정 (Data Quality Measurement on a De-identified Data Set Based on Statistical Modeling)

  • 전희주;이현지;연규필;김동례
    • 한국콘텐츠학회논문지
    • /
    • 제19권5호
    • /
    • pp.553-561
    • /
    • 2019
  • 본 연구에서는 개인정보 비식별화 데이터의 통계적 유용성에 대한 품질 측정 방안에 대하여 통계 모형화에 따른 예측 정확도 측면에서 고찰하였다. 4차 산업혁명 시대에서 정보통신기술을 통한 혁신에는 반드시 빅데이터의 효과적인 활용이 필수적이지만, 개인정보 이슈는 적극적인 빅데이터 활용에 제약이 되고 있다. 이를 해결하기 위해 비식별화 가이드라인이 제정되었으며 다양한 개인정보 비식별화 방법이 활용되면서 개인정보의 실질적인 재식별 가능성은 매우 낮아졌다. 반면에 강력한 비식별화는 데이터의 유용성을 떨어뜨리는 부작용이 나타날 수 있다. 그 동안은 재식별 불가능한 비식별화 방법이 연구의 주를 이루어 왔다면 본 연구에서는 대표적인 비식별 방법인 KLT 모형에 의한 비식별화 데이터에 대한 통계적 유용성 측면의 품질 측정에 대하여 연구하였다. 비식별화 데이터에 대한 통계적 예측모형의 정확도에 기반하여 비식별화 된 데이터의 통계적 유용성이 어느 정도 훼손되는지에 대하여 사례분석을 수행하였다. 또한, 비식별 자료에 어느 정도의 비식별화 되지 않은 자료가 추가되어야 예측모형의 정확도를 회복하는 지를 살펴봄으로써 비식별화된 자료의 데이터 유용성 정도에 대한 새로운 측정지표를 제안하였다.

객체 지향 패러다임에서의 코드 재사용을 위한 응집도 레벨 식별 모범 사례 (Best Practice on identifying the level of cohesion for reusing source code in object-oriented paradigm)

  • 변은영;박보경;장우성;김영철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.455-458
    • /
    • 2016
  • 소프트웨어의 재사용은 소프트웨어 개발의 품질과 생산성을 높이고 개발 비용을 절감할 수 있다. 소프트웨어 재사용을 위해서 가장 중요한 것은 소스 코드에서 재사용성이 높은 모듈을 추출하기 위해 모듈화에 적합한 소스 코드를 식별해야 한다. 이를 위해서 우리는 코드 가시화를 적용한다. 정량적 지표인 응집도 지표와 추출하여 코드의 복잡도와 재사용성을 판단한다. 본 논문에서는 객체 지향 패러다임에서 응집도를 재정의 하여 제안하고 모듈 단위를 메소드로 정의하여 모듈의 응집도를 추출한다. 이를 통해 모듈화가 가능한 코드의 재사용과 복잡한 코드의 리팩토링이 가능하도록 한다.

국내외 비식별화 기술에 관한 검토 분석에 따른 개인건강의료정보 보호를 위한 국내 특화 비식별화 기술 제안에 관한 연구 (Research of Specific Domestic De-identification Technique for Protection of Personal Health Medical Information in Review & Analysis of Overseas and Domestic De-Identification Technique)

  • 이필우;인한진;김철중;여광수;송경택;유기근;백종일;김순석
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제6권7호
    • /
    • pp.9-16
    • /
    • 2016
  • 국내외적으로 급변하는 인터넷 시대에 생활함에 따라 의료, 금융, 서비스 분야 등에서 대용량 정보가 이용된다. 이에 따라 병원, 기관 등 의료 기관에서의 시스템에서도 개인 정보의 유출 및 외부 침입으로 개인 정보 침해가 발생된다. 의료 기관의 개인건강의료정보의 정보보호 및 개인 프라이버시 보호를 위해 국내외 의료 기관에서는 국가별로 제시한 정책, 법령 기준에 따라 비식별화 처리 기술을 이용하고 있다. 기존 국내외 프라이버시 제도, 법령 등을 비교하여 국내에서 미흡했던 익명화와 가명화 기술 및 대상 데이터 항목에 대해 보다 발전되고 우수한 기술 및 대상을 도출하기 위해 비교 분석한다. 의료 개인정보에 대한 비식별화 처리 기술은 국외 기관인 미국 NIST 및 영국 ICO에서 제시한 국가정보보호를 위한 비식별화 기술에 비해 국내에서는 산학연의 각 기관 및 업체 등에서 자율적으로 비식별화 기술을 채용하고 있는 제약적인 상황이며 국내의 기술은 익명화 기술인 데이터 마스킹이나 삭제 기술의 수준이 되고 있는 실정이다. 국내 개인건강정보의 이용을 활성화하기 위해 재식별화 위험도를 줄인 비식별화 기술인 암호화와 확장성 퍼징 기술을 새롭게 제안하고자 한다.

재식별 시간에 기반한 k-익명성 프라이버시 모델에서의 k값에 대한 연구 (Analysis of k Value from k-anonymity Model Based on Re-identification Time)

  • 김채운;오준형;이경호
    • 한국빅데이터학회지
    • /
    • 제5권2호
    • /
    • pp.43-52
    • /
    • 2020
  • 빅데이터 활용 기술의 발전으로 데이터의 저장 및 공유가 늘어나면서 그에 따른 프라이버시 침해가 일어나게 되었다. 이 문제를 해결하기 위해 비식별 기술이 도입되었지만 비식별된 데이터에 대해서도 재식별이 가능하다는 것이 여러 차례 증명되었다. 재식별 가능성이 존재하기 때문에 완전히 안전할 수 없지만 그럼에도 불구하고 충분한 비식별처리가 이루어져야 하는데, 현재 법령이나 규제는 어느 정도로 비식별 처리를 해야 하는지 정량적으로 규정하고 있지 않다. 본 논문에서는 재식별 작업을 할 때 소요되는 시간을 고려하여 적절한 비식별 기준을 제시하려고 한다. 다양한 비식별 평가 모델 중에서 k-익명성 모델에 대해 집중적으로 연구하였으며 어느 정도의 k값이 적절한 지 판단하였다. 본 연구의 결과를 일반화시킬 수 있다면 각종 법률 및 규제에서 적절한 비식별 강도를 규정하는 데 사용할 수 있을 것이다.

빅데이터 환경에서 개인정보보호를 위한 익명화된 데이터의 비익명화를 통한 데이터 안전성 테스트 방법론에 관한 연구 (A Study on Data Safety Test Methodology through De-Anonymization of Anonymized data for Privacy in BigData Environment)

  • 이재식;오용석;김호성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.684-687
    • /
    • 2013
  • 빅데이터 환경은 수많은 데이터의 조합으로 가치를 발견하여 이를 활용하는 것이다. 이러한 환경의 전제조건은 데이터의 공개 및 공유 개방이 될 것이다. 하지만 데이터 공개 시 개인정보와 같은 정보가 포함되어 법적 도덕적인 문제나 공개된 정보의 범죄 활용 등 2차적인 피해가 발생할 수 있어 데이터 공개 시 개인정보에 대한 익명화가 반드시 필요하다. 하지만 익명화된 데이터는 다른 정보와 결합을 통하여 재식별되어 비익명화 될 가능성이 항상 존재한다. 따라서 본 논문에서는 데이터 공개 시 익명화된 데이터를 공개하기 전에 재식별성에 대한 위험을 평가하는 테스트 방법론을 제안한다. 제안하는 방법론은 실제 테스트를 수행하는 3가지 과정 및 테스트 레벨 설정과 익명화 시 고려해야 할 부분으로 이루어져 있다. 제안하는 방법론을 통하여 안전한 데이터 공개 환경이 조성되어 빅데이터 시대에 개인정보에 안전한 데이터 공유와 개방이 이루어질 것으로 기대한다.