• 제목/요약/키워드: Pseudonymization

검색결과 20건 처리시간 0.021초

개인정보보호법에 따른 가명처리로 인한 데이터 손실이 데이터 분석의 정확도에 미치는 영향 (Pseudonymization's effect on data quality: A study under personal information protection act)

  • 김민정;유재근
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.381-393
    • /
    • 2024
  • 이 연구는 개인정보의 가명처리와 이것이 데이터 분석의 정확도에 미치는 영향을 조사하였다. 로지스틱 회귀 모델, 의사결정나무 및 랜덤 포레스트를 사용하여 가명처리의 적용 정도와 가명처리된 데이터 분석의 정확도 간의 관계를 정량적으로 평가하였으며, 이를 통해 민감한 정보의 가명처리가 데이터 분석의 정확도를 크게 손상시키지 않으면서도 개인정보보호를 실현할 수 있음을 확인하였다. 그러나, 단일한 샘플 데이터, 일관된 가명처리 비율의 적용 등의 한계가 있음을 인지하였다. 이러한 한계를 극복하기 위해, 다양한 데이터에 대한 추가적인 연구를 통하여 결과의 일반성을 강화하는 것이 필요하다. 또한, 개별 변수에 대해 최적의 가명처리 비율을 찾는 방법론을 개발하고 적용해 볼 것을 제안한다. 이 연구 결과는 규제 준수와 개인정보 보호를 달성하면서도 데이터의 활용성을 유지하는 방법에 대한 새로운 통찰을 제공한다.

A Study on Efficient Data De-Identification Method for Blockchain DID

  • Min, Youn-A
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권2호
    • /
    • pp.60-66
    • /
    • 2021
  • Blockchain is a technology that enables trust-based consensus and verification based on a decentralized network. Distributed ID (DID) is based on a decentralized structure, and users have the right to manage their own ID. Recently, interest in self-sovereign identity authentication is increasing. In this paper, as a method for transparent and safe sovereignty management of data, among data pseudonymization techniques for blockchain use, various methods for data encryption processing are examined. The public key technique (homomorphic encryption) has high flexibility and security because different algorithms are applied to the entire sentence for encryption and decryption. As a result, the computational efficiency decreases. The hash function method (MD5) can maintain flexibility and is higher than the security-related two-way encryption method, but there is a threat of collision. Zero-knowledge proof is based on public key encryption based on a mutual proof method, and complex formulas are applied to processes such as personal identification, key distribution, and digital signature. It requires consensus and verification process, so the operation efficiency is lowered to the level of O (logeN) ~ O(N2). In this paper, data encryption processing for blockchain DID, based on zero-knowledge proof, was proposed and a one-way encryption method considering data use range and frequency of use was proposed. Based on the content presented in the thesis, it is possible to process corrected zero-knowledge proof and to process data efficiently.

익명화 방법을 적용한 임상진료문서 등록 기법 연구 (A New Method of Registering the XML-based Clinical Document Architecture Supporting Pseudonymization in Clinical Document Registry Framework)

  • 김일광;이재영;김일곤;곽연식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.918-928
    • /
    • 2007
  • 진료기관 사이뿐 아니라 국가 경계를 넘어선 환자진료 정보 교류에 대한 요구사항이 세계적으로 증가되고 있으며 이에 대한 연구가 활발하게 진행되고 있다. 본 논문에서는 임상진료문서 등록 저장소에서의 임상진료문서 등록, 조회 방법에 관한 두 가지 기법을 제안한다. 그 첫 번째는, 임상진료문서 관련부속파일에 대한 참조와 처리를 위해 적하목록(Manifest)을 구성하고 사용을 제안하는 것이다. 두 번째는 한층 강화된 임상진료문서 보안전략을 통해 환자 익명성을 제공할 수 있는 방법이다. 전자는 네트워크 장애와 같은 외부요인에도 임상진료문서 관련 부속자료에 대한 로컬 참조를 가능케 하여 끊김 없는 뷰(view)를 구성할 수 있게 한다. 후자는 환자의 신상정보를 담은 임상진료문서 헤더와 진단과 처치 정보를 담은 임상진료문서 바디가 지리적으로 분산된 하나 이상의 저장소에 분리 저장되기 때문에 어느 하나의 저장소가 공격 당하더라도 공격자는 환자의 단편적인 정보만 획득하게 된다. 이는, 결국 환자의 신상정보와 병력정보를 단절시킴으로써 사생활침해의 소지를 줄이고 개인정보보호 효과를 가져올 수 있게 한다.

교통분야 가명정보의 효율적 처리 및 활용을 위한 통합데이터안심구역 프로토타입 (Integrated Data Safe Zone Prototype for Efficient Processing and Utilization of Pseudonymous Information in the Transportation Sector)

  • 이형근;유기동
    • 한국ITS학회 논문지
    • /
    • 제23권3호
    • /
    • pp.48-66
    • /
    • 2024
  • 데이터 3법과 데이터 산업법에 따라 가명정보 결합전문기관 및 데이터안심구역 시스템이 물리적으로 분리되어 운영 중이므로, 가명정보의 처리 및 활용을 원하는 중소기업 또는 스타트업 등의 사용자에게 복잡한 절차와 병목으로 인한 부담으로 작용한다. 또한, 개인정보의 유출 등을 우려한, 지나치게 엄격한 가명 처리 과정은 오히려 데이터의 품질을 훼손하는 역효과가 발생한다. 가명정보의 안전한 처리 및 활용을 위한 일련의 조치는 사용자의 편의와 데이터의 품질을 동시에 보장할 수 있도록 구성되어야 한다. 따라서 본 연구는 기존 가명정보 처리 및 활용의 문제점을 개선한 통합데이터안심구역의 프로토타입 시스템을 제시한다. 이를 위해 기존 BPR 가이드라인을 선택적으로 수정하여 새로운 워크플로우 재설계 가이드라인을 개발 및 적용하며, 핵심성능지표를 도출하여 개발된 프로토타입의 성능을 판단한다. 성능평가 결과 제시된 프로토타입은 기존의 시스템에 비해 시간적 측면에서는 약 6배, 비용적 측면에서는 1.28배, 품질적 측면에서는 1.3배의 향상된 성능을 보임을 확인하였다.

가명정보 생명주기에 따른 개인정보보호 중심 설계 적용 원칙에 관한 연구 (A Study on the Principle of Application of Privacy by Design According to the Life Cycle of Pseudonymization Information)

  • 김동현
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.329-339
    • /
    • 2022
  • 최근 개인정보가 데이터로 활용되면서 다양한 신산업 등이 발굴되고 있지만 체계적인 관리체계 구축 미흡등 으로 개인정보 유출 및 오남용 사례가 연이어 발생되고 있다. 또한 지난 '20년 8월, 데이터 3법 시행 이후 개인정보를 가명·익명 처리하여 활용하는 서비스가 등장하고 있지만 불충분한 가명처리 및 가명정보 처리에 대한 안전성확보조치, 혐오표현 등의 민감정보의 처리 미흡으로 개인정보 이슈가 발생하고 있다. 이에 본 연구는 개인정보를 안전하게 활용하기 위하여 캐나다의 Ann Cavoukian[1]이 제시한 개인정보보호 중심 설계(Privacy by Design, 이하PbD) 원칙을 기반으로 가명정보 생명주기에 적용할 수 있는 새로운 PbD원칙을 제안하였다. 또한, 제안한 방법에 대하여 개인정보보호 관련 전문가 30명을 대상으로 설문조사를 통하여 제안 방법의 유의미함을 확인할 수 있었다.

결합키 생성항목의 갱신에 강건한 결합키 생성 기법 (Combination Key Generation Scheme Robust to Updates of Personal Information)

  • 장호빈;노건태;정익래;천지영
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.915-932
    • /
    • 2022
  • 개인정보 보호법과 가명정보 처리 가이드라인에 따르면, 서로 다른 결합신청자들이 결합을 희망할 때 Salt값을 포함한 결합키 생성항목의 해시값으로 매핑을 진행한다. 결합키 생성항목의 예시로는 성명, 전화번호, 생년월일, 주소 등의 개인정보가 될 수 있으며, 해시 함수의 특성상 서로 다른 결합신청자들이 이들의 항목을 정확히 동일한 형태로 저장하고 있을 때 문제없이 결합을 진행할 수 있다. 하지만 이러한 기법은 서로 다른 결합신청자들의 데이터베이스 갱신 시점이 달라서 발생하는 주소 변경, 개명 등의 시나리오에서의 결합은 취약하다. 따라서 본 연구에서 우리는 주소 변경, 개명 등의 결합키 생성항목이 갱신된 시나리오에서도 개인정보보호를 만족하는 강건한 결합키 생성기법을 확률적 자료 연계를 통한 임계값을 바탕으로 제안하며, 본 연구 결과를 활용한 국내 빅데이터 및 인공지능 사업의 발전에 기여하고자 한다.

의료 이미지 데이터의 비식별화 방안에 관한 연구 (Study for the Pseudonymization Technique of Medical Image Data)

  • 백종일;송경택;최원균;유기근;이필우;인한진;김철중;여광수;김순석
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제6권6호
    • /
    • pp.103-110
    • /
    • 2016
  • 최근 의료데이터의 유출사고가 빈번히 발생하여 환자의 프라이버시 침해 및 의료기관의 피해가 날로 증가하고 있다. 정부에서는 개인정보보호법등과 같은 법규를 제정하여 이러한 피해사례 예방하고 있다. 이중 의료기관 및 의료데이타에 대한 가이드라인은 보건복지부에서 발표한 '국내 의료기관 개인정보보호 가이드라인' 정도만 발표되어 있다. 환자개인의 민감정보를 포함한 의료데이타를 타의료기관 또는 제3의 연구기관등에 전달이 필요한 경우가 발생한다. 전달하고자 하는 의료 이미지 데이터를 일반적인 이미지파일 (JPG, JPEG, TIFF)의 포맷으로 자료의 교환이 이루어지고 있다. 이와같이 일반적인 이미지 포맷의 파일은 아무런 보호조치가 되어 있지 않아 외부로 유출시에는 파일내에 포함된 환자의 주요 식별정보가 노출되는 위험성이 존재한다. 본 연구에서는 이미지 파일에 대한 광학문자판독기술(OCR)을 적용하고 민감정보가 포함된 이미지파일에 암호화된 모자이크기술을 이용한 마스킹 기법을 도입하여 이러한 위험성을 해결하기 위한 이미지 비식별화 방안을 제시한다.

국방 분야 인공지능 기술 접목에 따른 교육훈련 데이터 가명처리 방법론에 관한 연구 (A Study on the Data Pseudonymization Methodology for Defense Training Data as Artificial Intelligence Technology is applied to the Defense Field)

  • 조현석;강수진;조동래;신영섭
    • 한국국방기술학회 논문지
    • /
    • 제5권3호
    • /
    • pp.1-7
    • /
    • 2023
  • 최근 국방 분야에서는 인공지능 기술을 접목하기 위해 데이터센터를 구축하여 데이터를 모으려 한다. 무기체계 훈련 데이터는 인공지능 모델의 입력 데이터로 사용되어 훈련 성과를 극대화하고 군 전략을 발전시킬 수 있는 양질의 데이터로 사용될 수 있다. 하지만 훈련 데이터에는 그 장비를 운용했던 인원의 이름과 군번 등의 개인적인 정보와 무기체계의 특징을 알 수 있는 훈련 기록들을 담고 있다. 이런 데이터가 적군에게 넘어간다면 무기체계의 제원 및 성능뿐만 아니라 운용자별 숙련도도 노출될 수 있다. 본 논문에서는 교육훈련 데이터 보안을 위해 가명처리 방법론을 제안하고 관련 법령의 개정 방향도 제언한다.

  • PDF

Enhancing Privacy Protection in Steppy Applications through Pseudonymization

  • Nugroho, Heri Arum;Prihatmanto, Ary Setijadi;Rhee, Kyung Hyune
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.763-766
    • /
    • 2015
  • Smart Healthcare System as an Open Platform (Shesop) is an integrated healthcare system and have several features, one of them is Steppy Application. Steppy does count your step and display on Shesop website. In this system security issues are not properly addressed, while Personal Health Record (PHR) patient stored in the cloud platform could be at risk. In fact, the huge electronic information available online, people needs reliable and effective technique for privacy preserving. In order to improve the security of data which are displayed on the Shesop website, so that anyone who access could not tamper without permission. Recently Xu et al. showed a pseudonym scheme using smart card as a solution in e-health systems which uses discrete logarithm problem with cyclic group. In this paper, we adopt their scheme and use it application into smartphone using Near Field Communication (NFC) to construct security in Steppy apps.

국내외 비식별화 기술에 관한 검토 분석에 따른 개인건강의료정보 보호를 위한 국내 특화 비식별화 기술 제안에 관한 연구 (Research of Specific Domestic De-identification Technique for Protection of Personal Health Medical Information in Review & Analysis of Overseas and Domestic De-Identification Technique)

  • 이필우;인한진;김철중;여광수;송경택;유기근;백종일;김순석
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제6권7호
    • /
    • pp.9-16
    • /
    • 2016
  • 국내외적으로 급변하는 인터넷 시대에 생활함에 따라 의료, 금융, 서비스 분야 등에서 대용량 정보가 이용된다. 이에 따라 병원, 기관 등 의료 기관에서의 시스템에서도 개인 정보의 유출 및 외부 침입으로 개인 정보 침해가 발생된다. 의료 기관의 개인건강의료정보의 정보보호 및 개인 프라이버시 보호를 위해 국내외 의료 기관에서는 국가별로 제시한 정책, 법령 기준에 따라 비식별화 처리 기술을 이용하고 있다. 기존 국내외 프라이버시 제도, 법령 등을 비교하여 국내에서 미흡했던 익명화와 가명화 기술 및 대상 데이터 항목에 대해 보다 발전되고 우수한 기술 및 대상을 도출하기 위해 비교 분석한다. 의료 개인정보에 대한 비식별화 처리 기술은 국외 기관인 미국 NIST 및 영국 ICO에서 제시한 국가정보보호를 위한 비식별화 기술에 비해 국내에서는 산학연의 각 기관 및 업체 등에서 자율적으로 비식별화 기술을 채용하고 있는 제약적인 상황이며 국내의 기술은 익명화 기술인 데이터 마스킹이나 삭제 기술의 수준이 되고 있는 실정이다. 국내 개인건강정보의 이용을 활성화하기 위해 재식별화 위험도를 줄인 비식별화 기술인 암호화와 확장성 퍼징 기술을 새롭게 제안하고자 한다.