• 제목/요약/키워드: personal information pseudonymization

검색결과 16건 처리시간 0.024초

개인정보보호법에 따른 가명처리로 인한 데이터 손실이 데이터 분석의 정확도에 미치는 영향 (Pseudonymization's effect on data quality: A study under personal information protection act)

  • 김민정;유재근
    • 응용통계연구
    • /
    • 제37권3호
    • /
    • pp.381-393
    • /
    • 2024
  • 이 연구는 개인정보의 가명처리와 이것이 데이터 분석의 정확도에 미치는 영향을 조사하였다. 로지스틱 회귀 모델, 의사결정나무 및 랜덤 포레스트를 사용하여 가명처리의 적용 정도와 가명처리된 데이터 분석의 정확도 간의 관계를 정량적으로 평가하였으며, 이를 통해 민감한 정보의 가명처리가 데이터 분석의 정확도를 크게 손상시키지 않으면서도 개인정보보호를 실현할 수 있음을 확인하였다. 그러나, 단일한 샘플 데이터, 일관된 가명처리 비율의 적용 등의 한계가 있음을 인지하였다. 이러한 한계를 극복하기 위해, 다양한 데이터에 대한 추가적인 연구를 통하여 결과의 일반성을 강화하는 것이 필요하다. 또한, 개별 변수에 대해 최적의 가명처리 비율을 찾는 방법론을 개발하고 적용해 볼 것을 제안한다. 이 연구 결과는 규제 준수와 개인정보 보호를 달성하면서도 데이터의 활용성을 유지하는 방법에 대한 새로운 통찰을 제공한다.

가명정보 생명주기에 따른 개인정보보호 중심 설계 적용 원칙에 관한 연구 (A Study on the Principle of Application of Privacy by Design According to the Life Cycle of Pseudonymization Information)

  • 김동현
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.329-339
    • /
    • 2022
  • 최근 개인정보가 데이터로 활용되면서 다양한 신산업 등이 발굴되고 있지만 체계적인 관리체계 구축 미흡등 으로 개인정보 유출 및 오남용 사례가 연이어 발생되고 있다. 또한 지난 '20년 8월, 데이터 3법 시행 이후 개인정보를 가명·익명 처리하여 활용하는 서비스가 등장하고 있지만 불충분한 가명처리 및 가명정보 처리에 대한 안전성확보조치, 혐오표현 등의 민감정보의 처리 미흡으로 개인정보 이슈가 발생하고 있다. 이에 본 연구는 개인정보를 안전하게 활용하기 위하여 캐나다의 Ann Cavoukian[1]이 제시한 개인정보보호 중심 설계(Privacy by Design, 이하PbD) 원칙을 기반으로 가명정보 생명주기에 적용할 수 있는 새로운 PbD원칙을 제안하였다. 또한, 제안한 방법에 대하여 개인정보보호 관련 전문가 30명을 대상으로 설문조사를 통하여 제안 방법의 유의미함을 확인할 수 있었다.

결합키 생성항목의 갱신에 강건한 결합키 생성 기법 (Combination Key Generation Scheme Robust to Updates of Personal Information)

  • 장호빈;노건태;정익래;천지영
    • 정보보호학회논문지
    • /
    • 제32권5호
    • /
    • pp.915-932
    • /
    • 2022
  • 개인정보 보호법과 가명정보 처리 가이드라인에 따르면, 서로 다른 결합신청자들이 결합을 희망할 때 Salt값을 포함한 결합키 생성항목의 해시값으로 매핑을 진행한다. 결합키 생성항목의 예시로는 성명, 전화번호, 생년월일, 주소 등의 개인정보가 될 수 있으며, 해시 함수의 특성상 서로 다른 결합신청자들이 이들의 항목을 정확히 동일한 형태로 저장하고 있을 때 문제없이 결합을 진행할 수 있다. 하지만 이러한 기법은 서로 다른 결합신청자들의 데이터베이스 갱신 시점이 달라서 발생하는 주소 변경, 개명 등의 시나리오에서의 결합은 취약하다. 따라서 본 연구에서 우리는 주소 변경, 개명 등의 결합키 생성항목이 갱신된 시나리오에서도 개인정보보호를 만족하는 강건한 결합키 생성기법을 확률적 자료 연계를 통한 임계값을 바탕으로 제안하며, 본 연구 결과를 활용한 국내 빅데이터 및 인공지능 사업의 발전에 기여하고자 한다.

Zero-knowledge proof algorithm for Data Privacy

  • Min, Youn-A
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권2호
    • /
    • pp.67-75
    • /
    • 2021
  • As pass the three revised bills, the Personal Information Protection Act was revised to have a larger application for personal information. For an industrial development through an efficient and secure usage of personal information, there is a need to revise the existing anonymity processing method. This paper modifies the Zero Knowledge Proofs algorithm among the anonymity processing methods to modify the anonymity process calculations by taking into account the reliability of the used service company. More detail, the formula of ZKP (Zero Knowledge Proof) used by ZK-SNAKE is used to modify the personal information for pseudonymization processing. The core function of the proposed algorithm is the addition of user variables and adjustment of the difficulty level according to the reliability of the data user organization and the scope of use. Through Setup_p, the additional variable γ can be selectively applied according to the reliability of the user institution, and the degree of agreement of Witness is adjusted according to the reliability of the institution entered through Prove_p. The difficulty of the verification process is adjusted by considering the reliability of the institution entered through Verify_p. SimProve, a simulator, also refers to the scope of use and the reliability of the input authority. With this suggestion, it is possible to increase reliability and security of anonymity processing and distribution of personal information.

국내외 비식별화 기술에 관한 검토 분석에 따른 개인건강의료정보 보호를 위한 국내 특화 비식별화 기술 제안에 관한 연구 (Research of Specific Domestic De-identification Technique for Protection of Personal Health Medical Information in Review & Analysis of Overseas and Domestic De-Identification Technique)

  • 이필우;인한진;김철중;여광수;송경택;유기근;백종일;김순석
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제6권7호
    • /
    • pp.9-16
    • /
    • 2016
  • 국내외적으로 급변하는 인터넷 시대에 생활함에 따라 의료, 금융, 서비스 분야 등에서 대용량 정보가 이용된다. 이에 따라 병원, 기관 등 의료 기관에서의 시스템에서도 개인 정보의 유출 및 외부 침입으로 개인 정보 침해가 발생된다. 의료 기관의 개인건강의료정보의 정보보호 및 개인 프라이버시 보호를 위해 국내외 의료 기관에서는 국가별로 제시한 정책, 법령 기준에 따라 비식별화 처리 기술을 이용하고 있다. 기존 국내외 프라이버시 제도, 법령 등을 비교하여 국내에서 미흡했던 익명화와 가명화 기술 및 대상 데이터 항목에 대해 보다 발전되고 우수한 기술 및 대상을 도출하기 위해 비교 분석한다. 의료 개인정보에 대한 비식별화 처리 기술은 국외 기관인 미국 NIST 및 영국 ICO에서 제시한 국가정보보호를 위한 비식별화 기술에 비해 국내에서는 산학연의 각 기관 및 업체 등에서 자율적으로 비식별화 기술을 채용하고 있는 제약적인 상황이며 국내의 기술은 익명화 기술인 데이터 마스킹이나 삭제 기술의 수준이 되고 있는 실정이다. 국내 개인건강정보의 이용을 활성화하기 위해 재식별화 위험도를 줄인 비식별화 기술인 암호화와 확장성 퍼징 기술을 새롭게 제안하고자 한다.

데이터처리전문기관의 역할 및 보안 강화방안 연구: 버몬트주 데이터브로커 비교를 중심으로 (A Study on the Role and Security Enhancement of the Expert Data Processing Agency: Focusing on a Comparison of Data Brokers in Vermont)

  • 김수한;권헌영
    • 한국IT서비스학회지
    • /
    • 제22권3호
    • /
    • pp.29-47
    • /
    • 2023
  • With the recent advancement of information and communication technologies such as artificial intelligence, big data, cloud computing, and 5G, data is being produced and digitized in unprecedented amounts. As a result, data has emerged as a critical resource for the future economy, and overseas countries have been revising laws for data protection and utilization. In Korea, the 'Data 3 Act' was revised in 2020 to introduce institutional measures that classify personal information, pseudonymized information, and anonymous information for research, statistics, and preservation of public records. Among them, it is expected to increase the added value of data by combining pseudonymized personal information, and to this end, "the Expert Data Combination Agency" and "the Expert Data Agency" (hereinafter referred to as the Expert Data Processing Agency) system were introduced. In comparison to these domestic systems, we would like to analyze similar overseas systems, and it was recently confirmed that the Vermont government in the United States enacted the first "Data Broker Act" in the United States as a measure to protect personal information held by data brokers. In this study, we aim to compare and analyze the roles and functions of the "Expert Data Processing Agency" and "Data Broker," and to identify differences in designated standards, security measures, etc., in order to present ways to contribute to the activation of the data economy and enhance information protection.

의료 이미지 데이터의 비식별화 방안에 관한 연구 (Study for the Pseudonymization Technique of Medical Image Data)

  • 백종일;송경택;최원균;유기근;이필우;인한진;김철중;여광수;김순석
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제6권6호
    • /
    • pp.103-110
    • /
    • 2016
  • 최근 의료데이터의 유출사고가 빈번히 발생하여 환자의 프라이버시 침해 및 의료기관의 피해가 날로 증가하고 있다. 정부에서는 개인정보보호법등과 같은 법규를 제정하여 이러한 피해사례 예방하고 있다. 이중 의료기관 및 의료데이타에 대한 가이드라인은 보건복지부에서 발표한 '국내 의료기관 개인정보보호 가이드라인' 정도만 발표되어 있다. 환자개인의 민감정보를 포함한 의료데이타를 타의료기관 또는 제3의 연구기관등에 전달이 필요한 경우가 발생한다. 전달하고자 하는 의료 이미지 데이터를 일반적인 이미지파일 (JPG, JPEG, TIFF)의 포맷으로 자료의 교환이 이루어지고 있다. 이와같이 일반적인 이미지 포맷의 파일은 아무런 보호조치가 되어 있지 않아 외부로 유출시에는 파일내에 포함된 환자의 주요 식별정보가 노출되는 위험성이 존재한다. 본 연구에서는 이미지 파일에 대한 광학문자판독기술(OCR)을 적용하고 민감정보가 포함된 이미지파일에 암호화된 모자이크기술을 이용한 마스킹 기법을 도입하여 이러한 위험성을 해결하기 위한 이미지 비식별화 방안을 제시한다.

조건부가치평가법을 이용한 가명화된 이미지 가치측정 방법 및 사례 (Methods and Examples of Pseudonymized Image Value Measurement using Contingent Valuation Method)

  • 최유정;김태성
    • 경영정보학연구
    • /
    • 제26권1호
    • /
    • pp.57-71
    • /
    • 2024
  • 개인정보 데이터의 가치평가 방법은 여러 가지가 있지만, 데이터 가치평가의 표준은 존재하지 않는다. 의료 마이데이터 활용 플랫폼 서비스의 사례를 살펴보면 플랫폼 기업이 이용자로부터 동의를 받아 데이터 활용 목적으로 데이터를 제공받는 경우 이에 대한 보상으로 이용자 1인 평균 약 4,000 credit이 리워드로 지급된 바 있다. 앞선 사례와 같이 개인정보 가치평가는 개인정보의 세부 항목별이 아닌주로 인당 얼마의 가치를 지니는 지로 측정된다. 그러나 개인정보의 수와 형태가 다양해짐에 따라 개인정보의 가치는 형태별로 측정해야 한다. 본 연구는 비정형 개인정보, 특히 이미지의 가치측정을 중점으로 하고, 비정형 개인정보의 표준을 제안한다. 이미지의 가치측정을 통해 플랫폼 회사들이 데이터 제공 시 1인당 보상되는 credit 기준을 설정할 수 있도록 돕고, B2B 데이터 판매 시 객관적이고 합리적인 가격 책정을 지원할 수 있을 것이다.

Enhancing Privacy Protection in Steppy Applications through Pseudonymization

  • Nugroho, Heri Arum;Prihatmanto, Ary Setijadi;Rhee, Kyung Hyune
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.763-766
    • /
    • 2015
  • Smart Healthcare System as an Open Platform (Shesop) is an integrated healthcare system and have several features, one of them is Steppy Application. Steppy does count your step and display on Shesop website. In this system security issues are not properly addressed, while Personal Health Record (PHR) patient stored in the cloud platform could be at risk. In fact, the huge electronic information available online, people needs reliable and effective technique for privacy preserving. In order to improve the security of data which are displayed on the Shesop website, so that anyone who access could not tamper without permission. Recently Xu et al. showed a pseudonym scheme using smart card as a solution in e-health systems which uses discrete logarithm problem with cyclic group. In this paper, we adopt their scheme and use it application into smartphone using Near Field Communication (NFC) to construct security in Steppy apps.

국내외 비식별화 현황 분석을 통한 개인정보 활용 정책 제언 (Policy Suggestions on Personal Data Utilization by Analyzing Domestic and International De-identification Policy)

  • 강혜영;권헌영
    • 융합보안논문지
    • /
    • 제19권1호
    • /
    • pp.41-48
    • /
    • 2019
  • 사물인터넷, 인공지능 시대에 데이터가 사회와 경제 전반의 핵심자원이 되어 '데이터 중심 경제'를 이끌어가고 있다. 대량 데이터의 디지털화는 필수적이 되었고, 더불어 디지털화된 개인정보가 쉽게 수집, 저장, 복제, 분석이 가능해졌다. 전통적인 개인정보의 개념이 변화되고, 디지털화된 개인정보의 보호와 활용을 위해 미국, 유럽연합(EU), 일본, 우리나라 등 세계 각 국은 비식별화, 익명화, 가명화 개념과 규정을 신설하였다. 각 국의 비식별화 정책에서 이러한 개념들이 구분 혹은 혼용되고 있는데, 이러한 각 국의 정책 현황을 조사, 비교 및 분석하고자 한다. 이를 기반으로 우리나라 비식별화 정책 개선 방향을 모색하고, 빅데이터 시대에 개인정보의 보호와 활용의 균형적 조화를 이루어 디지털 경제에 발전에 기여 할 수 있는 정책 제언을 하고자한다.