• 제목/요약/키워드: 언어모델 프라이버시

검색결과 8건 처리시간 0.027초

프라이버시 보호를 위한 오프사이트 튜닝 기반 언어모델 미세 조정 방법론 (Privacy-Preserving Language Model Fine-Tuning Using Offsite Tuning)

  • 정진명;김남규
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.165-184
    • /
    • 2023
  • 최근 구글의 BERT, OpenAI의 GPT 등, 언어모델(Language Model)을 사용한 비정형 텍스트 데이터에 대한 딥러닝(Deep Learning) 분석이 다양한 응용에서 괄목할 성과를 나타내고 있다. 대부분의 언어모델은 사전학습 데이터로부터 범용적인 언어정보를 학습하고, 이후 미세 조정(Fine-Tuning) 과정을 통해 다운스트림 태스크(Downstream Task)에 맞추어 갱신되는 방식으로 사용되고 있다. 하지만 최근 이러한 언어모델을 사용하는 과정에서 프라이버시가 침해될 수 있다는 우려가 제기되고 있다. 즉 데이터 소유자가 언어모델의 미세 조정을 수행하기 위해 다량의 데이터를 모델 소유자에게 제공하는 과정에서 데이터의 프라이버시가 침해될 수 있으며, 반대로 모델 소유자가 모델 전체를 데이터 소유자에게 공개하면 모델의 구조 및 가중치가 공개되어 모델의 프라이버시가 침해될 수 있다는 것이다. 이러한 상황에서 프라이버시를 보호하며 언어모델의 미세 조정을 수행하기 위해 최근 오프사이트 튜닝(Offsite Tuning)의 개념이 제안되었으나, 해당 연구는 제안 방법론을 텍스트 분류 모델에 적용하는 구체적인 방안을 제시하지 못했다는 한계를 갖는다. 이에 본 연구에서는 한글 문서에 대한 다중 분류 미세 조정 수행 시, 모델과 데이터의 프라이버시를 보호하기 위해 분류기를 추가한 오프사이트 튜닝을 적용하는 구체적인 방법을 제시한다. 제안 방법론의 성능을 평가하기 위해 AIHub에서 제공하는 ICT, 전기, 전자, 기계, 그리고 의학 총 5개의 대분야로 구성된 약 20만건의 한글 데이터에 대해 실험을 수행한 결과, 제안하는 플러그인 모델이 제로 샷 모델 및 오프사이트 모델에 비해 분류 정확도 측면에서 우수한 성능을 나타냄을 확인하였다.

딥러닝 프라이버시에 관한 연구 (A Study on Deep Learning Privacy)

  • 노시현;이병영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.207-209
    • /
    • 2024
  • 딥러닝은 선형 연산과 비선형 연산을 조합하여 목표로 하는 시스템을 잘 표현할 수 있는 함수를 찾기 위해 사용하며, 이미지 분류 및 생성, 거대 언어 모델 및 객체 인식의 영역에서 활발하게 사용되고 있다. 그러나 딥러닝 연산을 위해서는 모델과, 연산을 수행하고자 하는 데이터가 하나의 공간에 저장되어야 한다. 모델과 데이터를 데이터 소유자가 관리할 경우, 데이터 소유자가 모델 데이터의 프라이버시를 침해할 수 있으며, 이는 모델을 적대적 예제 생성 공격에 취약하도록 만드는 원인이 된다. 한편 모델과 데이터를 모델 소유자가 관리할 경우, 모델 소유자는 데이터의 프라이버시를 침해하여 데이터 소유자의 정보를 악의적으로 이용할 수 있다. 본 논문에서는 딥러닝 모델과 데이터의 프라이버시를 모두 보호하기 위해 주어진 딥러닝 모델의 암호화와 복호화를 수행하는 EncNet 을 구현하였으며, MNIST 와 Cifat-10 데이터셋에 대하여 실효성을 테스트하였다.

P-RBACML : 프라이버시 강화형 역할기반접근통제 정책 언어 모델 (P-RBACML : Privacy Enhancing Role-Based Access Control Policy Language Model)

  • 이영록;박준형;노봉남;박해룡;전길수
    • 정보보호학회논문지
    • /
    • 제18권5호
    • /
    • pp.149-160
    • /
    • 2008
  • 개인 사용자들은 정보통신 서비스 이용을 위해 필요 이상의 개인정보를 공개하므로 프라이버시를 심각하게 침해당한다. 이러한 불완전한 개인정보관리 인프라를 보완하기 위해 P3P나 EPAL, XACML 같은 개인정보보호 플랫폼 기술이 개발되고 있지만, 이들은 개별주체들을 대상으로 보호자원에 대한 접근통제정책을 적용하므로 역할기반 접근통제를 원하는 기업이나 기관에는 적합하지 않다. 본 논문에서는 프라이버시를 강화한 역할기반 접근통제 정책을 표현하는 언어를 제안한다. 제안된 프라이버시 강화형 역할기반 접근통제 정책은 XACML을 변형한 것으로, XACML의 장점인 매칭과 조건 표현을 사용하며 프라이버시를 강화하기 위해 목적, 의무사항을 별도의 엘리먼트로 표현한다. 본 논문에서는 퍼미션 배정 정책에 관한 정책언어 모델을 제안하고, 개인정보보호 법률에 기초한 정책 시나리오와 도큐먼트 인스턴스를 제공한다. 또한 사용자의 요청컨텍스트와 그에 대한 응답컨텍스트도 제공한다.

RBAC에 기초한 통합형 프라이버시 보호 모델 (Integrated Privacy Protection Model based on RBAC)

  • 조혁현;박희만;이영록;노봉남;이형효
    • 정보보호학회논문지
    • /
    • 제20권4호
    • /
    • pp.135-144
    • /
    • 2010
  • 프라이버시 보호는 기업의 온/오프-라인 데이터 처리 시스템 안에서 프라이버시 정책들을 수행할 수 있을 때에 달성될 수 있다. 프라이버시 정책 모델 중에는 P-RBAC과 목적모델, 의무모델이 있다. 그러나 이들 각각의 모델들만으로는 급변하는 기업환경에 능동적으로 대처하기 어렵다. 동일한 역할에 속해있는 사용자 중 최적의 조건을 만족하는 자만을 선발하여 일정기간 새로운 임무를 부여할 수 있어야하고, 풍부한 접근제약조건 표현을 허용하여 프라이버시 보호를 강화할 수 있어야 한다. 이를 위해 우리는 목적모델과 P-RBAC 모델, 의무모델을 통합시킨 통합형 프라이버시 보호 모델을 제안한다. 그리고 우리의 모델이 구현플랫폼과 응용에 종속적이지 않고 자동화될 수 있도록 XML 기반 정책언어모델을 정의한다.

소셜 네트워크 서비스를 위한 프라이버시 보호 정책언어 및 프라이버시 보호 모듈 구현 (Implementation of Privacy Protection Policy Language and Module For Social Network Services)

  • 김지혜;이형효
    • 정보보호학회논문지
    • /
    • 제21권1호
    • /
    • pp.53-63
    • /
    • 2011
  • 소셜 네트워크 서비스는 현실 세계의 인간관계를 바탕으로 온라인에서 서비스를 제공하는 웹서비스로 서비스의 인기가 높아짐에 따라 프라이버시 보호, 즉 개인정보 소유자의 권리 보호에 대한 목소리가 높아졌다. 본 논문은 개인정보 소유자의 자기정보 통제권을 보장하면서 소셜 네트워크 간 데이터 공유를 지원하기 위한 정책언어를 제시하고 이 정책을 기반으로 하는 프라이버시 보호 모듈을 설계 및 구현한다. 프라이버시 보호를 위한 정책언어는 개인정보에 접근하는 사용자의 속성을 기반으로 접근여부를 결정하는 속성기반 접근통제모델을 바탕으로 하고 있다. 뿐만 아니라 본 논문에서 제시된 정책 언어와 개발 모듈은 소셜 네트워크 서비스 간 안전한 데이터 공유 외에도 개인정보에 대한 자기정보 통제권이 필요한 다른 응용분야에 적용이 가능하다.

SOA기반 워크플로우 환경에서 DSML의 구조적 접근방법을 사용한 프라이버시 정책 모델의 통합과 검증 (Integration and Verification of Privacy Policies Using DSML's Structural Semantics in a SOA-Based Workflow Environment)

  • 이용환;얀워너;야노스스테파노비치
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.139-149
    • /
    • 2009
  • 본 논문에서는 데이터 보호 규정에 관련된 요구사항들이나 규칙들이 소프트웨어에 잘 표현되어 있는지를 검증하기 위하여 도메인 고유의 언어인 DSML(Domain Specific Modeling Language)을 사용해 정책을 정규화 혹은 계산적 표현에 관련된 솔루션을 제시하고 있다. 모든 정책들은 공식적으로 프롤로그( Prolog) 언어 기반으로 표현된 후 DSML에 통합되며 정책검증은 요구사항 준수가 언제 평가되어야 하는지에 따라 정적 정책검증과 동적 정책검증의 두가지 정책이 존재한다.

  • PDF

인터넷 Identity 관리 시스템 환경에서 XACML을 이용한 프라이버시 컨트롤러 (Privacy Controller using XACML for Internet Identity Management System)

  • 노종혁;진승헌
    • 한국통신학회논문지
    • /
    • 제32권7B호
    • /
    • pp.438-447
    • /
    • 2007
  • 인터넷 환경에서 유통되는 사용자 정보는 실소유자가 원하는 데로 제어되어야만 한다. 이를 위해서는 사용자가 요구하는 정보 유통 방식을 표현할 수 있는 프라이버시 정책이 필요하고, 사용자가 편리하게 정책을 설정할 수 있는 인터페이스가 요구된다. 또한 정보 유통이 발생할 때 사용자의 정책에 위배되는지 판단할 수 있는 시스템이 필요하다. 본 논문에서는 인터넷 Identity 관리 시스템 환경에서 운영되는 프라이버시 컨트롤러 시스템 모델을 제안하고 시스템의 인터페이스 및 정책 설정 과정을 제안한다. 정책 구현을 위한 언어로는 OASIS의 XACML을 수정하여 적용하였고, 사용자 정책 외에 도메인 정책, 기본 정보 제공 정책, 정책 충돌 해결 정책을 제안한다.

공공디자인 정책 결정에 ChatGPT의 활용 가능성에 관한연구 (A Study on the Potential Use of ChatGPT in Public Design Policy Decision-Making)

  • 손동주;윤명한
    • 서비스연구
    • /
    • 제13권3호
    • /
    • pp.172-189
    • /
    • 2023
  • 본 연구는 공공디자인 정책 결정에 있어 거대 언어 및 정보 모델인 ChatGPT가 기여할 가능성이 있는지에 대해 공공디자인 가진 특징을 중심으로 연구했다. 공공디자인은 디자인의 원리와 접근법을 사용하여 사회문제를 해결하고, 공공서비스 개선을 목표로 한다. 공공디자인 정책과 계획을 수립하기 위해서는 지역의 일반 현황, 인구 현황, 인프라 현황, 자원 현황, 안전 현황, 정책 현황, 법규 현황, 경관 현황, 공간 현황, 공공디자인 현황, 지역 이슈 등 방대한 자료를 기반으로 한다. 따라서 공공디자인은 방대한 자료와 더불어 방대한 언어를 수록하는 디자인 연구 분야다. 인공지능 기술의 급속한 발전과 공공디자인의 중요성을 고려해 ChatGPT와 같은 거대 언어 및 정보 모델이 공공디자인 정책에 어떻게 기여할 수 있는지 알아보고자 한다. 이와 함께, 공공디자인의 개념 및 원칙, 그리고 정책 개발과 실행에 대한 역할을 검토하고, ChatGPT의 개요 및 특징, 적용 사례나 ChatGPT의 선행 연구를 살펴 공공디자인 정책 결정에 활용할 수 있는지 연구했다. 연구 결과, ChatGPT는 공공디자인 정책 수립과정에서 방대한 언어 정보를 제공하고, 의사결정의 지원 역할이 가능하다는 사실을 밝혔다. 특히, ChatGPT는 정책 수립과정에서 다양한 관점을 제공하고, 정책 결정에 필요한 정보를 신속하게 제공하는 데 유용함이 있었다. 이와 함께 정부 정책 개발에 인공지능을 활용하는 추세라는 것이 여러 논문을 통해 확인되었다. 하지만, ChatGPT의 활용에는 윤리적, 법적, 개인 프라이버시 등의 문제 또한 발견되었다. 무엇보다 윤리적인 문제가 제기되었으며, 편향성과 공정성 관련 문제 또한 나타났다. ChatGPT를 공공디자인의 정책 결정에 실질적으로 활용하려면, 첫째, 정책 개발자와 공공디자인 전문가의 역량을 일정부분 키워 활용해야 한다. 둘째, 가칭 '인공지능 정책 활용에 관한 조례'라는 법령(法令)을 마련해 법률(法律)적 정비가 이뤄지기 전까지 지속해서 보완해가면서 활용하는 것이다. 현재로서는 이 두 가지 방안을 적용해 활용하는 것이 필요하다. 따라서 공공디자인 정책 결정에 있어 ChatGPT와 같은 거대 언어 및 정보 모델의 활용은 방대한 언어를 수록하는 디자인 분야에서는 활용할 가치가 충분하다는 것이다.