경험적 프라이버시 감사 (Empirical Privacy Auditing)의 최첨단 기술 발전
요약
LLM의 매개변수 효율적 미세 조정 과정에서 발생하는 데이터 암기 및 프라이버시 유출 위험을 정량화하는 경험적 프라이버시 감사(EPA) 기술을 제안합니다. 합성 카나리를 활용해 식별 가능성을 높이고, 합성 데이터 생성 시의 프라이버시 위험을 측정하는 새로운 기법을 소개합니다.
핵심 포인트
- 합성 카나리를 활용한 고효율 프라이버시 감사 방법론 제안
- 고온도 샘플링을 통한 식별 가능성이 높은 카나리 생성
- 보조 모델 미세 조정을 통한 합성 데이터 프라이버시 감사
- 모델 용량과 카나리 엔트로피가 암기에 미치는 영향 분석
대규모 언어 모델 (LLMs)의 매개변수 효율적 미세 조정 (Parameter-efficient fine-tuning)은 개별 학습 예시에 대한 문제적인 암기 (memorization) 현상을 보일 수 있습니다. 경험적 프라이버시 감사 (Empirical Privacy Auditing, EPA)는 멤버십 추론 (Membership Inference, MI) 또는 재구성 공격 (reconstruction attacks)에 대한 현실적인 데이터 유출을 측정함으로써 이러한 위험을 정량화합니다. EPA의 핵심 과제는 프라이버시 민감 학습 데이터와 혼합될 "카나리 (canary)" 예시를 설계하는 것입니다. 우리는 프라이버시 민감 학습 데이터에 맞춤화된 프롬프트를 사용하여, LLM으로부터 높은 온도 샘플링 (high-temperature sampling, $T \geq 0.8$)을 통해 합성 카나리 (synthetic canaries)를 생성할 것을 제안합니다. 이러한 카나리들은 높은 영향력을 가진 이상치 (high-influence outliers)로 작용하여, 높은 식별 가능성 (identifiability)과 그에 따른 강력한 감사를 보장합니다. 또한, 카나리 자체는 비민감적 (non-private)이므로 검사가 가능하며, 실제 데이터의 프라이버시를 해치지 않고 반복적으로 삽입될 수 있습니다. 프라이버시 민감 데이터로 미세 조정된 모델의 중요한 용도 중 하나는 합성 데이터 (synthetic data) 생성입니다. 이는 또한 프라이버시 위험을 동반합니다. 우리는 합성 데이터에 보조 모델 (auxiliary model)을 미세 조정하는 방식에 기반한 강력한 합성 데이터 감사 기법을 도입합니다. 보조 모델에 대해 원래의 카나리를 감사하면, 합성 데이터를 통한 프라이버시 유출에 대한 강력한 추정치를 제공할 수 있습니다. 마지막으로, 우리의 강력한 감사 방법론을 활용하여 모델 용량 (model capacity)과 카나리 엔트로피 (canary entropy)가 암기에 미치는 상호작용 효과에 대한 체계적인 조사를 수행합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기