DataGuard: 시스톨릭 어레이 (Systolic-array) 기반 가속기에서의 프라이버시 보호 학습 보장
요약
DataGuard는 시스톨릭 어레이 기반 가속기에서 차분 프라이버시(DP)와 연합 학습(FL)을 결합하여 하드웨어 수준에서 프라이버시를 보호하는 메커니즘을 제안합니다. 제3자 애플리케이션을 신뢰하지 않고도 설정된 프라이버시 예산을 초과하지 않도록 보장하며, 매우 낮은 면적 및 성능 오버헤드를 입증했습니다.
핵심 포인트
- 시스톨릭 어레이 가속기 기반의 하드웨어 프라이버시 보호 메커니즘 제안
- 연합 학습(FL)과 차분 프라이버시(DP)를 결합하여 데이터 유출 방지
- 제3자 애플리케이션에 대한 신뢰 없이도 프라이버시 예산 준수 보장
- 0.01% 미만의 면적 오버헤드와 0.3% 미만의 성능 저하 달성
차분 프라이버시 (Differential privacy, DP)와 연합 학습 (Federated learning, FL)은 민감한 데이터를 사용하여 머신러닝 (Machine learning, ML) 모델을 학습시킬 때 중요한 프라이버시 보호 접근 방식으로 부상했습니다. FL은 모델을 장치에서 로컬로 학습시킴으로써 원본 민감 데이터가 사용자의 장치를 떠나지 않도록 보장합니다. DP는 모델을 업데이트하기 전에 그래디언트 (Gradients)를 클리핑 (Clipping)하고 노이즈를 추가함으로써 모델이 개인에 대한 어떠한 정보도 유출하지 않도록 보장합니다. 이는 학습 중 프라이버시 손실을 민감 데이터 소유자가 사전에 결정한 프라이버시 예산 (Privacy budget) 내로 제한할 수 있는 형식주의 (Formalism)를 제공합니다. 그러나 실제 FL 알고리즘의 배포 환경에서는 일반적으로 제3자 FL 애플리케이션이 DP 알고리즘을 올바르게 구현할 것이라고 신뢰할 수 있다고 가정합니다. 따라서 제3자 애플리케이션은 민감한 데이터에 대한 전체 접근 권한을 갖게 됩니다. 본 연구에서는 장치를 떠날 수 있는 유일한 데이터가 DP 요구 사항을 충족하는 계산 결과임을 보장하는 하드웨어 기반 메커니즘인 DataGuard를 제안합니다. 따라서 DataGuard는 제3자 애플리케이션을 신뢰할 필요 없이 FL 학습 중에 데이터 소유자에 의해 정의된 프라이버시 예산이 초과되지 않도록 보장하는 데 사용될 수 있습니다. 우리는 다양한 ML 모델에 대해 4가지 가속기 시뮬레이션에서 DataGuard를 평가하였으며, 0.01% 미만의 매우 작은 면적 오버헤드(Area overheads)와 0.3% 미만의 성능 저하(Performance slowdowns)를 입증했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기