arXiv논문2026. 05. 11. 23:24

INO-SGD: 개별화된 차분 프라이버시 하에서의 유틸리티 불균형 문제 해결

요약

본 논문은 개별화된 차분 프라이버시(IDP) 환경에서 발생하는 유틸리티 불균형 문제를 다룹니다. 민감한 데이터를 가진 소유자들이 더 강력한 프라이버시 요구사항을 설정할 때, 기존 알고리즘들은 이들의 데이터가 모델 훈련 과정에서 과소 대표되어 성능 저하를 초래하는 문제가 발생합니다. 이를 해결하기 위해 INO-SGD라는 새로운 알고리즘을 제안하며, 이는 각 배치 내 데이터를 전략적으로 다운-가중치하여 모든 반복 과정에서 높은 프라이버시 요구사항을 가진 데이터의 모델 성능을 개선합니다.

핵심 포인트

개별화된 차분 프라이버시(IDP)는 개인 데이터 소유자에게 맞춤형 프라이버시 통제권을 제공하는 중요한 개념입니다.
기존 IDP 알고리즘들은 높은 프라이버시 요구사항을 가진 데이터가 모델 훈련에서 과소 대표되는 '유틸리티 불균형' 문제를 야기합니다.
INO-SGD는 이 문제를 해결하기 위해 각 배치 내 데이터를 전략적으로 다운-가중치(down-weights)하는 방법을 제안합니다.
제안된 INO-SGD는 IDP를 만족하도록 특별히 설계되었으며, 기존 기술보다 우수한 성능 개선 효과와 실현 가능성을 입증했습니다.

차분 프라이버시(DP)는 기밀하거나 민감한 훈련 데이터가 노출되는 것을 방지하기 위해 머신러닝에서 광범위하게 사용됩니다. 개인 데이터 소유권으로 인해 데이터 소유자들이 자신의 데이터에 대한 통제력을 더 많이 갖게 되면서, 그들은 자신만의 프라이버시 요구사항을 설정할 가능성이 높아졌고, 이는 개별화된 DP(IDP)를 필요로 합니다. 특히 낙인찍힌 질병의 양성 사례와 같이 더욱 민감한 하위 집단의 데이터 소유자들은 이러한 데이터를 유출하는 것이 더 심각한 사회적 영향을 초래할 수 있으므로, 더 강력한 프라이버시 요구사항을 설정할 가능성이 높습니다. 하지만 기존의 IDP 알고리즘은 중요한 유틸리티 불균형 문제를 야기합니다: 더 강력한 프라이버시 요구사항을 가진 소유자의 데이터가 훈련 모델에서 심각하게 과소 대표되어, 배포 시 후속 사용자들의 유사 데이터에 대한 성능이 저하될 수 있습니다. 본 논문에서는 이 문제를 분석하고, 각 배치 내의 데이터를 전략적으로 다운-가중치(down-weights)하여 모든 반복 과정에서 더 높은 프라이버시를 가진 데이터의 성능을 개선하는 INO-SGD 알고리즘을 제안합니다. 주목할 점은, 저희 알고리즘이 IDP를 만족하도록 특별히 설계되었으며, 유틸리티 불균형을 다루는 기존 기술들은 IDP를 만족하지 못하거나 그렇게 적용하기 어렵다는 것입니다. 마지막으로, 저희 접근 방식의 경험적 실현 가능성을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

INO-SGD: 개별화된 차분 프라이버시 하에서의 유틸리티 불균형 문제 해결

요약

핵심 포인트

댓글