Giskard: 대규모 분산 학습을 위한 Byzantine 강건성 및 기밀성 집계
요약
분산 학습 환경에서 기밀성 보장과 Byzantine 공격에 대한 강건성을 동시에 확보하기 위한 새로운 프로토콜 Giskard를 제안합니다. 위원회 트리 구조와 MPC를 활용하여 대규모 참여자 환경에서도 확장성 있는 보안 집계를 구현했습니다.
핵심 포인트
- 기밀성과 Byzantine 회복력을 동시에 제공하는 Giskard 프로토콜 제안
- 위원회 트리 구조를 통해 통신 복잡도를 점근적으로 감소시켜 확장성 확보
- 최대 100만 명의 참여자를 대상으로 하는 광범위한 실험적 검증 완료
- 최대 n/4의 Byzantine 참여자 존재 시에도 높은 모델 효용성 유지
분산 학습 (Decentralized Learning)에서 기밀성 (Confidentiality)과 Byzantine 동작을 동시에 다루는 것은 매우 도전적인 문제입니다. 실제로 분산 학습에서 클라이언트들은 데이터를 로컬에 유지하면서 머신러닝 모델을 학습시키고, 모델 파라미터 또는 그래디언트 (Gradients)를 이웃 집합과 공유합니다. 기밀성을 강제하려면 교환되는 모델 파라미터/그래디언트를 숨겨야 하지만 (예: 암호화 기술 사용), Byzantine 기여를 처리하려면 종종 후자를 검사해야 합니다. 따라서 대부분의 연구는 이러한 목표들을 별개로 다룹니다. 최근의 연구 흐름은 모델 포이즈닝 (Model Poisoning)에 대응하는 강건한 집계기 (Robust Aggregators)를 구현하기 위해 보안 다자간 계산 (Secure Multi-party Computation, MPC)을 채택하여, 기밀성과 Byzantine 회복력 (Byzantine Resilience)을 모두 확보할 것을 제안합니다. 그러나 이러한 솔루션들은 확장성 (Scalability)이 떨어집니다. 참여자 간의 전방위적 통신 (All-to-all communication)을 요구하거나, 전체 계산을 소수의 하위 집합에 위임해야 하는데, 이들의 계산 및 통신 부하는 네트워크 크기에 비례하여 증가합니다. 본 논문에서는 기밀성을 보장하면서도 Byzantine에 강건한 분산 집계를 위한 프로토콜인 Giskard를 제시합니다. Giskard는 $n$개의 참여자를 크기가 $O( ext{log } n)$인 위원회 트리 (Tree of Committees)로 구성하며, 각 위원회 내에서 BGW 스타일의 MPC를 사용하여 값 영역 (Value Domain)에 대한 위원회 적응형 분산 이진 탐색 (Committee-adapted Distributed Binary Search)을 통해 좌표별 근사 중앙값 (Coordinate-wise Approximate Median)을 평가합니다. 우리는 Giskard의 보안 및 기밀성 속성을 증명함으로써 이론적으로 평가하고, 최대 100만 명의 참여자를 포함하는 광범위한 실험을 통해 실험적으로 검증합니다. 가장 유사한 경쟁 기술들과 비교했을 때, Giskard는 참여자당 통신 복잡도 (Communication Complexity)를 점근적으로 줄이면서도, 최대 $n/4$의 Byzantine 참여자가 있는 상황에서도 대등한 모델 효용성 (Model Utility)을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기