arXiv논문2026. 05. 20. 11:56

심층 신경망 (DNN)을 위한 증명 가능한 공정성 복구 (Provable Fairness Repair)

요약

심층 신경망(DNN)의 윤리적 편향 문제를 해결하기 위해 증명 가능한 공정성 보장을 제공하는 새로운 프레임워크인 ProF를 제안합니다. ProF는 구간 경계 전파(IBP) 기술을 활용하여 편향된 샘플 주변의 전체 집합에 대한 모델 출력을 포착하고, 이를 혼합 정수 선형 계획법(MILP) 문제로 변환하여 공정성을 복구합니다. 실험 결과, ProF는 높은 일반화 성능과 함께 약 90%의 공정성 개선 효과를 입증하였습니다.

핵심 포인트

기존 데이터 중심적 공정성 복구 방식의 한계인 증명 가능한 보장 및 일반화 능력 부족을 해결함
구간 경계 전파(Interval Bound Propagation)를 사용하여 샘플 주변 집합에 대한 모델 출력을 건전하게 포착
공정성 제약 조건과 모델 수정을 MILP(Mixed-Integer Linear Programming) 문제로 통합하여 해결
벤치마크 데이터셋에서 최대 95.93%의 데이터셋 내 공정성 및 93.16%의 입력 공간 일반화 성능 달성
다양한 민감한 속성과 실용적인 공정성 정의를 지원하도록 유연하게 구성 가능

심층 신경망 (Deep neural networks, DNNs)은 개인 차별과 같은 윤리적 문제로 어려움을 겪고 있습니다. 이에 대응하여, 모델을 조정하고 이러한 원치 않는 행동을 완화하기 위한 광범위한 신경망 (NN) 복구 기술들이 개발되어 왔습니다. 그러나 기존의 공정성 복구 방법들은 일반적으로 데이터 중심적 (data-centric)이며, 이로 인해 증명 가능한 보장 (provable guarantees)과 미학습 샘플에 대한 일반화 (generalization) 능력이 부족한 경우가 많습니다. 이러한 한계를 극복하기 위해, 우리는 증명 가능한 보장을 제공하는 새로운 공정성 복구 프레임워크인 ProF를 제안합니다. ProF의 핵심 직관은 구간 경계 전파 (interval bound propagation, 널리 사용되는 NN 검증 기술)를 활용하여 편향된 샘플 $\mathbf{x}$ 주변의 전체 집합 $S(\mathbf{x})$에 대한 모델 출력을 건전하게 포착하는 것입니다. 도출된 경계값은 모델이 $S(\mathbf{x})$에서 일관된 출력을 생성하도록 장려하는 공정성 복구를 가이드하는 데 사용됩니다. 구체적으로, 우리는 공정성 제약 조건 (fairness constraints)과 모델 수정 (model modifications)을 통합된 제약 조건 해결 공식 (constraint-solving formulation)으로 통합하며, 이는 기존의 솔버 (solvers)로 해결 가능한 혼합 정수 선형 계획법 (Mixed-Integer Linear Programming, MILP) 문제로 변환될 수 있습니다. MILP 문제의 해는 전체 집합 $S(\mathbf{x})$에 대해 공정성이 보장되는 복구된 모델을 효과적으로 유도합니다. 우리는 네 가지 널리 사용되는 벤치마크 데이터셋에서 ProF를 평가하였으며, ProF가 증명 가능한 공정성 복구를 달성함을 입증했습니다. 구체적으로 전체 데이터셋에서 최대 95.93%, 전체 입력 공간에서 93.16%의 일반화 성능을 보였습니다. 특히, ProF는 증명 가능한 복구 보장을 제공하고 약 90%의 공정성 개선을 달성하는 동시에, 여러 민감한 속성 (sensitive attributes)과 더 실용적인 공정성 정의를 지원하도록 쉽게 구성될 수 있습니다. 우리의 코드는 https://github.com/nninjn/ProF 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

심층 신경망 (DNN)을 위한 증명 가능한 공정성 복구 (Provable Fairness Repair)

요약

핵심 포인트

댓글