arXiv논문2026. 06. 23. 14:08

FairBED: 더 공정한 데이터 수집을 위한 베이지안 실험 설계 (Bayesian Experimental Design) 접근 방식

요약

데이터 수집 단계부터 편향을 줄이기 위해 베이지안 실험 설계(BED)를 활용하는 FairBED 프레임워크를 제안합니다. 민감한 속성에 대한 정보 이득은 최소화하고 타겟 수량에 대한 정보 이득은 최대화하여 공정성과 정확도 사이의 트레이드오프를 개선합니다.

핵심 포인트

데이터 수집 과정 자체를 수정하여 모델의 공정성 보장
민감 속성 정보 이득 최소화 및 타겟 정보 이득 최대화 목적 함수 구축
FairBED와 인구통계학적 패리티(Demographic Parity) 간의 이론적 연결 도출
기존 방식 대비 개선된 공정성-정확도 트레이드오프 입증

머신러닝 (Machine Learning)에서 공정성을 보장하기 위한 프레임워크들은 일반적으로 기존 데이터로부터 공정한 모델을 학습하는 데 집중합니다. 하지만 이러한 노력은 데이터에 이미 존재하는 편향 (Biases)으로 인해 종종 저해됩니다. 따라서 우리는 공정한 예측기 (Fair Predictors)를 학습시키기에 본질적으로 더 적합한, 더 공정한 데이터를 수집하는 데 도움이 되도록 데이터 획득 과정 자체를 수정하는 방법을 모색합니다. 이를 위해 우리는 공정한 데이터셋은 민감한 속성 (Sensitive Attributes)에 대해 정보를 제공하지 않아야 한다는 아이디어를 바탕으로, 데이터셋 자체의 공정성을 정량화하기 위한 새로운 정식화 (Formulations)를 제공하는 FairBED를 소개합니다. 그런 다음 이를 사용하여 관심 대상 수량 (Target Quantity of Interest)에 대한 기대 정보 이득 (Expected Information Gain)은 최대화하면서 민감한 속성에 대한 기대 정보 이득은 최소화하는 실용적인 공정성 인식 베이지안 실험 설계 (Bayesian Experimental Design, BED) 목적 함수를 구축합니다. 나아가 우리는 FairBED와 인구통계학적 패리티 (Demographic Parity) 사이의 이론적 연결 고리를 도출하며, FairBED를 사용하여 수집된 데이터로 학습된 모델이 무작위로 획득된 데이터나 전통적인 BED와 비교했을 때 개선된 공정성-정확도 트레이드오프 (Fairness-Accuracy Trade-offs)를 제공함을 경험적으로 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

FairBED: 더 공정한 데이터 수집을 위한 베이지안 실험 설계 (Bayesian Experimental Design) 접근 방식

요약

핵심 포인트

댓글