완전 위임된 AI 협동조합에서의 가치 제약적 신용 할당(Credit Assignment)을 향하여
요약
이질적인 가치 제약 하에서 작동하는 완전 위임된 AI 협동조합을 위한 새로운 보상 할당 프레임워크를 제안합니다. 순회 학습(TL)을 활용하여 각 위임자의 가치 프로필에 부합하는 업데이트에만 신용을 부여하는 방식을 공식화합니다.
핵심 포인트
- 가치 조건부 그래디언트 필터링을 통한 보상 할당
- 순회 학습(TL) 기반의 분산 역전파 수행
- FedAvg보다 미세한 귀속 기질 제공
- 데이터 가치 평가 및 다원적 정렬 문제 해결
우리는 인간이 이질적인 가치 제약(value constraints) 하에서 데이터를 기여하고 모델 업데이트에 참여하는 에이전트로 표현되는, 완전 위임된 AI 협동조합(fully delegated AI cooperatives)을 위한 보상 할당 프레임워크를 제안합니다. 핵심 아이디어는 각 위임자(principal)의 가치 프로필(value profile)에 따라 스크리닝한 후에도 허용 가능한(admissible) 업데이트에 대해서만 신용(credit)을 부여하는 것입니다. 우리는 순회 학습(traversal learning, TL) 기질(substrate) 내에서 가치 조건부 그래디언트 필터링(value-conditioned gradient filtering), 온라인 한계 기여 신호(online marginal contribution signals), 그리고 누적 수익 정산(cumulative revenue settlement)을 공식화합니다. TL은 집합 중심의 분산 학습(aggregation-centric distributed learning)과 관련된 품질 저하 없이 분산 역전파(decentralized backpropagation)를 수행하기 때문에 여기서 특히 매력적이며, 명시적인 순회 및 그래디언트 경로를 보존함으로써 FedAvg 스타일의 연합 학습(federated learning)보다 더 미세한 귀속 기질(attribution substrate)을 제공한다고 주장합니다. 이 프레임워크는 데이터 가치 평가(data valuation), 연합 기여도 추정(federated contribution estimation), 개인화된 연합 학습(personalized federated learning), 그리고 다원적 정렬(pluralistic alignment)과 대비하여 위치합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기