arXiv논문2026. 05. 01. 15:50

FedHarmony: 분산 다중 레이블 학습에서 이질적인 레이블 상관관계를 조화시키는 방법

요약

FedHarmony는 여러 클라이언트가 사생활 보호 제약 하에 이질적인 다중 레이블 데이터를 보유하고 협력 학습을 수행하는 분산 환경을 위한 프레임워크입니다. 본 연구는 클라이언트별로 발생하는 '레이블 상관관계 드리프트' 문제를 해결하기 위해, 다른 클라이언트 간의 합의를 포착하는 '합의 상관관계(consensus correlation)' 개념을 도입했습니다. FedHarmony는 이를 전역 교사 역할을 통해 로컬 추정치를 수정하고, 데이터 크기와 상관관계 품질에 기반한 가중치 할당 및 최적화 알고리즘 개발을 통해 높은 성능과 효율성을 입증합니다.

핵심 포인트

분산 다중 레이블 학습(Federated Multi-Label Learning)은 사생활 보호가 필수적인 협력 학습 패러다임이다.
클라이언트별 이질성으로 인해 발생하는 '레이블 상관관계 드리프트'를 핵심 문제로 정의했다.
제안된 FedHarmony는 '합의 상관관계(consensus correlation)' 개념을 도입하여 전역 구조를 모델링한다.
집계 단계에서 클라이언트의 데이터 크기와 상관관계 품질에 따라 가중치를 동적으로 할당하는 메커니즘을 포함한다.
가속화된 최적화 알고리즘 개발 및 이론적 수렴 속도 개선을 통해 실용성을 높였다.

분산 다중 레이블 학습 (Federated Multi-Label Learning) 은 여러 클라이언트가 이질적인 다중 레이블 데이터를 보유하고 있으며, 원본 데이터를 공유하지 않고도 사생활 보호 제약 하에 협력 학습을 수행하는 분산 패러다임입니다. 그러나 이질적인 분포 하에서 레이블 상관관계를 모델링하는 것은 여전히 어려운 과제입니다. 클라이언트별 고유한 레이블 공간과 변화하는 공존 패턴으로 인해 개별 클라이언트가 학습한 상관관계는 필연적으로 전역 구조와 편차를 보이며, 우리는 이를 '레이블 상관관계 드리프트 (label correlation drift)'라고 명명합니다. 이를 해결하기 위해 우리는 클라이언트 간 이질적인 레이블 상관관계를 조화시키는 프레임워크인 FedHarmony 를 제안합니다. FedHarmony 는 다른 클라이언트들 간의 합의를 포착하는 '합의 상관관계 (consensus correlation)'를 도입하여, 편향된 로컬 추정치를 수정하는 전역 교사로 역할을 합니다. 집계 단계에서 FedHarmony 는 각 클라이언트를 데이터 크기와 상관관계 품질 두 가지 기준으로 평가하여 이에 따라 가중치를 할당합니다. 또한 우리는 FedHarmony 를 위한 가속화된 최적화 알고리즘을 개발하고, 정확도를 희생하지 않으면서 더 빠른 수렴을 이론적으로 입증했습니다. 실제 분산 다중 레이블 데이터셋에 대한 실험 결과, FedHarmony 는 최첨단 기법들을 일관되게 능가하는 성능을 보였습니다.

AI 자동 생성 콘텐츠

원문 바로가기

FedHarmony: 분산 다중 레이블 학습에서 이질적인 레이블 상관관계를 조화시키는 방법

요약

핵심 포인트

댓글