FedLAB: 연합 멀티모달 그래프 파운데이션 학습을 위한 추적 가능한 시맨틱 코드북 (Traceable Semantic Codebooks)
요약
FedLAB은 개인정보 보호를 위해 데이터를 격리한 상태에서 멀티모달 그래프 지식을 학습하는 연합 학습 프레임워크입니다. 유형화된 계층적 코드북을 통해 모달리티 증거와 토폴로지 컨텍스트를 명시적으로 추적할 수 있는 시맨틱 코드북을 제안합니다.
핵심 포인트
- 데이터 격리 환경을 위한 연합 멀티모달 그래프 파운데이션 학습 제안
- 계층적 코드북을 통한 모달리티 및 토폴로지 컨텍스트의 시맨틱 추적 가능성 확보
- 연합 시맨틱 바리센터 사전 학습을 통한 추적 단위 정교화
- 기존 SOTA 대비 최대 7.53%의 성능 향상 입증
멀티모달 그래프 파운데이션 모델 (Multimodal graph foundation models)은 텍스트, 이미지, 속성 및 관계적 토폴로지 (relational topology)로 풍부해진 그래프로부터 재사용 가능한 지식을 학습하여, 다양한 그래프 중심 및 모달리티 중심 태스크를 지원하는 것을 목표로 합니다. 그러나 실제 환경에서 이러한 멀티모달 그래프는 종종 분산된 클라이언트들에 나누어져 있으며, 개인정보 보호 제약으로 인해 원시 콘텐츠 (raw contents)와 로컬 구조를 중앙에서 공유할 수 없습니다. 이는 연합 멀티모달 그래프 파운데이션 학습 (federated multimodal graph foundation learning)의 필요성을 불러일으키며, 이는 엄격한 데이터 격리 하에서 전이 가능한 표현 학습 (representation learning)뿐만 아니라 본질적인 시맨틱 추적 가능성 (semantic traceability)을 요구합니다. 기존 방법들은 주로 파라미터 (parameters), 프로토타입 (prototypes), 임베딩 (embeddings) 또는 압축된 코드북 (compact codebooks)을 통해 지식을 교환하거나 저장하며, 이는 최적화와 전이를 지원하지만 모달리티 증거 (modality evidence), 노드 시맨틱스 (node semantics), 그리고 토폴로지 컨텍스트 (topology context)가 어떻게 공동으로 예측을 지원하는지를 명시적으로 드러내지는 못합니다. 이러한 격차를 해소하기 위해, 우리는 모달리티 증거, 노드 시맨틱스, 토폴로지 컨텍스트를 위해 유형화된 계층적 코드북 (typed hierarchical codebooks)으로 멀티모달 그래프 지식을 구성하는 추적 가능한 시맨틱 코드북 프레임워크인 FedLAB을 제안합니다. FedLAB은 원시 멀티모달 콘텐츠와 그래프 구조를 로컬에 유지하면서, 연합 시맨틱 바리센터 사전 학습 (federated semantic barycenter pre-training)을 통해 이러한 추적 단위 (trace units)를 더욱 정교화합니다. 10개의 벤치마크와 6개의 다운스트림 태스크에 대한 광범위한 실험 결과, FedLAB은 고유한 시맨틱 추적 인터페이스 (semantic trace interface)를 유지하면서도 최첨단 (state-of-the-art) 베이스라인 대비 최대 7.53%의 성능 향상을 보여주었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기