본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 28. 12:38

진화하는 모델 허브에서의 지속적 모델 라우팅 (Continual Model Routing)

요약

모델 허브의 급격한 확장에 따른 확장성 및 업데이트 문제를 해결하기 위한 지속적 모델 라우팅(CMR) 개념을 제안합니다. 새로운 벤치마크인 CMRBench와 대조적 임베딩 방식인 CARvE를 통해 기존 베이스라인보다 우수한 성능을 입증했습니다.

핵심 포인트

  • 모델 허브 확장에 따른 모델 선택 확장성 문제 제기
  • 2,000개 이상의 모델을 포함하는 CMRBench 벤치마크 제안
  • CARvE: 체크포인트 앵커링 기반의 효율적인 라우팅 방식
  • 제로샷 및 미세 조정 방식 대비 높은 정확도 달성

AI 모델 허브는 빠르게 성장하는 강력한 사전 학습된 모델(pre-trained models) 컬렉션에 대한 접근을 제공하며, 다양한 라우팅 전략을 가진 즉시 사용 가능한 전문가 혼합 (mixture-of-experts) 시스템을 가능하게 합니다. 그러나 이러한 급격한 성장은 두 가지 근본적인 과제를 제기합니다: 수천 명의 전문가(experts)에 걸친 모델 선택의 확장성 문제와, 새로운 모델 및 작업이 도입됨에 따라 라우팅 메커니즘을 지속적으로 업데이트해야 하는 문제입니다. 본 논문에서는 이 설정을 지속적 모델 라우팅 (Continual Model Routing, CMR)으로 공식화하고, 현실적인 허브 확장을 시뮬레이션하며 2,000개 이상의 후보 모델을 포함하는 새로운 대규모 벤치마크인 CMRBench를 제안합니다. 마지막으로, 체크포인트 기반 앵커링 (checkpoint-based anchoring) 및 구조적 재생 (structured replay)을 통해 효율적인 지속적 모델 라우팅을 수행하는 대조적 임베딩 (contrastive embedding) 접근 방식인 CARvE를 소개합니다. 광범위한 실증적 결과 및 절제 연구 (ablations)를 통해 CARvE가 모델, 제품군(family), 그리고 도메인 수준의 정확도 측면에서 제로샷 검색 (zero-shot retrieval), 미세 조정 (fine-tuning), 어댑터 병합 (adapter-merging) 베이스라인보다 크게 우수함을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0