arXiv논문2026. 05. 28. 12:38

진화하는 모델 허브에서의 지속적 모델 라우팅 (Continual Model Routing)

요약

모델 허브의 급격한 확장에 따른 확장성 및 업데이트 문제를 해결하기 위한 지속적 모델 라우팅(CMR) 개념을 제안합니다. 새로운 벤치마크인 CMRBench와 대조적 임베딩 방식인 CARvE를 통해 기존 베이스라인보다 우수한 성능을 입증했습니다.

핵심 포인트

모델 허브 확장에 따른 모델 선택 확장성 문제 제기
2,000개 이상의 모델을 포함하는 CMRBench 벤치마크 제안
CARvE: 체크포인트 앵커링 기반의 효율적인 라우팅 방식
제로샷 및 미세 조정 방식 대비 높은 정확도 달성

AI 모델 허브는 빠르게 성장하는 강력한 사전 학습된 모델(pre-trained models) 컬렉션에 대한 접근을 제공하며, 다양한 라우팅 전략을 가진 즉시 사용 가능한 전문가 혼합 (mixture-of-experts) 시스템을 가능하게 합니다. 그러나 이러한 급격한 성장은 두 가지 근본적인 과제를 제기합니다: 수천 명의 전문가(experts)에 걸친 모델 선택의 확장성 문제와, 새로운 모델 및 작업이 도입됨에 따라 라우팅 메커니즘을 지속적으로 업데이트해야 하는 문제입니다. 본 논문에서는 이 설정을 지속적 모델 라우팅 (Continual Model Routing, CMR)으로 공식화하고, 현실적인 허브 확장을 시뮬레이션하며 2,000개 이상의 후보 모델을 포함하는 새로운 대규모 벤치마크인 CMRBench를 제안합니다. 마지막으로, 체크포인트 기반 앵커링 (checkpoint-based anchoring) 및 구조적 재생 (structured replay)을 통해 효율적인 지속적 모델 라우팅을 수행하는 대조적 임베딩 (contrastive embedding) 접근 방식인 CARvE를 소개합니다. 광범위한 실증적 결과 및 절제 연구 (ablations)를 통해 CARvE가 모델, 제품군(family), 그리고 도메인 수준의 정확도 측면에서 제로샷 검색 (zero-shot retrieval), 미세 조정 (fine-tuning), 어댑터 병합 (adapter-merging) 베이스라인보다 크게 우수함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

진화하는 모델 허브에서의 지속적 모델 라우팅 (Continual Model Routing)

요약

핵심 포인트

댓글