본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 08. 17:06

Agentic AIs Are the Missing Paradigm for Out-of-Distribution Generalization in

요약

기초 모델(FMs)은 오픈 월드 환경에서 배포되면서 분포 이동(OOD) 문제가 심화되고 있으며, 이는 기존의 모델 중심 패러다임으로는 해결할 수 없는 구조적 문제입니다. 본 논문은 OOD 문제를 해결하기 위한 새로운 접근법으로 에이전트 시스템을 제안하며, 이를 위해 네 가지 단계에 걸쳐 형식적인 증명과 분석을 제시합니다. 핵심 주장은 에이전트가 인식(Perception), 전략 선택(Strategy Selection), 외부 행동(External Action), 폐쇄 루프 검증(Closed-Loop Verification)이라는 구조적 특성을 통해 모델의 한계를 넘어설 수 있다는 것입니다.

핵심 포인트

  • 기초 모델(FMs)이 직면하는 OOD 문제는 기존 연구 설정과 달리 복잡하며, 단순한 개선만으로는 해결할 수 없다.
  • 모델 중심 방법은 파라미터 커버리지 한계에 의해 실용적으로 관련 있는 입력에 대해 처리 불가능한 영역을 내포한다.
  • OOD 문제를 해결하기 위한 새로운 패러다임으로 에이전트 시스템을 제안하며, 이는 인식, 전략 선택, 외부 행동, 폐쇄 루프 검증의 네 가지 구조적 특성을 갖는다.
  • 에이전트 방법은 모델 중심 방법을 대체하는 것이 아니라 상호 보완적이며, FM-OOD 연구는 에이전트 패러다임을 명시적으로 통합해야 한다.

Foundation models (FMs) 는 분포 이동이 예외가 아닌 규칙인 오픈 월드 설정에서 점점 더 많이 배포되고 있습니다. Foundation models (FMs) 가 직면한 out-of-distribution (OOD) 현상 -- 지식 경계, 능력 한계, 구성적 이동, 그리고 무제한 과제 변형 -- 은 이전 OOD 연구가 형성했던 설정과 종류가 다르며, 현대 FMs 의 사전 학습 및 후학습 분포는 종종 부분적으로만 관찰되기 때문에 더욱 복잡해집니다. 우리의 입장은 Foundation models 의 OOD 가 기존 모델 중심 패러다임 내에서 해결할 수 없는 구조적으로 다른 문제이며, 에이전트 시스템이 이를 해결하기 위해 필요한 결여된 패러다임이라는 것입니다. 우리는 네 가지 단계로 이 주장을 입증합니다. 첫째, 부분적으로 관찰된 다단계 학습 분포를 수용하는 OOD 의 단계를 인식한 형식화를 제공합니다. 둘째, 파라미터 커버리지 한계를 증명합니다: 모델 중심 방법 (학습 시간 또는 테스트 시간) 으로 허용 오차 $\ε$ 내에서 처리할 수 없는 실용적으로 관련 있는 입력이 존재하며, 이는 파라미터 기반 표현의 내재적 이유 때문입니다. 셋째, 에이전트 OOD 시스템을 네 가지 구조적 특성 -- 인식, 전략 선택, 외부 행동, 그리고 폐쇄 루프 검증 -- 으로 특징 짓고, 그들이 한계선을 넘어 도달 가능한 집합을 엄격하게 확장함을 보여줍니다. 넷째, 우리는 7 개의 반론에 응답하며, 두 가지는 양보하고 연구 계획을 개요를 제시합니다. 우리는 에이전트 방법이 모델 중심 방법을 포함한다고 주장하지 않습니다; 우리는 둘이 상호 보완적이며, FM-OOD 의 진보는 에이전트 패러다임을 일급 연구 방향으로서 명시적으로 인식해야 함을 주장합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0