트랜스포머의 이중적 추론 모드가 작업 벡터 기하학을 기반으로 함

트랜스포머는 컨텍스트를 통해 학습 과정에서 본 작업인지, 새로운 작업에 적응하는지 두 가지 추론 모드로 잠재 작업을 추론할 수 있습니다. 최근 해석 가능성 연구들은 모델의 중간 레퍼런스를 통해 특정 작업에 대한 방향성 (task-specific directions) 또는 작업 벡터 (task vectors) 를 식별했습니다. 그러나 내부 표현을 외부 모델 행동과 연결하는 데는 엄밀한 기초가 부족하여 기존 작업은 학습 분포에 의해 작업 벡터 기하학이 어떻게 형성되는지를 설명하지 못하며, 분포 밖 (Out-of-Distribution, OOD) 일반화가 어떤 기하학을 가능하게 하는지 알 수 없습니다. 본 논문에서는 작은 트랜스포머를 잠재 작업 시퀀스 분포에서부터 훈련하여 통제된 합성 환경에서 이러한 질문을 연구합니다. 이는 원칙적인 수학적 특성을 부여할 수 있습니다. 우리는 단일 모델 내에서 두 추론 모드가 공존할 수 있음을 보여줍니다. 분포 내 (In-Distribution) 행동은 학습된 작업 벡터의 볼록 결합 (convex combinations) 을 통해 내부적으로 구현된 베이즈적 작업 검색 (Bayesian task retrieval) 으로 지배됩니다. 반면, 분포 밖 (Out-of-Distribution, OOD) 행동은 작업 벡터 공간에 거의 직교하는 서브스페이스를 차지하는 추측성 작업 학습 (extrapolative task learning) 을 통해 발생합니다. 종합적으로, 우리의 결과는 작업 벡터 기하학, 훈련 분포, 일반화 행동이 밀접하게 관련되어 있음을 시사합니다.

Insights

트랜스포머의 이중적 추론 모드가 작업 벡터 기하학을 기반으로 함

요약

핵심 포인트

댓글

GPT-5.6 완전 가이드: Sol, Terra, Luna의 성능, 가격 및 사용 권장 사항

T. Rowe Price의 Love, 소형주 수익성이 개선되고 있다고 말하다

운영 환경에서 OpenRouter 실행하기: 무엇이 고장 나고, 무엇이 작동하며, 내가 다르게 할 일들

또 다른 암호화폐 기업이 비트코인 보유량을 매각하다

GPT-5.6 완전 가이드: Sol, Terra, Luna의 성능, 가격 및 사용 권장 사항

T. Rowe Price의 Love, 소형주 수익성이 개선되고 있다고 말하다

운영 환경에서 OpenRouter 실행하기: 무엇이 고장 나고, 무엇이 작동하며, 내가 다르게 할 일들

또 다른 암호화폐 기업이 비트코인 보유량을 매각하다