오류 제어 역학을 통한 순환 모델의 상태 추적 재고찰

순환 아키텍처에서의 상태 추적 이론은 주로 표현 능력(expressive capacity)에 초점을 맞춰왔습니다. 즉, 고정된 아키텍처가 특정 심볼릭 전이 규칙(symbolic transition rules) 집합을 이론적으로 실현할 수 있는지 여부입니다. 우리는 이와 동등하게 중요한 것이 오류 제어(error control), 즉 심볼릭 상태를 구별하는 방향을 따라 숨겨진 상태 드리프트(hidden-state drift)를 지배하는 역학이라고 주장합니다. 우리는 State-Space Models과 Linear Attention을 포함하는 모델 클래스인 아핀 순환 네트워크(affine recurrent networks)가 상태 표현을 유지하는 순간, 상태 분리 부분 공간(state-separating subspaces)을 따라 오류를 수정할 수 없음을 증명합니다. 결과적으로, 실제 아핀 트래커는 강력한 상태 추적을 학습하지 못하며; 대신, 누적된 상태 관련 오류에 의해 지배되는 유한 범위 해법(finite horizon solutions)을 학습합니다. 우리는 이러한 실패의 역학을 특성화하여, 추적이 읽기 가능하게 유지되는 것은 축적되는 클래스 내 분산(within-class spread)이 초기 클래스 간 분리(between-class separation)에 비해 작을 때만임을 보여줍니다. 그룹 상태 추적 작업에서 경험적으로 시연한 결과, 이러한 붕괴는 예측 가능하다는 것을 보여줍니다: 구별 가능성 비율(distinguishability ratio)이 훈련된 디코더의 가독성 임계값(readability threshold)을 넘어서면 추적이 붕괴합니다. 훈련된 모델 전반에 걸쳐, 이 교차점은 다운스트림 정확도가 실패하는 지평(horizon)을 예측합니다. 이러한 결과는 강력한 상태 추적이 아키텍처의 이론적 표현 능력뿐만 아니라 결정적으로 오류 제어에 의해 결정됨을 확립합니다.

Insights

오류 제어 역학을 통한 순환 모델의 상태 추적 재고찰

요약

핵심 포인트

댓글

문맥 가중치를 적용한 이산 플로우 매칭 (Context-weighted Discrete Flow Matching)

토큰 예산 포화 및 Chain-of-Thought 모델의 추론 비수렴에 대한 기계론적 조기 탐지

높은 재현율(High-Recall) 후보 생성 단계의 유한 샘플 커버리지 감사: 인증 및 학습 이론적 설계

오류 국지화를 통한 테스트 시간 스케일링 (Test-Time Scaling via Error Localization)

문맥 가중치를 적용한 이산 플로우 매칭 (Context-weighted Discrete Flow Matching)

토큰 예산 포화 및 Chain-of-Thought 모델의 추론 비수렴에 대한 기계론적 조기 탐지

높은 재현율(High-Recall) 후보 생성 단계의 유한 샘플 커버리지 감사: 인증 및 학습 이론적 설계

오류 국지화를 통한 테스트 시간 스케일링 (Test-Time Scaling via Error Localization)