관점: 실제 세계의 자기회귀적 Transformer의 튜링 완전성(Turing-Completeness)은 컨텍스트 관리(Context

많은 연구가 Transformer가 튜링 완전(Turing-complete)하다는 눈길을 끄는 주장을 펼칩니다. 그러나 기존 문헌은 종종 두 가지 서로 다른 설정(setting)을 혼동합니다: (i) 고정된 Transformer 시스템 설정으로, 고정된 자기회귀적(autoregressive) Transformer가 다양한 길이의 입력을 단계별로 처리하기 위해 고정된 컨텍스트 관리(context-management) 방식과 결합된 경우, 그리고 (ii) 스케일링 패밀리(scaling-family) 설정으로, 서로 다른 입력 길이를 처리하기 위해 (컨텍스트 윈도우(context-window) 길이 또는 수치 정밀도(numerical precision)가 증가하는) 다양한 모델군이 사용되는 경우입니다. Transformer의 튜링 완전성에 대한 기존 증명들은 빈번하게 설정 (ii)에서 확립되는 반면, 실제 LLM 배포 및 튜링 완전성의 표준 개념은 설정 (i)에 더 자연스럽게 부합합니다. 본 논문에서 우리는 먼저 고정 시스템(fixed-system) 설정을 공식화하여, 이를 통해 실제 LLM이 어떻게 작동하는지에 대한 구체적인 특성을 제공합니다. 그다음 우리는 스케일링 패밀리 설정에서 증명된 결과들이 이론적으로 의미 있는 자원 경계(resource bounds)를 제공하기는 하지만 튜링 완전성을 확립하지는 못한다는 점을 주장하며, 이를 통해 기존 결과들에 대한 흔한 오해를 바로잡습니다. 마지막으로, 우리는 서로 다른 컨텍스트 관리 방식이 매우 판이한 계산 능력(computational power)을 낼 수 있음을 보여주며, 컨텍스트 관리가 실제 세계의 자기회귀적 Transformer의 계산 능력을 결정적으로 결정하는 핵심 구성 요소라는 입장을 옹호합니다.

Insights

관점: 실제 세계의 자기회귀적 Transformer의 튜링 완전성(Turing-Completeness)은 컨텍스트 관리(Context

요약

핵심 포인트

댓글

Solidity 컴파일러의 오컴파일 버그 탐지 및 이해

ORCAID: 연속 액션 공간을 위한 사선 규칙 기반 해석 정책 (Oblique Rule-Based Continuous-Action

Show GN: Lucene search core 기여 팀이 만든 Local-first AI Memory Workspace, Maek

Solidity 컴파일러의 오컴파일 버그 탐지 및 이해

ORCAID: 연속 액션 공간을 위한 사선 규칙 기반 해석 정책 (Oblique Rule-Based Continuous-Action

Show GN: Lucene search core 기여 팀이 만든 Local-first AI Memory Workspace, Maek