arXiv논문2026. 06. 24. 11:03

병렬 매니폴드 스티어링 (Parallel Manifold Steering): 잔차 에너지 성형 (Residual Energy Shaping)을

요약

Transformer 모델의 지식 검색 메커니즘을 개선하기 위해 활성화 매니폴드 상에서 에너지 경관을 조절하는 H-Res 기법을 제안합니다. 가중치 수정 없이도 토큰 궤적을 특정 작업으로 유도하여 가소성과 안정성 문제를 동시에 해결합니다.

핵심 포인트

H-Res는 가중치 수정 없이 유효 에너지 경관을 조절함
가소성-안정성 딜레마를 해결하며 파괴적 간섭을 방지함
연상 검색 작업에서 기존 방식 대비 26% 높은 성능 달성
어텐션 엔트로피 보존 및 뉴럴 콜랩스 촉진 증명

대규모 Transformer 모델은 셀프 어텐션 (self-attention) 메커니즘에 의해 구동되는 고차원 어트랙터 역학 (attractor dynamics)을 통해 지식을 검색하는 밀집 연상 메모리 (Dense Associative Memories, DAMs)로 기능합니다 \citep{ramsauer2020hopfield, wu2024attention}. 그러나 이러한 동결된 메모리 시스템을 새로운 작업에 적응시키는 것은 근본적인 "가소성-안정성 (Plasticity-Stability)" 딜레마를 야기합니다. 현재의 방법들은 시냅스 가중치를 직접 수정함으로써 (예: LoRA) \citep{hu2021lora} 파괴적 간섭 (catastrophic interference)의 위험을 감수하거나, 정적 프롬프트 토큰으로 검색 버퍼를 막음으로써 (예: VPT) \citep{jia2022vpt} 연상 용량을 저하시킵니다. 본 연구에서는 Transformer의 전역 평형 (global equilibrium)을 변경하거나 시퀀스 길이를 확장하지 않고도 유효 에너지 경관 (effective energy landscape)을 조절하는 메커니즘인 \textbf{H-Res} (Hierarchical Residual Steering, 계층적 잔차 스티어링)를 제안합니다. 적응을 활성화 매니폴드 (activation manifold) 상의 제어 문제로 공식화함으로써 \citep{chen2018neuralode}, H-Res는 토큰 궤적을 작업별 인력권 (basins of attraction)으로 유도하는 상태 의존적 벡터장 (state-dependent vector field)을 학습합니다. 우리는 H-Res가 파운데이션 모델 (foundation model)의 어텐션 엔트로피 (attention entropy)를 보존하고 뉴럴 콜랩스 (Neural Collapse)를 촉진함을 공식적으로 증명합니다 \citep{papyan2020prevalence}. 실증적으로, 매니폴드 스티어링 (Manifold Steering)은 연상 검색 작업에서 전역 가중치 수정 방식보다 26% 높은 성능을 보였으며, 프롬프트 기반 방식의 계산 오버헤드를 제거하여 구조화된 도메인으로 효과적으로 확장됩니다 \citep{zha2023vtab}.

AI 자동 생성 콘텐츠

원문 바로가기

병렬 매니폴드 스티어링 (Parallel Manifold Steering): 잔차 에너지 성형 (Residual Energy Shaping)을

요약

핵심 포인트

댓글