arXiv논문2026. 06. 30. 12:15

에이전시 탐지에서 작업 수행으로: 자기 유발 크레딧(Self-Caused Credit)이 최소 스파이킹 에이전트 내에서 지속 가능한 행동적

요약

에이전트가 자신의 에이전시를 탐지하는 것을 넘어, '자기 유발 크레딧(Self-Caused Credit)'을 통해 지속 가능한 행동 자아를 형성하는 메커니즘을 연구했습니다. 스파이킹 신경망 환경에서 느린 파라미터 업데이트가 에피소드 버퍼 제거 후에도 행동 잔류물을 유지함을 입증했습니다.

핵심 포인트

자기 유발 크레딧이 느린 작업을 수행할 때 지속적인 행동 자아가 발달함
에피소드 버퍼나 리플레이 메커니즘 없이도 행동 잔류물 유지 가능
스파이킹 기질(Nengo LIF/PES) 상에서 자기 보존적 선택의 생존 확인
곱셈적 거부(multiplicative veto)를 통한 망각 방지 효과 입증

자신과 세계를 구분할 수 있는 에이전트가 어떻게 그 구분에 의해 지속적으로 형성될 수 있을까요? 최근 연구는 예측 시스템이 자신의 에이전시 (Agency)를 탐지할 수 있음을 보여주었으나 (Ye, 2026), 에이전시를 탐지하는 것만으로는 지속적이고 스스로 형성된 행동을 설명할 수 없습니다. 본 연구에서는 에이전시 게이트형 느린 크레딧 (agency-gated slow credit) — 즉, 느린 파라미터 업데이트를 유도하는 결합 용어인 OwnAgencySalience — 이 언로드(unload) 이후의 행동 잔류물 (behavioral residue)을 생성함을 보여줍니다. 스파이킹 기질 (spiking substrate, Nengo LIF/PES) 상에서, 학습된 자기 보존적 선택은 에피소드 버퍼(episodic buffer)가 제거된 후에도 생존하며 (유지 비율 0.96, N=50), 느린 디코더(slow decoders)가 리셋되거나 에이전시 게이트가 제거될 때 붕괴됩니다. 에이전시 비교기(agency comparator)를 재현하고 느린 크레딧 채널만을 토글했을 때, 우리는 명확한 분리(dissociation)를 발견했습니다: 동일한 에이전시 이득(agency gain) 조건에서, 지속적인 행동은 자기 크레딧(self-credit)이 느린 작업(slow work)을 수행할 때만 발달합니다 (언로드 후 자기 보존율 1.00 vs 0.00). 동일한 분리 현상은 24차원 부분 관측 제어 (24-dimensional partially-observed control) 환경에서도 유지되며 (0.74 vs 0.00), 가소적 작업 분석 (plastic-work analysis)은 베이슨 변형 (basin deformation)이 순 자기 크레딧 작업과 같음을 보여줍니다. 외생적 간섭 하에 순차적으로 학습된 8가지 작업 전반에서, 곱셈적 거부 (multiplicative veto) 또한 망각을 방지합니다: 이는 가산적 풀링 (additive pooling)이 우연 수준의 회상으로 붕괴되고, 에이전시 부재 제거 실험 (no-agency ablation)이 우연 수준 미만으로 떨어지며, 에피소드/리플레이 (episodic/replay) 베이스라인이 언로드 후 우연 수준 근처에 머무는 것과 달리, 기존 작업들을 유지합니다 (최종 언로드 후 정확도 0.88, 망각 0.13). 이 모든 과정은 리플레이 버퍼(replay buffer)와 작업 경계 의존적 보호 메커니즘 없이 수행되었습니다 (N=50). 우리는 이 지속적인 잔류물을 운영적 행동 자아 (operational behavioral self)로 공식화하며, 자기 유발 크레딧이 느린 작업을 수행하는 것이 자아를 발달시키는 에이전트의 필수적인 구성 요소라고 주장합니다. 의식에 대한 주장은 포함되지 않았습니다.

AI 자동 생성 콘텐츠

원문 바로가기

에이전시 탐지에서 작업 수행으로: 자기 유발 크레딧(Self-Caused Credit)이 최소 스파이킹 에이전트 내에서 지속 가능한 행동적

요약

핵심 포인트

댓글