arXiv논문2026. 06. 24. 11:10

에이전트 모델에 대한 비판

요약

본 논문은 AI 에이전트의 진정한 에이전시(agency)를 정의하고, 단순 자동화를 넘어선 내재적 능력을 갖춘 시스템의 필요성을 논합니다. 목표, 정체성, 의사결정 등 5가지 차원을 바탕으로 새로운 GIC 아키텍처를 제안합니다.

핵심 포인트

에이전트적(agentic) 시스템과 에이전티브(agentive) 시스템의 구분
진정한 에이전시는 외부 스캐폴딩이 아닌 시스템 내재화가 필요함
GIC(Goal-Identity-Configurator) 아키텍처 제안
자율적 에이전트의 감사 가능성, 제어 가능성, 안전성 확보 방안 논의

에이전트란 무엇인가? 무엇이 에이전시(agency)를 구성하는가? 생산성을 높여줄 것으로 기대되는 "코딩 에이전트(coding agents)", "AI 공동 과학자(AI co-scientists)" 및 기타 "에이전트적(agentic)" 도구로 마케팅되는 거대 언어 모델 (LLM) 시스템의 부상과 동시에, 추측에 기반한 "기계적 에이전시(machine agency)"가 인간에 대항하여 파괴적인 힘을 가지고 인간의 통제를 벗어날 수 있다는 "실존적(existential)" 우려가 제기됨에 따라, 유능한 시스템을 구축하고 무엇을 두려워해야 하는지 이해하기 위해 자동화가 어디서 끝나고 에이전시가 어디서 시작되는지를 명확히 하는 것이 필수적이 되었습니다. 데카르트(Descartes)가 독립적인 사고에 에이전시의 근거를 둔 점과 공상 과학 소설 속 자율적 존재들의 묘사를 바탕으로, 우리는 현재의 AI 에이전트 지형을 조사하고 목표(goal), 정체성(identity), 의사결정(decision-making), 자기 조절(self-regulation), 학습(learning)의 다섯 가지 차원에 따라 에이전트 아키텍처를 분석합니다. 구체적으로, 우리는 진정한 에이전시가 외부의 스캐폴딩(scaffolding)을 통해 조립되는 것이 아니라, 이러한 구조들이 extit{시스템 자체 내에 내재화(internalized within the system itself)}될 것을 요구한다고 주장합니다. 역량이 설계된 워크플로(workflow)에 거주하는 extit{에이전트적(agentic)} 시스템과, (사회적 상호작용을 포함한) 능력이 내생적으로 발생하는 extit{에이전트적(agentive)} 시스템 사이의 이러한 구분은, 규정된 작업을 위해 설계된 시스템과 진정한 자율성을 가지고 개방된 세계에서 작동할 수 있는 시스템 사이의 경계를 정의합니다. 이 분석을 바탕으로, 우리는 계층적 목표 분해(hierarchical goal decomposition), 정체성 진화(identity evolution), 별도로 학습된 세계 모델(world model)에 기반한 시뮬레이션 추론(simulative reasoning), 학습된 자기 조절(learned self-regulation), 그리고 실제 및 시뮬레이션 경험 모두로부터의 자기 주도적 학습(self-directed learning)을 결합한 범용 에이전트 모델을 위한 목표-정체성-구성기(Goal-Identity-Configurator, GIC) 아키텍처를 제안합니다. 나아가, 더 큰 자율성과 "에이전시(agency)"를 보유하면서도 인간의 감독 하에 남아 있는 에이전트적(agentive) 시스템의 감사 가능성(auditability), 제어 가능성(controllability), 그리고 안전성(safety)에 대한 통찰을 공유합니다.

AI 자동 생성 콘텐츠

원문 바로가기

에이전트 모델에 대한 비판

요약

핵심 포인트

댓글