에이전트 모델에 대한 비판
요약
본 논문은 AI 에이전트의 진정한 에이전시(agency)를 정의하고, 단순 자동화를 넘어선 내재적 능력을 갖춘 시스템의 필요성을 논합니다. 목표, 정체성, 의사결정 등 5가지 차원을 바탕으로 새로운 GIC 아키텍처를 제안합니다.
핵심 포인트
- 에이전트적(agentic) 시스템과 에이전티브(agentive) 시스템의 구분
- 진정한 에이전시는 외부 스캐폴딩이 아닌 시스템 내재화가 필요함
- GIC(Goal-Identity-Configurator) 아키텍처 제안
- 자율적 에이전트의 감사 가능성, 제어 가능성, 안전성 확보 방안 논의
에이전트란 무엇인가? 무엇이 에이전시(agency)를 구성하는가? 생산성을 높여줄 것으로 기대되는 "코딩 에이전트(coding agents)", "AI 공동 과학자(AI co-scientists)" 및 기타 "에이전트적(agentic)" 도구로 마케팅되는 거대 언어 모델 (LLM) 시스템의 부상과 동시에, 추측에 기반한 "기계적 에이전시(machine agency)"가 인간에 대항하여 파괴적인 힘을 가지고 인간의 통제를 벗어날 수 있다는 "실존적(existential)" 우려가 제기됨에 따라, 유능한 시스템을 구축하고 무엇을 두려워해야 하는지 이해하기 위해 자동화가 어디서 끝나고 에이전시가 어디서 시작되는지를 명확히 하는 것이 필수적이 되었습니다. 데카르트(Descartes)가 독립적인 사고에 에이전시의 근거를 둔 점과 공상 과학 소설 속 자율적 존재들의 묘사를 바탕으로, 우리는 현재의 AI 에이전트 지형을 조사하고 목표(goal), 정체성(identity), 의사결정(decision-making), 자기 조절(self-regulation), 학습(learning)의 다섯 가지 차원에 따라 에이전트 아키텍처를 분석합니다. 구체적으로, 우리는 진정한 에이전시가 외부의 스캐폴딩(scaffolding)을 통해 조립되는 것이 아니라, 이러한 구조들이 extit{시스템 자체 내에 내재화(internalized within the system itself)}될 것을 요구한다고 주장합니다. 역량이 설계된 워크플로(workflow)에 거주하는 extit{에이전트적(agentic)} 시스템과, (사회적 상호작용을 포함한) 능력이 내생적으로 발생하는 extit{에이전트적(agentive)} 시스템 사이의 이러한 구분은, 규정된 작업을 위해 설계된 시스템과 진정한 자율성을 가지고 개방된 세계에서 작동할 수 있는 시스템 사이의 경계를 정의합니다. 이 분석을 바탕으로, 우리는 계층적 목표 분해(hierarchical goal decomposition), 정체성 진화(identity evolution), 별도로 학습된 세계 모델(world model)에 기반한 시뮬레이션 추론(simulative reasoning), 학습된 자기 조절(learned self-regulation), 그리고 실제 및 시뮬레이션 경험 모두로부터의 자기 주도적 학습(self-directed learning)을 결합한 범용 에이전트 모델을 위한 목표-정체성-구성기(Goal-Identity-Configurator, GIC) 아키텍처를 제안합니다. 나아가, 더 큰 자율성과 "에이전시(agency)"를 보유하면서도 인간의 감독 하에 남아 있는 에이전트적(agentive) 시스템의 감사 가능성(auditability), 제어 가능성(controllability), 그리고 안전성(safety)에 대한 통찰을 공유합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기