Harness 이후, 다음 에이전트 유행어는 Persistence가 될 것이다

요약

에이전트 기술의 패러다임이 모델 주변 환경을 정의하는 'Harness'에서 상태를 유지하는 'Persistence(지속성)'로 이동하고 있습니다. 에이전트가 시간과 실패, 환경 변화 속에서도 작업을 지속하기 위해 필요한 상태 관리와 메모리 설계의 중요성을 다룹니다.

핵심 포인트

에이전트의 핵심은 추론을 넘어 상태 관리(State management)로 진화 중
Persistence는 메모리, 체크포인트, 내구적 실행 등 다양한 형태로 구현됨
LangGraph, OpenAI Agents SDK 등 주요 도구들이 이미 이 방향을 지향
단순 메모리 저장을 넘어 제어된 지속성(Controlled persistence)이 핵심 과제

에이전트(Agent) 세계는 기존의 언어가 새로운 동작의 무게를 담아내지 못할 때 새로운 단어를 사랑합니다. Harness가 유용해진 이유는 모델 주변의 레이어(layer)를 명명했기 때문입니다. 도구(Tools), 메모리(Memory), 권한(Permissions), 샌드박스(Sandboxes), 재시도(Retries), 평가(Evaluations), 컨텍스트 조립(Context assembly), 그리고 관찰 가능성(Observability)이 갑자기 하나의 정신적 객체로 묶였습니다. 이 단어는 프롬프트(Prompt)를 가진 모델은 단지 추론 핵심(Reasoning core)일 뿐이라는 점을 팀들이 인식하도록 도왔습니다. 유용한 에이전트에는 작동 환경이 필요합니다.

다음 단어는 아마도 Persistence(지속성)를 중심으로 형성될 것입니다. 이는 에이전트 메모리(Agent memory), 내구성이 있는 컨텍스트(Durable context), 연속적인 워크스페이스(Continuous workspace), 수명 공학(Lifespan engineering), 작업 원장(Task ledger), 또는 상태 유지 런타임(Stateful runtime) 등의 형태로 등장할 수 있습니다. 패키징 방식은 벤더(Vendor)마다 다르겠지만, 근본적인 질문은 단순합니다. 에이전트가 시간, 실패, 사람, 장치, 승인, 그리고 변화하는 정보 속에서도 유용한 작업을 계속 수행할 수 있는가 하는 점입니다.

Harness가 모델을 둘러싼 것이 무엇인지에 답했다면, Persistence는 첫 번째 인상적인 데모 이후에 무엇이 살아남는지를 묻습니다. 진지한 에이전트는 목표, 결정, 제약 조건, 산출물(Artifacts), 파일 위치, 사용자 선호도, 도구 결과, 비용 이력, 승인 상태, 그리고 작업의 현재 형태를 기억해야 합니다. 또한 서버 재시작, 사용자의 중단, 실패한 API 호출, 또는 일주일간의 침묵 이후에도 작업을 재개할 수 있어야 합니다.

이것이 시장이 이미 이 방향으로 움직이고 있는 이유입니다. LangGraph는 체크포인트(Checkpoints)를 그래프 상태(Graph state)의 중심으로 만듭니다. OpenAI Agents SDK 세션은 에이전트 실행 전반에 걸쳐 대화 기록을 유지합니다. Google Agent Platform은 연속적인 대화와 장기 기억을 위해 세션과 메모리 뱅크(Memory Bank)를 결합합니다. Temporal은 실패 후 복구하고 계속 진행해야 하는 워크플로우(Workflows)의 중추로서 내구성이 있는 실행(Durable execution)을 제공합니다. 서로 다른 제품 이름들이 동일한 압박을 가리키고 있습니다. 에이전트는 추론만큼이나 상태 관리(State management)가 필요한 시스템이 되어가고 있습니다.

이것이 바로 지속성 (Persistence)이 여러 번 재포장될 수밖에 없는 이유이기도 합니다. '메모리 (Memory)'는 개인적인 느낌을 줍니다. '체크포인트 (Checkpoints)'는 기술적인 느낌을 줍니다. '내구적 실행 (Durable execution)'은 인프라적인 느낌을 줍니다. '컨텍스트 내구성 (Context durability)'은 기업 친화적인 느낌을 줍니다. '에이전트 워크스페이스 (Agent workspace)'는 협업적인 느낌을 줍니다. 각 용어는 서로 다른 구매자와 서로 다른 불안 요소를 강조합니다. 개발자는 충돌 (Crash)을 걱정합니다. 관리자는 감사 가능성 (Auditability)을 걱정합니다. 사용자는 에이전트가 이미 설명한 내용을 잊어버릴까 봐 걱정합니다. 보안 팀은 에이전트가 잘못된 것을 영원히 기억할까 봐 걱정합니다.

어려운 부분은 제어된 지속성 (Controlled persistence)입니다. 단순한 메모리 계층은 오래된 사실, 개인적인 세부 정보, 잘못된 지침, 그리고 우연한 상관관계를 보존할 수 있습니다. 장기적 에이전트 (Long horizon agents)에 대한 연구는 이미 메모리가 규율 없이 커질 때 발생하는 드리프트 (Drift), 노이즈가 섞인 회상 (Noisy recall), 그리고 노후화 효과 (Aging effects)를 지적하고 있습니다. 가치 있는 버전의 지속성에는 경계가 필요합니다. 메모리 검토 (Memory review), 만료 (Expiry), 권한 (Permissions), 출처 (Provenance), 체크포인트 (Checkpoints), 롤백 (Rollback), 압축된 요약 (Compact summaries), 그리고 단일 실행이 아닌 수주에 걸친 신뢰성을 측정하는 평가 (Evaluations)가 필요합니다.

창작자와 연구자들에게 실질적인 워크플로우는 상상하기 쉽습니다. ChatGPT는 연구 질문을 구성하고 흩어진 노트를 계획으로 바꾸는 데 도움을 줄 수 있습니다. Gemini는 소스 검토 중에 두 번째 추론 관점을 추가할 수 있습니다. Miss Formula는 기술 자료가 초안으로 넘어갈 때 수식 스크린샷을 사용 가능한 수식으로 변환할 수 있습니다. Editable Figure는 AI가 생성한 논문 그림을 수정을 위한 편집 가능한 벡터 그래픽으로 변환할 수 있습니다. 지속적인 에이전트는 어떤 방정식이 어떤 출처에서 왔는지, 어떤 그림 버전이 승인되었는지, 그리고 어떤 주장이 여전히 확인이 필요한지를 기억해야 합니다.

Harness 이후, 벤더들은 연속성 (Continuity)을 판매하게 될 것입니다. 승리하는 에이전트 스택은 메모리 프로필 (Memory profiles), 이벤트 로그 (Event logs), 권한 게이트 (Permission gates), 재개 가능한 실행 (Resumable execution), 아티팩트 이력 (Artifact history), 그리고 복구 경로 (Recovery paths)를 갖춘 내구성 있는 워크스페이스 (Durable workspace)로서 자신을 제시할 것입니다. 자율성 (Autonomy)은 여전히 매력적이겠지만, 에이전트가 일상적인 인프라 (Infrastructure)가 될 수 있을지 여부는 연속성 (Continuity)이 결정할 것입니다. 중요한 에이전트는 계속하기 위해 충분히 기억하고, 안전을 유지하기 위해 충분히 잊으며, 인간이 그 작업을 신뢰할 수 있도록 충분한 흔적을 남길 것입니다.

AI 자동 생성 콘텐츠

원문 바로가기

Harness 이후, 다음 에이전트 유행어는 Persistence가 될 것이다

요약

핵심 포인트

댓글