Claude Code의 서브에이전트(Subagents)는 속도를 위한 기술이 아니라 메모리를 위한 기술입니다

대부분의 서브에이전트(subagent) 관련 게시물들은 병렬성(parallelism)을 강조합니다. 즉, 5개의 에이전트를 동시에 실행하여 답변을 5배 더 빠르게 얻는다는 식이죠. 그것도 사실이지만, 그것이 서브에이전트가 중요한 진짜 이유는 아닙니다. 한동안 이를 사용해 본 결과, 저는 이러한 프레임워크가 사람들을 적극적으로 오도하고 있다고 생각합니다.

서브에이전트가 실제로 당신에게 제공하는 것은 깨끗한 메인 컨텍스트(main context)입니다.

Anthropic의 공식 문서에서도 이를 명확히 설명합니다. 서브에이전트는 "자신의 컨텍스트에서 작업을 수행하고 요약본만 반환합니다." 각 서브에이전트는 자신만의 시스템 프롬프트(system prompt), 도구(tools), 권한(permissions)을 가진 독립된 컨텍스트 윈도우(context window)에서 실행됩니다. 사이드 퀘스트(side quest)에서 발생하는 모든 노이즈(12번의 파일 읽기, 성과 없는 grep 실행, 한 번 훑어본 400줄짜리 로그 등)는 서브에이전트의 윈도우 안에 갇혀 있게 됩니다. 당신의 메인 대화에는 오직 결론만이 전달됩니다.

이것이 긴 세션(long session)에서 핵심적인 게임의 법칙입니다. 메인 에이전트는 조사 과정에서 마주친 모든 막다른 길에 대한 증거들을 떠안지 않기 때문에 예리함을 유지할 수 있습니다.

6월 10일 릴리스(2.1.172)를 통해 이것이 구성 가능(composable)해졌습니다. 이제 서브에이전트는 최대 5단계 깊이까지 자체적인 서브에이전트를 생성할 수 있습니다. 이전에는 서브에이전트가 말단(leaf)이었지만, 이제는 "이것을 디버그해"라는 에이전트가 "이 호출 경로를 추적해"라는 작업자를 별도로 생성하여 단 한 문장의 결과만 받아온 뒤 계속 진행할 수 있으며, 이 과정 중 어느 것도 당신의 메인 스레드(main thread)에 도달하지 않습니다.

하지만 아무도 언급하지 않는 부분이 있습니다. 격리(Isolation)는 양날의 검이라는 점입니다.

상위 레벨로 노이즈가 유입되는 것을 막기 위해 세운 모든 벽은 컨텍스트(context)의 유입도 막습니다. 3단계 아래에 있는 서브에이전트는 당신이 메인 세션에서 말한 내용을 다시 전달해주지 않는 한 알지 못합니다. 따라서 계층을 깊게 만들수록, 최상단에서 이미 가지고 있던 컨텍스트를 재설정하기 위해 더 많은 비용을 지불해야 합니다. 저는 말단 에이전트가 제가 처음에 평이한 영어로 명시했던 제약 조건을 전혀 알지 못해서, 조사가 자신 있게 틀린 결론을 내놓는 것을 목격한 적이 있습니다.

따라서 실제 기술은 "더 많은 에이전트를 생성하는 것"이 아닙니다. 작업마다 다음 두 가지 중 무엇이 필요한지 결정하는 것입니다:

작업이 노이즈가 많고 결론이 작을 때는 격리(Isolate)하십시오. 검색, 버그 재현, 단 하나의 사실을 추출하기 위해 거대한 파일을 읽는 작업 등이 이에 해당합니다. 당신이 원하는 것은 과정이 아니라 결과입니다.

이미 구축한 모든 정보가 필요하거나, 상호작용(back-and-forth) 과정 자체가 가치를 지닐 때는 메인 스레드(main thread)에서 작업을 유지하세요. 설계 결정(Design decisions)이나, 다음 단계가 이전 단계의 맥락(texture)에 의존하는 모든 경우가 이에 해당합니다.

중첩된 서브에이전트(Nested subagents)는 Claude를 더 빠르게 만들어준 것이 아닙니다. 대신 메인 에이전트가 무엇을 잊어도 되는지를 조절할 수 있는 노브(knob)를 제공한 것입니다. 서브에이전트를 능숙하게 다루는 법의 대부분은 바로 이 노브를 언제 돌려야 할지를 배우는 과정입니다.

요약(TL;DR): Claude Code 서브에이전트의 가치는 병렬적인 속도가 아니라 컨텍스트 격리(context isolation)에 있습니다. 서브에이전트는 자신만의 컨텍스트 윈도우(context window)에서 소음이 많은 작업(noisy work)을 수행하고 결론만을 전달하므로, 당신의 메인 세션은 깨끗하게 유지됩니다. 중첩된 서브에이전트(6월 10일 출시, 최대 5단계 깊이)는 이를 구성 가능(composable)하게 만들지만, 격리 단계가 깊어질수록 상위 단계로부터 컨텍스트를 숨기게 됩니다. 핵심 기술은 무엇을 격리할지, 그리고 무엇을 메인 스레드가 유지해야 할지를 결정하는 것입니다.

열린 질문: 깊은 서브에이전트 체인을 실행하는 분들에게 묻습니다. 도움이 되지 않게 되는 시점은 몇 단계부터인가요? 저는 컨텍스트를 재구축하는 비용이 이득을 갉아먹기 전인 2~3단계 정도에서 멈추게 됩니다. 헤비한 리서치나 리팩터링(refactor) 워크플로우를 수행하는 분들이 실제로 그 이상의 단계에서 가치를 얻는지 궁금합니다.

출처: Claude Code subagents docs · Claude Code changelog (v2.1.172, 2026년 6월 10일)
제출자: /u/bit_forge007
[link] [comments]

Insights

Claude Code의 서브에이전트(Subagents)는 속도를 위한 기술이 아니라 메모리를 위한 기술입니다

요약

핵심 포인트

댓글

Olix, 33억 달러 기업 가치로 유럽 최대 규모의 칩 투자 유치

TotalEnergies, Shell 및 KKR과 유럽 재생 에너지 계약 체결

KKR, 역대 최대 규모 인프라 펀드 조성 위해 192억 달러 조달

파일럿 에이전트(Pilot Agent)란 무엇인가? 브라우저, 기계, 워크플로우를 제어하는 AI 에이전트 클래스

Olix, 33억 달러 기업 가치로 유럽 최대 규모의 칩 투자 유치

TotalEnergies, Shell 및 KKR과 유럽 재생 에너지 계약 체결

KKR, 역대 최대 규모 인프라 펀드 조성 위해 192억 달러 조달

파일럿 에이전트(Pilot Agent)란 무엇인가? 브라우저, 기계, 워크플로우를 제어하는 AI 에이전트 클래스