Claude Code /goal: Haiku Evaluator를 사용하여 조건 충족 시까지 무인 실행

요약

Claude Code의 업데이트를 통해 도입된 /goal 명령은 Haiku Evaluator를 활용하여 설정된 조건이 충족될 때까지 코딩 에이전트를 무인으로 실행합니다. Agent View와 결합하여 여러 백그라운드 세션을 효율적으로 관리하며, 사용자의 지속적인 감독 없이도 목표를 달성할 수 있는 멀티 세션 워크플로우를 제공합니다.

핵심 포인트

Haiku 모델을 Evaluator로 사용하여 세션 텍스트를 기반으로 목표 달성 여부를 판단함
Agent View를 통해 Running, Blocked, Done 상태의 멀티 세션을 CLI에서 관리 가능
측정 가능한 종료 상태와 확인 방법을 포함한 명확한 조건 설정이 필수적임
토큰 과다 소비 방지를 위해 턴 제한(예: 20턴 후 중단) 설정을 권장함
v2.1.139 이상의 Claude Code 버전이 필요함

Claude Code /goal은 Haiku Evaluator를 사용하여 조건이 충족될 때까지 무인(unattended)으로 실행됩니다. Agent View는 여러 개의 백그라운드 세션을 관리합니다. v2.1.139 버전이 필요합니다. Claude Code의 2026년 5월 업데이트에서는 무인 멀티 세션 워크플로우를 위한 /goal 및 Agent View가 도입되었습니다. /goal Evaluator는 기본적으로 Haiku를 사용하며, 완료 여부를 확인하기 위해 세션 텍스트만 읽습니다.

주요 사실:

Claude Code v2.1.139 이상 필요
Evaluator는 기본적으로 Haiku 모델 사용
조건 제한: 4,000자
Agent View는 Running, Blocked, Done 세션을 나열함
Agent View는 Pro, Max, Team, Enterprise, API에서 제공

Claude Code의 2026년 5월 업데이트는 지속적인 감독 없이 터미널 기반 코딩 에이전트(coding agent)를 실행할 수 있는 두 가지 기능인 /goal 명령과 Agent View를 추가했습니다. 이들은 서로 분리되어 있지만 상호 보완적이며, 무인 멀티 세션 워크플로우를 가능하게 합니다. [출처에 따르면]

핵심 요약:
Claude Code /goal은 Haiku Evaluator를 사용하여 조건이 충족될 때까지 무인으로 실행됩니다. Agent View는 여러 백그라운드 세션을 관리합니다.

/goal 작동 방식:
사용자는 단일 완료 조건(completion condition)을 작성합니다. 예를 들어, /goal test/auth에 있는 모든 테스트가 통과하고 lint 단계가 깨끗할 것과 같이 작성합니다. 매 턴(turn)이 끝날 때마다 Claude Code는 중단하는 대신, 별도의 Evaluator 모델에게 해당 조건이 참인지 묻습니다. 만약 거짓이라면, 그 이유를 가이드로 삼아 다음 턴을 진행합니다. 만약 참이라면, 목표(goal)가 해제되고 터미널로 돌아옵니다. v2.1.139 이상이 필요합니다. [출처에 따르면]

대부분의 게시물이 생략하는 세부 사항: Evaluator는 작고 빠른 모델(기본적으로 Haiku)입니다. 이 모델은 명령을 실행하거나 파일을 열지 않습니다. 오직 세션에 이미 존재하는 텍스트만을 판단합니다. 따라서 조건은 Claude가 출력하는 내용을 통해 증명할 수 있는 것이어야 합니다. "test/auth의 모든 테스트 통과"는 테스트 결과가 트랜스크립트(transcript)에 남기 때문에 작동합니다. 반면 "코드가 좋다"와 같은 조건은 절대 작동하지 않을 것입니다. [출처]

잘 구성된 조건은 하나의 측정 가능한 종료 상태(end state), 명시된 확인 방법(Claude가 이를 증명하는 방법), 그리고 변경되어서는 안 되는 제약 조건(constraints)을 포함해야 합니다. 조건은 최대 4,000자까지 작성할 수 있습니다.

소스(source)에서는 토큰 소비가 걷잡을 수 없이 늘어나는 것을 방지하기 위해 "또는 20턴 후에 중단(or stop after 20 turns)"과 같은 조항을 추가할 것을 권장합니다. 다른 모드와의 비교: /goal : 이전 턴이 완료된 후 다음 턴을 실행하며, 모델이 조건을 확인하면 중단합니다. /loop : 특정 시간 간격으로 다음 턴을 실행합니다. 중단 훅(Stop hook): 사용자 정의 스크립트가 결정합니다. /goal은 사실 세션 범위(session-scoped)의 중단 훅(Stop hook)을 얇게 감싼(thin wrapper) 형태입니다. 자동 모드(Auto mode): 턴 내부의 도구별 승인(per-tool approvals) 과정을 제거합니다. 자동 모드에 /goal을 결합하면 턴이 무인(unattended)으로 실행되며 완료될 때까지 계속됩니다. [소스에 따르면] 에이전트 뷰(Agent View)는 모든 세션의 상태, 마지막 응답, 마지막 작업 시간 등을 나열하는 하나의 CLI 화면입니다. 어떤 세션에서든 왼쪽 화살표를 누르거나 claude agents를 실행하여 열 수 있습니다. 상태는 실행 중(Running), 차단됨(Blocked, 사용자 입력 필요), 완료됨(Done)이 있습니다. 세션을 살짝 살펴보고(Peek), 차단된 경우 인라인(inline)으로 답변하며, Enter를 눌러 완전히 연결(attach)할 수 있습니다. [소스] 백그라운드 세션(Background sessions)은 이 둘을 연결합니다: /bg는 현재 세션을 백그라운드로 보내고, claude --bg [task]는 이미 분리된(detached) 세션을 시작합니다. 턴 제한이 있는 여러 개의 goal을 시작하여 백그라운드로 보내고, 에이전트 뷰(Agent View)에서 전체 군단(fleet)을 관찰하다가, 차단됨(Blocked) 또는 완료됨(Done) 상태일 때만 개입하십시오. 에이전트 뷰(Agent View)는 Pro, Max, Team, Enterprise 및 Claude API 플랜에서 제공되는 리서치 프리뷰(research preview)입니다. [소스에 따르면] 독특한 관점: Claude Code는 단일 세션 도구에서 멀티 에이전트 오케스트레이터(multi-agent orchestrator)로 진화하고 있습니다. Haiku 평가기(evaluator)는 저렴한 문지기(gatekeeper) 역할을 합니다. 코드를 실행하지 않고 출력값만 읽습니다. 이는 /goal의 신뢰도가 세션 트랜스크립트(session transcript)의 신호에 달려 있음을 의미합니다. 이 설계의 구조적 도박(architectural bet)은 터미널 출력이 작업 완료를 위한 충분한 그라운드 트루스(ground truth, 실측값)라는 점입니다. 이는 결정론적 작업(테스트 통과)에는 유효하지만, 주관적인 목표(코드 품질)에는 실패할 수 있습니다. 관전 포인트: Anthropic이 에이전트 뷰(Agent View)를 리서치 프리뷰를 넘어 모든 플랜으로 확장하는지, 그리고 /goal의 채택이 Pro/Max 플랜 한도 내에서 토큰 소비 급증을 유발하는지 지켜보십시오. 또한 Anthropic이 멀티 세션 사용을 확장함에 따라 Haiku 평가기가 더 저렴한 모델로 교체되는지도 주목할 만합니다. 원문은 gentic.news에 게시되었습니다.

AI 자동 생성 콘텐츠

원문 바로가기

Claude Code /goal: Haiku Evaluator를 사용하여 조건 충족 시까지 무인 실행

요약

핵심 포인트

댓글