본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 20. 21:37

Claude Code /goal: Haiku Evaluator를 사용하여 조건 충족 시까지 무인 실행

요약

Claude Code의 업데이트를 통해 도입된 /goal 명령은 Haiku Evaluator를 활용하여 설정된 조건이 충족될 때까지 코딩 에이전트를 무인으로 실행합니다. Agent View와 결합하여 여러 백그라운드 세션을 효율적으로 관리하며, 사용자의 지속적인 감독 없이도 목표를 달성할 수 있는 멀티 세션 워크플로우를 제공합니다.

핵심 포인트

  • Haiku 모델을 Evaluator로 사용하여 세션 텍스트를 기반으로 목표 달성 여부를 판단함
  • Agent View를 통해 Running, Blocked, Done 상태의 멀티 세션을 CLI에서 관리 가능
  • 측정 가능한 종료 상태와 확인 방법을 포함한 명확한 조건 설정이 필수적임
  • 토큰 과다 소비 방지를 위해 턴 제한(예: 20턴 후 중단) 설정을 권장함
  • v2.1.139 이상의 Claude Code 버전이 필요함

Claude Code /goal은 Haiku Evaluator를 사용하여 조건이 충족될 때까지 무인(unattended)으로 실행됩니다. Agent View는 여러 개의 백그라운드 세션을 관리합니다. v2.1.139 버전이 필요합니다. Claude Code의 2026년 5월 업데이트에서는 무인 멀티 세션 워크플로우를 위한 /goal 및 Agent View가 도입되었습니다. /goal Evaluator는 기본적으로 Haiku를 사용하며, 완료 여부를 확인하기 위해 세션 텍스트만 읽습니다.

주요 사실:

  • Claude Code v2.1.139 이상 필요
  • Evaluator는 기본적으로 Haiku 모델 사용
  • 조건 제한: 4,000자
  • Agent View는 Running, Blocked, Done 세션을 나열함
  • Agent View는 Pro, Max, Team, Enterprise, API에서 제공

Claude Code의 2026년 5월 업데이트는 지속적인 감독 없이 터미널 기반 코딩 에이전트(coding agent)를 실행할 수 있는 두 가지 기능인 /goal 명령과 Agent View를 추가했습니다. 이들은 서로 분리되어 있지만 상호 보완적이며, 무인 멀티 세션 워크플로우를 가능하게 합니다. [출처에 따르면]

핵심 요약:
Claude Code /goal은 Haiku Evaluator를 사용하여 조건이 충족될 때까지 무인으로 실행됩니다. Agent View는 여러 백그라운드 세션을 관리합니다.

/goal 작동 방식:
사용자는 단일 완료 조건(completion condition)을 작성합니다. 예를 들어, /goal test/auth에 있는 모든 테스트가 통과하고 lint 단계가 깨끗할 것과 같이 작성합니다. 매 턴(turn)이 끝날 때마다 Claude Code는 중단하는 대신, 별도의 Evaluator 모델에게 해당 조건이 참인지 묻습니다. 만약 거짓이라면, 그 이유를 가이드로 삼아 다음 턴을 진행합니다. 만약 참이라면, 목표(goal)가 해제되고 터미널로 돌아옵니다. v2.1.139 이상이 필요합니다. [출처에 따르면]

대부분의 게시물이 생략하는 세부 사항: Evaluator는 작고 빠른 모델(기본적으로 Haiku)입니다. 이 모델은 명령을 실행하거나 파일을 열지 않습니다. 오직 세션에 이미 존재하는 텍스트만을 판단합니다. 따라서 조건은 Claude가 출력하는 내용을 통해 증명할 수 있는 것이어야 합니다. "test/auth의 모든 테스트 통과"는 테스트 결과가 트랜스크립트(transcript)에 남기 때문에 작동합니다. 반면 "코드가 좋다"와 같은 조건은 절대 작동하지 않을 것입니다. [출처]

잘 구성된 조건은 하나의 측정 가능한 종료 상태(end state), 명시된 확인 방법(Claude가 이를 증명하는 방법), 그리고 변경되어서는 안 되는 제약 조건(constraints)을 포함해야 합니다. 조건은 최대 4,000자까지 작성할 수 있습니다.

소스(source)에서는 토큰 소비가 걷잡을 수 없이 늘어나는 것을 방지하기 위해 "또는 20턴 후에 중단(or stop after 20 turns)"과 같은 조항을 추가할 것을 권장합니다. 다른 모드와의 비교: /goal : 이전 턴이 완료된 후 다음 턴을 실행하며, 모델이 조건을 확인하면 중단합니다. /loop : 특정 시간 간격으로 다음 턴을 실행합니다. 중단 훅(Stop hook): 사용자 정의 스크립트가 결정합니다. /goal은 사실 세션 범위(session-scoped)의 중단 훅(Stop hook)을 얇게 감싼(thin wrapper) 형태입니다. 자동 모드(Auto mode): 턴 내부의 도구별 승인(per-tool approvals) 과정을 제거합니다. 자동 모드에 /goal을 결합하면 턴이 무인(unattended)으로 실행되며 완료될 때까지 계속됩니다. [소스에 따르면] 에이전트 뷰(Agent View)는 모든 세션의 상태, 마지막 응답, 마지막 작업 시간 등을 나열하는 하나의 CLI 화면입니다. 어떤 세션에서든 왼쪽 화살표를 누르거나 claude agents를 실행하여 열 수 있습니다. 상태는 실행 중(Running), 차단됨(Blocked, 사용자 입력 필요), 완료됨(Done)이 있습니다. 세션을 살짝 살펴보고(Peek), 차단된 경우 인라인(inline)으로 답변하며, Enter를 눌러 완전히 연결(attach)할 수 있습니다. [소스] 백그라운드 세션(Background sessions)은 이 둘을 연결합니다: /bg는 현재 세션을 백그라운드로 보내고, claude --bg [task]는 이미 분리된(detached) 세션을 시작합니다. 턴 제한이 있는 여러 개의 goal을 시작하여 백그라운드로 보내고, 에이전트 뷰(Agent View)에서 전체 군단(fleet)을 관찰하다가, 차단됨(Blocked) 또는 완료됨(Done) 상태일 때만 개입하십시오. 에이전트 뷰(Agent View)는 Pro, Max, Team, Enterprise 및 Claude API 플랜에서 제공되는 리서치 프리뷰(research preview)입니다. [소스에 따르면] 독특한 관점: Claude Code는 단일 세션 도구에서 멀티 에이전트 오케스트레이터(multi-agent orchestrator)로 진화하고 있습니다. Haiku 평가기(evaluator)는 저렴한 문지기(gatekeeper) 역할을 합니다. 코드를 실행하지 않고 출력값만 읽습니다. 이는 /goal의 신뢰도가 세션 트랜스크립트(session transcript)의 신호에 달려 있음을 의미합니다. 이 설계의 구조적 도박(architectural bet)은 터미널 출력이 작업 완료를 위한 충분한 그라운드 트루스(ground truth, 실측값)라는 점입니다. 이는 결정론적 작업(테스트 통과)에는 유효하지만, 주관적인 목표(코드 품질)에는 실패할 수 있습니다. 관전 포인트: Anthropic이 에이전트 뷰(Agent View)를 리서치 프리뷰를 넘어 모든 플랜으로 확장하는지, 그리고 /goal의 채택이 Pro/Max 플랜 한도 내에서 토큰 소비 급증을 유발하는지 지켜보십시오. 또한 Anthropic이 멀티 세션 사용을 확장함에 따라 Haiku 평가기가 더 저렴한 모델로 교체되는지도 주목할 만합니다. 원문은 gentic.news에 게시되었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0