
Codex와 Claude Code의 /goal 명령어 실전 가이드
요약
OpenAI Codex와 Anthropic Claude Code가 도입한 /goal 명령어의 작동 방식과 실전 활용 사례를 비교 분석합니다. 사용자의 개입 없이 목표 달성 시까지 에이전트가 스스로 판단하고 반복 실행하는 자동화 루프의 혁신을 다룹니다.
핵심 포인트
- /goal 명령어는 목표 달성 시까지 에이전트의 실행을 자동 지속함
- Codex는 태스크 영속성을 통해 재부팅 후에도 작업 재개 가능
- Claude Code는 소규모 모델을 슈퍼바이저로 활용해 비용 효율적 판단 수행
- 에러 수정, 데이터 스크레이핑 등 복잡한 반복 루프를 자동화함
/goal
은(는) OpenAI Codex CLI(4월 30일)와 Anthropic Claude Code(5월 12일)가 11일 간격으로 제공하기 시작한 새로운 명령어입니다.
컨셉은 심플합니다. 완료 조건을 지정하면, 그 조건이 충족될 때까지 자동으로 실행을 계속합니다.
/goal 이전에는 AI 코딩 에이전트(AI Coding Agent)가 턴(Turn)마다 정지하여 사용자가 Enter 키를 누르기를 기다려야 했습니다. 프롬프트로 "X까지 계속해줘"라고 지시해도 역시 일시 정지해 버립니다. /goal은 이 문제의 해결책입니다.
Codex는 태스크(Task)를 로컬에 저장합니다. 노트북을 닫거나 재부팅해도 태스크는 유지되며, /goal resume로 재개할 수 있습니다. 조작에는 create, pause, resume, clear가 있습니다. 앱 서버에서 영속화(Persistence)된 워크플로우입니다.
Claude Code는 다른 접근 방식을 취합니다. 더 저비용인 소규모 모델(기본값은 Haiku)이 슈퍼바이저(Supervisor) 역할을 합니다. 각 턴이 끝난 후, 슈퍼바이저는 트랜스크립트(Transcript)를 읽고 하나의 질문에 답합니다. "목표가 달성되었는가?" 만약 달성되지 않았다면 실행을 계속합니다. 달성되었다면 정지하고 결과를 반환합니다. 토큰(Token) 관점에서 슈퍼바이저는 별도로 과금되며, 메인 모델의 예산을 소비하지 않습니다.
동일한 문제에 대한 두 가지 접근 방식입니다. 에이전트 스스로가 완료했는지 여부를 판단하게 하는 것입니다.
1. 데이터 스크레이핑(Data Scraping) 실행
이전: 3개의 브랜드로부터 제품을 스크레이핑하도록 지시합니다. 브랜드 1이 완료되어 정지하고, "계속해도 될까?"라고 묻습니다. 계속을 누릅니다. 브랜드 2가 완료되어 다시 정지합니다. 브랜드 3은 92% 성공률로 끝나며, 실패한 부분은 수동으로 재시도해야 합니다. 밤새도록 Enter 키를 누르며 시간을 보냈습니다.
이후: "3개 브랜드 모두를 스크레이핑해줘. 실패 시 최대 3번까지 자동 재시도해주고, 95% 미만은 불합격으로 처리해줘"라고 지시합니다. 노트북을 닫고 식사를 하러 나갑니다. 돌아와 보니: 첫 시도가 92%였으나, 자동으로 1회 재시도되어 96%에 도달하며 완료되어 있었습니다.
차이점은 "95%를 완료로 간주한다"는 것입니다. /goal은 그것을 사용자의 판단이 아닌 에이전트의 판단으로 바꿉니다.
2. Mac 앱 패키징
이전: 빌드(Build)가 실패하여 Google에서 검색하고, 2014년의 Stack Overflow 스레드를 찾아 시도해보고, 새로운 에러가 발생하면 다시 Google에서 검색하고 또 시도합니다. 20회 이상의 상호작용이 일어납니다. 새벽 2시가 되어도 여전히 키보드 앞에 있습니다.
이후: "빌드 스크립트가 출하 가능한 패키지를 생성하도록 해줘. 실패할 경우 에러를 읽고 스스로 수정책을 찾아 출하될 때까지 재시도해줘"라고 지시합니다. 노트북을 닫고 잠을 잡니다. 아침이 되니: 4번의 상호작용만으로 각각 다른 문제를 진단하고 수정했습니다. 패키지는 빌드되어 있었습니다.
/goal은 "에러를 읽는다 → 검색한다 → 패치를 적용한다 → 재실행한다"라는 인간의 루프(Loop)를 자동화합니다.
3. 출장 중 서버 다운
이전: 출장 중에 서버가 다운됩니다. 모바일로는 접속할 수 없어 수정 사항을 푸시(Push)할 수 없고, 모니터링 페이지를 10분마다 새로고침하며 자동 복구되기를 기도합니다.
이후: 노트북을 열고 "서버에 원격 로그인하여 크래시(Crash) 원인을 파악하고, 수정하며, 엔드포인트(Endpoint)가 복구되었는지 확인해줘"라고 지시합니다. 출장을 계속합니다. 집에 돌아오니 이미 완료되어 있었습니다.
로그인하고, 로그를 읽고, 원인 파일을 특정하여 삭제하고, 재시작하고, 검증했습니다. 그리고 메모를 남겼습니다. "이런 종류의 파일이 다시 섞여 들어가지 않도록 해줘"
이것은 이전에는 인간만이 할 수 있었던 작업이었습니다.
엔지니어링 측면에서 /goal은 간단합니다. Codex는 상태 머신(State Machine)과 스토리지(Storage)입니다. Claude Code는 세컨더리 LLM(Secondary LLM) 호출입니다.
하지만 지난 2년 동안 AI 코딩 에이전트가 해결하지 못했던 문제를 해결합니다.
메인 모델 스스로가 완료했는지 여부를 판단할 수 없다는 문제.
메인 모델은 코드 작성에 줌인(Zoom-in)되어 있습니다. "완료"를 위해서는 줌아웃(Zoom-out)이 필요합니다. Anthropic의 결정(Haiku에게 줌아웃을 시키는 것)은 노동의 아름다운 분업입니다.
같은 주에, Anthropic은 /loop, /batch, /background도 제공하기 시작했습니다. /loop는 N번 실행합니다. /batch는 태스크를 병렬화(Parallelization)합니다. /background는 백그라운드(Background)에서 실행합니다. 이 세 가지는 모두 '언제 정지할지'를 사용자에게 맡깁니다. 오직 /goal만이 그것을 에이전트(Agent)에게 맡깁니다.
정지 비트(Stop bit)의 양도가 진정한 패러다임 시프트(Paradigm shift)입니다.
/goal은 프로세스의 마이크로매니지먼트(Micromanagement)에서 목표의 정의로 노력을 전환시킵니다.
목표에 포함해야 할 4가지 사항:
- 정지 조건 — 무엇이 '완료'로 간주되는가
- 검증 — 완료되었음을 어떻게 증명할 것인가
- 변경해서는 안 되는 경계 — 무엇을 변경하지 않을 것인가
- 성공 지표 — 정량화할 것 (예: 성공률 ≥ 95%)
모호한 프롬프트(Prompt)는 턴(Turn)을 한 번 낭비하게 합니다. 모호한 목표는 6시간을 낭비하게 할 수 있습니다.
하지만 명확한 목표는, 당신의 입력 없이도 에이전트를 8시간 동안 실행시킬 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기