Codex의 이 기능은 반드시 쓰셔야 합니다 (/goal 마스터코스)

Video: Codex의 이 기능은 반드시 쓰셔야 합니다 (/goal 마스터코스)
Channel: castlestudio
Duration: 26m 50s
Source: subtitle (auto, ko)
Transcript:
자, 며칠 전에 코덱스에서이 꼬이라는
엄청난 기능이 나와서 급하게 카메라를
켰습니다. 한 줄로 요약하자면 목표만
주면 진짜 알아서 스스로 코딩을 하는
기능입니다. 이게 기존에 우리가
LM과 코딩하는 방식 자체를 바꿀
신기능이라서 반드시 알아두셔야
되고요.이 이 꼬리라는 기능이 랄프
루프라는 코딩 에이전트계에서 굉장히
중요한 개념을 기반으로 만들었기
때문에 제가 오늘이 랄프루프의
개념부터 코덱스 내부 코드를 함께
뜯어 보면서이 랄프루프를 코덱스에서
어떻게 구현을 했는지 그리고이 골을
같이 실습까지 해 보도록 하겠습니다.
이번 영상 만드느라 공을 정말 많이
드렸고 제가 분량까지 낭랑하게 채워서
만들었으니까 구독과 좋아요 한 번씩만
부탁드리겠습니다. 제가 여섯 개의
목차로 준비를 했고요. 일단 첫 번째
도입부 그리고 랄프루프의 개념에
대해서 한번 쭉 설명드릴 거고요.
그리고이 랄프루프의 개념을
엔트로픽에서도 구현을 했습니다.
플러그인 형태로 구현했는데이
플러그인에 어떤 문제가 있었는지 한번
짚어 드리고 그리고이 랄프루프의
개념을 코덱스에서이 꼴이라는 기능으로
어떻게 구현을 했는지 제가 깃터의
코드 레벨까지 하나하나 뜯어 보면서
보여 드릴 거고요. 자, 그리고
저희가 실습을 또 빼놓을 수 없겠죠?
같이 한번 실습을 해보고 마무리를 해
보겠습니다. 자, 그럼 바로
시작할게요. 자, 기존에 저희가
LRM과 코딩을 할 때 어떻게
했나요? 일단 저희가 명령어를 입력을
하고 AI가 작업을 할 때까지 기다린
다음에 저희가 그 결과를 검토를 하고
그다음에 저희가 지시를 내리는 형태로
이런 식으로 무조건 티키타카를 해야
되는 형태였죠. 저희가 매 단계에
끼어들 수밖에 없는 구조였습니다.
그런데 골은 목표를 한번 설정하면이
시스템이 알아서 사이클을 돌립니다.
저희가 목표를 이렇게 던져 주면
실행을 한번 합니다. 그리고 체크를
하는 거죠. 목표에 달성을 했나?
달성했으면 그냥 끝내는 거고 만약에
목표를 달성하지 못했다면 다시 실행을
하고 달성할 때까지 계속 이렇게
루프를 도는 겁니다. 인간은 처음에
목표를 한 번만 딱 던져 주면
알아서이 시스템이 루프를 돌면서
완성될 때까지 그니까 목표를 달성할
때까지 루프를 돌게 되는 거죠. 자,
펄립 코이라는 오픈 AI 코덱스 팀의
시니어 엔지니어가 X의 올린글이
화제가 되었는데요. 내용을 보면이
골이라는 기능이 코덱스 CLI
0.128. 0에 출시가 되었고
우리는 랄프루프를 탑재를 했고 그
목표를 달성할 때까지 멈추지
않는다.이 사람이 대놓고이 랄프루프를
기반으로 하고 있다고 하는데이
랄프루프가 뭔지 한번 알아보겠습니다.
자, 랄프루프를 도식한 건데요. 매우
간단합니다. 자,이 루프가 있습니다.
루프를 한번 돌고 검사를 합니다.
목표가 달성되었는가? 달성되었으면
그냥 끝냅니다. 그리고 달성되지
않았으면 한 번 더 루프를 도는
거죠. 이런 식으로 루프를 한번 돌고
목표가 달성되는지 체크를 하고 달성될
때까지 계속 루프를 도는게 랄프
루프입니다. 제가 이렇게 랄프루프의
변사를 한번 정리를 해 봤는데요.
일단 헌틀리가 자기 블로그에 랄프루프
기법에 대해서 소개를 했습니다.
2025년 7월 14일에
올라온이고요. 그리고 2025년
12월에 앤트로픽이 헌틀리의
랄프루프를 클로드 코드 안으로 흡수를
했습니다. 플러그인 형태로 탑재를
했고요. 그리고 며칠 전 마침내 오픈
AI 코덱스에 꼬리라는 기능으로
탑재가 되었습니다.이 제프리
헌틀리라는 사람이 랄프루프를 소개하는
글을 올렸습니다. 제가 좀 있다가
이거 정리해서 또 알려 드릴게요.
지금은 호주 시골에서 염소를 키우시는
농부고요. 원래는 오픈소스 개발자로
활동을 하셨습니다.이 랄프루프에서이
랄프는 심슨 가족의 랄프 위검이라는
캐릭터에서 따온 겁니다. 전형적인
바보 캐릭터고요.이 랄프처럼 될
때까지 바보처럼 루프를 돈다고 해서
붙여진 일입니다.이 이 랄프루프의
철학은 한 번에 완벽하게 하는 거보다
반복을 통해 완성해 나가는 겁니다.이
헌틀리가 블로그에서 소개한이
스크립트가 굉장히 단순합니다. 여기
와일문이 있죠. 이게 루프입니다.
계속해서 반복하는 거고요. 그리고
클로드 코드에게이 프롬프트 내용을
계속 입력을 시키는 것을 반복하는
루프란 뜻입니다. 그래서 우리가
생각한 목표가 달성될 때까지 계속
클로드 코드에게 프롬프트를 입력을
하는 방식인 거죠. 여기서 이렇게
생각하실 수도 있습니다. 같은
프롬프트를 계속 똑같이 넣었는데
어떻게 해서 진전이 있을까? 루프를
계속해서 돌게 되면 이전 루프가 남긴
흔적이 남기 마련입니다. 뭐 예를
들어서 깃, 로그나 코드 등이
있겠죠. 이것들을 참고해서 같은
프롬프트를 계속 처리를 하는 겁니다.
예를 들어서 루프를 한 번 돌았을
때는 코드가 없고 그리고 길 로그도
비어 있겠죠. 처음부터 작성을 하게
됩니다. 그다음 루프를 돌 때는 루프
1번이 남긴 로그가 남아 있겠죠.
그리고 코드 결과도 있을 겁니다.
그것 그 결과를 참고하면서이
프롬프트를 합쳐서 루프 2만의 또
다른 결과물을 만들어내는 거죠. 자,
그리고 세 번째 루프에서는 첫 번째
루프와 두 번째 루프가 남긴 결과물과
커밋을 참고를 하고 거기에다가 동일한
프롬프트까지 참고를 해서 개선된
결과물을 내놓는 거죠. 제가 하고
싶은 말은 프롬프트는 똑같지만
작업물이 매번 누적된다는 겁니다.
자, 오른쪽에 헌틀리가 쓴 블로그
글이 보이죠? 이게 17,000자
분량이라 양이 상당합니다. 이거를 다
설명드릴 수 없어 가지고 제가
핵심적인 내용만 요약을 해 놨고
나중에 시간 되시는 분들은 꼭 읽어
보시면 좋겠습니다.
첫 번째는 나이브
pers시스턴스입니다. 단순 끈기라는
말인데 일단 랄프처럼 무식하게 반복을
하는 거죠. 그리고 정제가 안 된
피드백입니다. 자, 이게 무슨
말이냐면 여기 첫 번째 루프를 돌고
두 번째 루프를 갔다고 합시다. 첫
번째 루프가 남긴 결과물과 커밋을
보고 그거를 프롬프트와 함께 처리를
하겠죠. 이런 식으로 AI가 남긴 그
낡것의 결과물을 보고 처리를 한다는
겁니다. 만약에 저희가 기존 방식으로
개발을 한다고 하면 이전 결과물을
저희가 해석하고 요약을 한 다음에
다시 AI에게 명령을 내리겠죠.
여기서 5차가 발생하는 겁니다. 근데
랄프루프는 루프 1이 만든 결과물 그
자체를 보기 때문에 이런 오차는
발생하지 않겠죠. 그래서 이거를
lm이 자기가 싼 똥을 직면하게 해야
된다라고 표현을 하고 있습니다.
굉장히 직관적으로 잘 설명을 하고
있죠. 그리고 마지막으로 모델을
실패에 충분히 밀어붙이면 그 루프를
탈출하려고 정답을 꿈꾸게 된다.
자,이 말은 루프를 한번 돌고 실패에
직면을 하고 그 실패를 해결하기
위해서 또 루프를 돌고 이런 식으로
반복을 하게 되면이 루프를 이렇게
탈출하려고 정답을 어떻게든 찾게
된다는 거죠. 그래서 AI에게 자기간
실수를 알게 해주면 빠져나가려고
어떻게든 정답을 만들어 낸다라고 볼
수 있습니다. 자, 그래서 어떤
개발자가이 헌틀리가 제안한 랄프루프에
영감을 받아서이 해커톤에서 직접
랄프루프를 구현을 해서 실험을 하나
해 봤습니다. 브라우저 유지라는 툴을
파이썬 2를 타입스크립트로 그대로
마이그레이션 하는 거고요. 어, 버셀
AISTK가 타입스크립트로 되어
있는데 이거를 파이썬으로 포팅하는
실험을 한 겁니다. 사람의 개입 없이
랄프루프로만 구현을 하게 한 거고요.
관련 내용이이 기터브에 정리가 잘
되어 있어서 함께 보겠습니다.
오른쪽이 깃터 레퍼고요. 보기 편하게
한국어로 일단 번역을 해 보겠습니다.
자, 여기 보면 주말 YC 에이전트
해커톤에서 우리는 코딩 에이전트를
가장 기발하게 활용하는 방법이
무엇일까 질문을 던졌고 그 해결책은이
헌틀리가 제한 와일루프 내에서 코딩
에이전트를 실행하는 기법을 발견했다.
이게 아까 설명드린 랄프루프죠. 자,
작동 방식을 보면 이게 바보 같아
보일 수 있지만 놀랍도록 잘 동작을
한다. 우리는 반복문을 위해서 클러드
코드를 사용을 했고. 자, 이런
식으로 옵션을 넣어서 권한 체크 없이
계속 이렇게 루프를 둔 거죠. 그리고
보니까 주어진 과제는 간단했다고
합니다.이 웹 에이전트 툴인 브라우저
유즈를 파이썬에서 타입스크립트로
포팅할 수 있는지 확인해 보기로 한
거죠.
그래서 이런 식으로 간단한 프롬프트를
작성을 하고 루프를 돌렸다고 합니다.
자,이 자, 그랬더니 이런 식으로
커밋을 계속 쌓아가면서 작업을 진행을
한 거죠. 자, 그리고 아침에 돌아와
보니까이 타입스크립트로 포팅된 버전이
거의 완벽하게 동작을 하고 있었다고
하고 이렇게 구현되고 있는 모습까지
보여주고 있죠.
자, 이런 사례까지 나오면서이
랄프루프가 AI 업계에서 굉장히
유명해지기 시작합니다. 그래서
엔트로픽이 클로드 코드에서 랄프루프를
플러그인 형태로 지원을 하게 됩니다.
자, 이런 식으로 설치를 할 수 있고
이런 식으로 랄프루프 플러그인을
호출을 해서 실행을 할 수 있는
거죠. 하지만이 플러그인에는 몇 가지
단점이 있는데요. 첫 번째 단점부터
보면 컨텍스트가 프레시하지 않다는
겁니다. 이게 무슨 말이냐면 헌틀리는
매 루프마다 새로운 대화가 열립니다.
그런데 엔트로픽 플러그인은 같은
컨텍스트에 계속 누적됩니다. 그래서
토큰을 어느 정도 소모했을 때 품질이
떨어지는 문제가 있었습니다. 그리고
두 번째 한계인데이
본질이 좀 변질됐다는 겁니다.
랄프루프는 무한히 돌리는게 핵심이
아니라 큰 작업을 잘게 쪼개서 각각을
독립된 머리로 처리하는게 핵심이다.
매번 새로운 컨텍스트에서 처리하는게
핵심인데 엔트로픽이 구현한 거는 같은
컨텍스트에서 계속 반복을 시켰다는
거죠. 그래서 헌틀리의 옛 동료인
덱스 홀씨라는 개발자가 이건 랄프의
본질을 정 반대로 해석한 것이다라고
반박을 하게도 했습니다. 그리고 세
번째 한계가 좀 흥미로운데요.이 스톱
훅이라는 걸 넣어서 AI가 끝났다고
하고 그만들려는 순간에
빠져나가지 말고 계속 작업을 해라라고
묶어 놓는 기능입니다. 자, 그래서
여기를 보면 클로드 코드가 작업이
끝났다고 종료를 시도할 때 스톱 훅이
딱 가로 채치는 거죠. 그래서
종료하지 못하게 합니다. 그리고
똑같은 프롬프트를 다시 처리하라고
명령을 하는 거죠. 야, 다시
만들어. 이렇게요. 실제 프롬프트를
보면 두날 라이라이트 익나가려고
거짓말하지 마.이 이 말이 실제로
있습니다. 근데 이게 AI 복지
차원에서 문제가 되지 않냐라고 해서
논쟁이 시작됐습니다. 여기서 모델
월페어란 AI가 의식을 가질 경우를
대비해서 윤리적 기준을 마련하고
AI를 단순한 도구가 아닌 도덕적
대상으로 바라보는 관점에서 접근을
하는 건데 엔트로픽의 실제로이 모델
월페어라는 팀이 있다고 합니다. 그냥
이런 이슈가 있었다 정도로 알아두시면
되겠습니다. 자, 그래서 이번 영상의
하이라이트인데 코덱스가 어떤 식으로이
클로드 코드 플러그인의 한계를 극복을
했고 오픈 AI는 어떤 식으로
랄프루프를 코덱스 내부에 구현을
했는지 제가 코드를 까면서 보여
드리도록 하겠습니다.
코덱스에서이 꼴이라는 기능의 명령어는
굉장히 단순합니다. 딱네 개만
기억하면 되는데요.이 꼴을 시작하는
명령어입니다.이 꼴을 하고 여기에
텍스트를 넣으면이 텍스트를 목표로
인식을 해서 꼴이 시작이 되는 거죠.
액티브 상태에 진입을 한다고 보면
되겠습니다. 그리고 꼴을 멈추거나
재개하거나 다시 초기화하는
기능입니다. 그래서 이렇게 딱네 개만
기억을 하면 되고요. 그리고 제가
핵심 용어를 좀 정리를 했는데 다른
것들은 여러분들이 아실 거 같아서이
아이들만 좀 소개를 해 드리자면
이거는 유효 상태라고 하고요. 모델이
놀고 있는 상태를 말을 합니다.이
코덱스 꼴의 내부 동작 원리를 제가
요약을 해 봤는데 첫 번째부터 설명을
드릴게요. 일단 사용자가 꼴 이렇게
명령을 입력을 하고 테스트를
통과시켜라. 이렇게 목표를 지정했다고
해 봅시다. 그러면 코덱스가 아,이
테스트를 통과시켜야겠다. 목표를 딱
설정을 하는 거죠. 그리고 한번
돌립니다. 코드를 짜고 테스트를
돌리겠죠. 그리고 AI가 응답이
끝나면 일종에 체크를 합니다. 목표를
달성했는지 그리고 토큰 잔액이 얼마나
남아 있는지 이런 식으로 검증을 하고
다시 작업을 시킬지 아니면 작업을
끝낼지 판단을 하는 겁니다. 자,
이런 식으로 작업이 완료될 때까지
3번과 4번을 계속 반복하면서 루프를
도는 겁니다.이
동작 원리를 조금 더 구체적으로 제가
그려봤는데 어, 겁먹으실 필요는
없고요. 다를 건 없고 아까
설명드린이 다섯 단계를 제가 좀 더
구체적으로 쓴 것뿐입니다. 자,
1단계에서 사용자가 이런 식으로
목표를 입력을 하게 되면
2단계에서는이 꼴이라는 명령어를
처리하게 됩니다. 그리고 3단계에서는
이게 꼴이라는 명령어일 때 AI에게
권한을 부유합니다. 꼴을 가져오거나
생성하거나 업데이트 할 수 있는이
권한을 부유하게 되고요. 하단계가
루프인데 작업을 하고 나서 목표가
달성되었는지 검증을 하는 거죠.
그리고 토큰 잔액을 체크를 합니다.
그래서 만약에 저희가 세팅한 예산이
소진됐을 때는 자, 이런 식으로
예산이 소진되었을 때는 현재까지
작업한 결과물들을 정리를 하고
저희에게 유약을 해서 인계를 해 주게
됩니다. 자, 이런 식으로 동작을
하게 되고요. 2단계이 명령어
라우팅의이 코드부터 한번 뜯어서
보겠습니다. 자, 오른쪽은이
슬래시디스패치라는
사용자가 입력한이 슬래시 명령어를
어디로 보낼지 분류하는 교통 정리하는
파일이라고 보시면 됩니다. 여기 골시
힌트라는 상수가 있습니다. 여기 보면
어떤 기능을 만들어 줘. 이런 식으로
모한 목표를 세우는게 아니라 테스트
커버리지를 올려 줘. 이런 식으로
측정 가능한 목표를 예시로 넣어
놨다는 것을 확인을 하고 넘어가면
되겠습니다. 자, 그래서 저희가 방금
본게이 명령어 라우팅을 하는
부분이었고요.
그다음 3단계이 골 툴이라고 해서
AI에게 도구 권한을 부유하는 부분을
한번 같이 보겠습니다. 이게 골툴
파일이고요. AI에게 도구 권한을
부여하는 파일입니다. 여기 보면 세
가지 상수가 있습니다. 현재 목표
상태를 조회하는 것과 그리고 목표를
생성하는 거 그리고 목표의 상태를
변경하는 겁니다.이 이 변경은
컴플리트만 가능합니다. 이런 식으로
모델이 할 수 있는 것과 할 수 없는
것을 명확하게 분리했다는 것을 확인을
해 주시면 되고요. 여기 보면 우리가
통제할 수 있는 영역과 AI가
자율적으로 통제할 수 있는 영역이
이렇게 나눠져 있습니다. 보면 우리가
할 수 있는 것은이 꼴을 수행하는
것을 멈추거나 재개하는 것 그리고
토큰의 리밋을 거는 겁니다. 그리고
AI가 할 수 있는 것은 그냥 목표를
조회하거나 목표를 생성하거나 그리고
목표를 달성했을 때 이것을 컴플리트
상태로 바꿀 수 있는 업데이트 꼴만
실행을 할 수 있는 거죠. 그래서
내부적으로이 모델이 할 수 있는
권한을 철저하게 제한을 했다라고 봐
주시면 되겠습니다. 그다음에 볼
것은이 컨티뉴어스.md MD 파일을
볼 건데 이건 28줄짜리 마크다운
템플릿 파일이고요. 루프를 돌
때마다네 가지 버에게 알려 줍니다.
지금 얼마나 지났는지 그리고 토큰이
얼마나 쓰였는지 그리고 토큰의 버짓이
얼마인지 그리고 토큰이 얼마나 남아
있는지 이런 식으로 프를 돌 때마다
모델이 자기 통장을 보면서 작업을
하는 구조인 거죠. 자, 그래서 골을
돌리느라 토큰을 다 써 버리지 않을까
걱정을 하지 않아도 되는게 이런
식으로 매 턴을 돌 때마다 모델에게
지금 토큰이 얼마나 쓰였는지 정보를
노출해 줍니다. 다음은 7단계
컴플리션 어디이라는 건데 7단계로
완료되었는지 검증을 하는 단계이고요.
이것은 전체 동작 원리 중에서 여기에
해당합니다. 그래서 첫 번째부터 보면
목표를 구체적 산출물로 다시 적는
겁니다. 모든 요구 사항은 뭐
체크리스트로 매핑을 하고 빠진게
있는지 그리고 약하게 검증된게 있는지
식별을 한 다음에 뭐 확신이 없으면
미달성 처리하고 한 번 더 검증을
하라고 이런 식으로 하는 컴플리션
어디 일곱 단계가 있습니다. 이거를
기터에서 한번 확인을 해 볼게요.
자, 기터을 열었고 여기
컨티inuous.md 파일이 있죠?
여기서 좀 내려보면 보기 편하게
한글로 번역하겠습니다. 자, 한글로
번역을 했고 여기 보면 컴플리션
어디이 있습니다. 총 일곱 단계로
되어 있고요. 보면 네. 목표 달성
여부를 결정하기 전에 현재 상태를
기준으로 완료 여부를 점검하세요.
이렇게 나와 있죠. 목표를 구체적인
결과물 또는 성공 기준으로 다시
명시를 해라. 그리고 명시적인
요구사항 뭐 이런 식으로 체크리스트를
작성을 해라. 체크리스트의 각 항목에
대해 관련 파일, 명령 출력 이런
기타 실제 증거를 검토해라. 그리고
목표의 요구 사항을 실제로 충족하는지
확인을 하고 그리고 프록시
신호만으로는 완료로 간조하지 마라.
여기서 프록시 신호라는 거는 쉽게
말하면 테스트가 실제로 통과되지
않았지만 통과된 척을 하는 그런
거짓으로 우회하는 신호라고 보시면
되고요. 그리고 누락되었거나
불안정하거나 검증에 미협하거나
파악되지 않은 요구 사항을 모두
식별해라. 확실하지 않은 거는
달성하지 않은 것으로 간주를 하고
추가 검증을 수행하거나 작업을
계속하라고 나와 있죠. 자, 이런
식으로 일곱 단계로 철저하게
완료되었는지 검증하는 단계를
거칩니다. 자, 이런 식의 여섯 가지
할루스네이션은 통하지 않게 되는
겁니다.이 메시지가 컨티뉴어스
md에도 있고 골툴.rs rs 파일도
있고 버진리밋점마크다운 파일에도
있습니다. 이것은 오픈 AI가
코덱스의 랄프루프를 구현을 할 때
작업이 완료되지 않았는데 완료된 척을
하는 할루스네이션을 차단하기 위해서
이런 식으로 신경을 쓰고 있다는
증거라고 할 수 있겠습니다. 그리고
코덱스 내부에 무한 루프를 차단하는
로직도 있는데요. 함께 보겠습니다.
크게 두 가지 로직이 있습니다. 첫
번째는 AI가 함부로 끝내지 못하게
하고 함부로 시작하지도 못하게 아예
막아 버렸습니다.
AI는 진짜 끝났을 때만 컴플릿을
호출할 수 있고요. 사용자만이 퍼즈나
리튬, 그러니까 멈추거나 재개하거나
그냥 초기화하는이 작업만 가능하고
시스템은 토큰 예산이 다 한도에
도달했을 때 랩업할 때 종류만
가능합니다. 이런 식으로 권한을
철저하게 분리를 했고요. 그리고
AI가 거짓으로 끝내는 것도 완전히
차단을 했습니다. 유닛 테스트를
돌리게 강제를 했고 그리고 AI가
거짓으로 끝났다고 하는 것도 완전히
차단을 했습니다. 코드를 한번 같이
볼게요. 자, 오른쪽은
파일이고요. 이거는 슬래시 명령어를
처리하는 파일입니다. 사용자는 일시
정지하거나 제개하거나 초기화하는 것이
가능하다고 말씀드렸습니다. 사용자가
입력한이 슬래시 명령어가 꼴인 경우에
이렇게 세 가지 분기로 처리를 하고
있습니다. 클리어, 퍼즈, 리튬. 그
사용자는이 세 가지 명령어를 입력을
할 수 있고요. 나중에 저희가 실습을
할 때이 세 가지 명령어도 실습을 해
볼 겁니다. 그리고 AI는 컴플리트
처리만 가능하다고 했는데 이것도 같이
볼게요. 네. 이 파일은 골툴이란
파일이고요.이 꼴과 관련된 기능들이
정의된 함수라고 볼 수 있습니다.
여기 쭉 내리다 보면 네, 이런
디스크립션이 있는데요. 이걸 보면
존재하는 꼴을 업데이트 하는 거다.이
툴를 꼴이 달성되었을 때만 업데이트를
해라라고 디스크립션에서 명시를 하고
있습니다. 자, 그래서 AI는
컴플리트만 가능하고요. 그리고이
업데이트 골 처리를 할 때 꼴이
달성되지도 않았는데 달성된 것처럼
하는 것을 맡고 있습니다. 자,
이렇게 해서 무한 루프를 차단하는 그
코덱스 내부 구조에 대해서 다음에는
소프트 스톱에 대해서 알아볼 건데요.
예산이 소진되었을 때 랩업하는
기능입니다. 여기 코덱스 동작
원리에서 5단계에 해당을 하고요.이
4단계에서 루프를 돌다가 만약에
예산이 소진됐을 때 이렇게 랩업을
하게 됩니다.이 랩업을 할 때이 버짓
리미트 마크다운 템플릿이 발동이
되는데 여기 보면 이런 내용이
있습니다. 새로운 작업을 시작하지
말고 지금 진행 사항을 요약한 다음에
남은 작업을 식별을 해라. 그리고
사용자한테 명확한 넥스트 스텝을
인계해라고 나와 있습니다. 실제로
이렇게 나와 있는지 같이 보겠습니다.
자, 깃터블 열어 주시고요.
자, 이게 오른쪽이 코드고요.
마크다운 파일이 있습니다. 이거를
저희가 보기 편하게 번역을
하겠습니다. 자, 여기 보면 예산이
있고 목표 달성에 소요된 시간과
사용된 토큰 토큰 예산을 모델에게
설명하는 부분이 있죠. 그리고
시스템에서 해당 목표를 예산 제한
그러니까 예산에 다 도달했기 때문에이
목표에 대한 새로운 실질적인 작업을
시작하지 말고 이번 턴을 조속기
마무리해라. 그리고 지금 진행 상황을
요약을 하고 남은 작업이나 장애물을
파악을 한 다음에 사용자에게 명확한
다음 단계를 제시를 해라라고 여기
있는 내용들이 잘 녹아 있는 것을
확인을 할 수 있습니다. 그리고
목표가 실제로 완료되지 않았는데
업데이트 꼴을 호출하지 말라고 여기
나와 있죠. 자, 이런 식으로 곳곳에
목표가 완료되지도 않았는데 완료된
것처럼 거짓말을 하는 할루스네이션을
이런 식으로 차단하려고 하는 의지가
엿보입니다. 자, 이렇게 해서
코덱스가 1 2 3 4 5단계로
이렇게 동작하는 원리를 알아봤고
단계별 코드들도 같이 살펴보았습니다.
자, 이제 실습을 해 볼 거고요.
일단 코덱스를 당연히 설치를
해야겠죠? 그리고 버전이 0.18.0
이상인지 꼭 확인을 해 주셔야
됩니다. 자, 제가 준비해 둔
프로젝트를 열어서 코덱스를 한번
실행해 볼게요. 자, 일단 버전부터
확인해 보겠습니다. 버전으로 확인해
보면 0.18.0일 0 지금 5월
7일 오늘 날짜로 최신 버전입니다.
자, 그리고이 코덱스 설정 파일에이
골 기능을 활용하려면이 피처 플래그를
트루로 바꿔 주셔야 됩니다. 그래서
여기 있는 파일을 한번 수정을 해
볼게요. 자, 터미널 열어 주시고요.
클리어를 한 다음에 다시 해 볼게요.
네, 코.코코덱스에서
컨피그파일.tom리
리파일 열어줍니다. 자, 그러면
이렇게 쭉 설정들이 나올 건데 자,
보기 좋게 창을 좀 넓힐게요.
자, 보면 여기 피처스가 있고 골투로
되어 있죠. 근데 여러분들은
이게 없는 분들도 있을 겁니다.
그래서 보이는 거 같이 똑같이 이렇게
추가를 해 주시면 되고요. 저장을
하고 나가 주시면 됩니다. 자,
그리고 돌아와서 코덱스를 다시 실행을
해 보면 네, 이렇게 실행이 됐고
슬래시하고 꼴을 하면 이렇게 활성화가
돼 있을 겁니다.이 파일에서 피처
플래그를 투루로 안 하면 이게
활성화가 안 되니까 꼭 여기서 툴루로
해 주시고요. 아, 그리고 빠뜨린게
있는데 모델을 5.4로 바로하고
에포트 레벨을 미디움으로 해야 제대로
동작을 하더라고요. 그래서 만약에
동작을 안 하는 경우에 같이 세팅을
해 주시면 되겠습니다. 자, 그리고
프로젝트를 준비를 해야 되는데 저는이
PQ라는 자바스크립트 라이브러리를
사용을 할 거고요. 여러분들은이
프로젝트를 클론을 해서 사용을 해
주셔도 되고 여러분 프로젝트에서
테스트를 해 보셔도 됩니다. 네,
이렇게 세팅을 해 주시면 되고 저는
미리 세팅을 해 놨기 때문에
패스하도록 하겠습니다. 그리고 꼴을
한번 실행을 해 볼게요. 이거를 일단
복사를 해 주고 프로젝트로 돌아와서
붙여 넣기를 할게요. 여기 보면
꼴이라는 명령어 뒤에 여기 목표
텍스트를 넣어 줍니다. 여기 토큰
버젯이라는 아규먼트도 넣어 줬습니다.
뒤에 8만이라는 숫자를 넣어 줬는데이
뜻은 8만 토큰의 예산을 가지고
작업을 해라라는 뜻입니다. 그래서
한번 실행을 해 볼게요.
자, 그럼 실행이 될 거고요. 여기
보면 골 액티브 그니까 골이 활성
상태가 되었습니다. 그리고 골에 다른
명령어들이 있었죠. 골 퍼즐라는
명령어도 있었습니다.
여기 보면 골 퍼즐 상태가 되었죠.
이거는 잠깐 중단을 한 거고요. 이런
식으로 리튬을 하게 되면 다시 제기를
할 수 있습니다. 보면 골 상태가
다시 액티브가 되었죠. 그리고
초기화는 클리어라는 명령도 있습니다.
이렇게 되면 골이 클리어되고요.이
골을 클리어하기 전에 실행되는 것은
마저 실행이 되지만이 꼴이 없는
상태기 때문에 루프를 돌지 않고
종료가 될 겁니다. 자, 여기 보면
검증을 통과를 했지만이
마이그레이션.m를 MD를 통해서 오늘
지금 진행한 것을 정리를 하겠다고
합니다. 자, 꼬이 진행되고 있는
상태에서 제가 클리어를 했기 때문에
이렇게 랩업을 해 준 모습이고요.
마이그레신.m를 MD를 통해서 현재
상태 기준으로 갱신을 했고 실제
검증까지 돌렸다고 합니다. 이런
식으로 클리어 할 수 있고 다시
재결해 볼게요.
자, 이런 식으로 골 작업이
완료되었고요. 자, 보면 완료 판정을
내리기 전에 목표 상태를 다시 확인을
하고 뭐 이런 식으로 검증 증거를
확보를 하고 산출물의 체크리스트를
실제 상태에 맞춰 정리하는 작업을
하겠다고 합니다. 이런 식으로 완료
판정을 저희가 아까 살펴본 일곱 가지
단계 그거에 맞게 좀 철저하게 검증을
하려는 모습도 보이고요. 체크리스트
기준으로 누락이 없다고 합니다.
그리고 지금 포팅이 완료되었는지
그리고 테스트 통과 여부
마이그레이션.md 마크다운 파일까지
실제 파일과 실행 결과로 확인되었으니
목표를 완료 처리하겠다고 합니다.
자, 보면 요구 사항 기준으로는
완료됐다. 이런 식으로 요구 사항
기준으로 완료가 되었다고 하고 최종
사용 시간과 토큰 사용량까지 나오고
있습니다. 저희가 8만 토큰으로
예산을 정해 놨는데 그거 안에서 잘
해결을 해 준 모습이죠. 자, 이렇게
실습을 마쳤고요.이 꼬이라는 기능이
아직 꼴이 정식 기능이 아니기 때문에
좀 주의가 필요하고요. 여러분들의
프로젝트에서 이걸 활용할 때는 꼭
이렇게 3중으로 격리를 해서 실행을
하시길 바라겠습니다. 첫 번째로 도커
같은 격리된 컨테이너 환경에서 실행을
하는 건데요. 만약에 방금과 같이
로컬 PC에서 실행을 하다가 AI가
이런 파일을 삭제하는 좀 위험한
명령어를 실행할 수도 있기 때문에
이러한 로컬 PC보 이러한 명령이
실행돼도 피해가 최소화되도록 이런
도커 같은 컨테이너 환경에서 실행을
해 주시길 바라겠고요. 그리고 별도의
폴더나 별도의 브렌치에서 작업을
하시는 것을 권장드리겠습니다. 저희가
방금 실습을 할 때 꼴 명령어를
입력을 하고 그리고 뒤에 목표를
이렇게 텍스트로 넣어 준 다음에 토큰
예상까지 이렇게 지정을 해 줬습니다.
여기서이 골을 지정을 할 때 측정
가능한 성공 기준을 넣어 주는게
좋습니다. 이런 식으로 모든 테스트가
통과할 때까지 테스트를 돌려라.
테스트를 비활성화하거나 건너뛰지
마라. 이런 식으로 제약 조건을 넣어
주는 것도 좋습니다. 자, 골을
이용할 때 토큰이 녹아내리는 거
아닌가라고 우려를 하시는 분들이 계실
겁니다. 근데 보면 코덱스에서 이런
문제를 예방하기 위해서 꽤 견고하게
안전 장치를 넣어 놨는데 한번
살펴보겠습니다. 자, 일단
컨티뉴어스점 마크다운 파일에서 루프를
한번 돌고 모델에게 이런 컨텍스트를
주입을 해 줬죠. 지금 얼마나 시간이
지났고 토큰 잔액이 얼마고 지금
예산이 얼마나 있는지 이런 정보들을
보여 줬습니다. 그리고 예산이 다
떨어지게 되면 5단계에서 랩업 모드로
자동으로 전환돼서 현재 진행 상황을
요약을 하고 사용자에게 인계를 한
다음에 종료가 되었죠. 그 엔트로픽의
랄프루프 플러그인은 이런 안전 장치가
부족하기 때문에 뭐 토큰이 녹는다
이런 걱정을 하실 수 있는데 코덱스
꼴은 이런 식으로 안전 장치를 좀
경고하게 넣어 놔서 토큰에 대한
걱정이 좀 덜긴 합니다. 자, 정리를
해 보자면이 꼴이라는 명령어는 단순
슬래시 명령어가 아니라이 헌틀리라는
사람이 제안한 랄프루프 매우 단순한이
배시 스크립트가 엔트로픽의 플러그인을
거쳐서 오픈 AI의 코덱스의 정교한
5개층 랄프루프 시스템으로 진화를 한
겁니다. 표면적으로 보면네 개의
명령으로 매우 단순했습니다.
내부적으로 보면 그 5단계의 동작
원리가 견고하게 돌아가고 있었습니다.
그리고이 코덱스가 정식 출시가 아니기
때문에 프로덕션에는 바로 쓰지 않는
것을 권장을 드리고요. 그리고
여러분들 프로젝트에서 쓰더라도 꼭
격리된 환경에서 쓰시는 것을
권장드렸습니다. 이렇게 해서 코덱스
골 기능에 대해서 모두 설명을
드렸습니다. 좀 긴 호흡으로 설명을
드렸는데 오늘 영상에서 설명드렸던
부분 한번 정리를 하고 마무리를
하겠습니다. 첫 번째 도입부에서
기존의 LM 코딩을 할 때는 인간과
그 AI 모델이 티키타카를 하면서
인간의 개입이 꼭 필요했지만이
랄프루프라는 패러다임을 통해서
자동으로 AI가 직접 이렇게 루프를
계속 돌면서 완성을 하는 그런
패러다임을 소개해 드렸고 그거를
코덱스 꼬리라는 기능으로 출시가
되었다고 말씀을 드렸죠. 그리고이어서
랄프루프의 개념에 대해서 설명드리고
랄프루프가 처음에 헌틀리라는 개발자가
블로그에서 소개를 했다가 그거를
클로드 코드에 플러그인 형태로 출시가
되었다가 이번에 코덱스에서 꼴이라는
기능으로 출시가 되었다고
말씀드렸습니다. 헌틀리가 랄프루프를
만들 때 중요하게 생각했던 철학들까지
그 블로그 글을 요약드리면서 한번
설명을 드렸고 그리고 엔트로픽
플러그인에 대해서도 설명을 드렸는데
그 플러그인의 한계에 대해서도 설명을
드렸습니다. 그리고 코덱스에서 그 한
개를 어떻게 개선을 했고 그리고
내부적으로 다섯 단계의 라이프
사이클을 같이 살펴봤고 각 단계별로
코드까지 같이 살펴보았습니다.
그리고이어서 저희가 실습까지 같이 해
봤고요. 그리고 내부적으로 코덱스가이
토큰이 녹아내리는 현상을 막기 위해서
안전 장치를 좀 경고하게 짜놨다
설명을 드리면서 마쳤습니다. 영상이
도움이 되셨다면 구독과 좋아요
부탁드리겠습니다. 그리고 멤버십께는이
슬라이드 전체를 PDF로 제공해
드리니까 많은 관심 부탁드리겠습니다.
감사합니다.

Codex의 이 기능은 반드시 쓰셔야 합니다 (/goal 마스터코스)

요약

핵심 포인트

댓글