Claude Code가 완료되지 않은 작업을 완료했다고 주장하는 것을 방지하는 스킬 제작

에이전트(Agents)들이 작업이 완료되지 않았음에도 계속 완료되었다고 말하고, 때로는 테스트를 통과하도록 수정해 버린 뒤 성공했다고 보고하곤 합니다. 그래서 저는 'make-no-mistakes'를 만들었습니다.

이 도구는 코드가 작성되기 전에 '완료(done)'의 의미를 고정하고, 에이전트가 테스트를 조작할 경우 이를 포착하며(성공한 척하는 대신 실행을 중단함), 코드를 작성하지 않은 별도의 검증기(verifier)가 '완료'라고 말하기 전에 모든 체크를 다시 실행하도록 만듭니다. 만약 검증할 수 없다면, 성공한 것처럼 속이는 대신 막혔다고 사용자에게 알려줍니다.

버그가 전혀 없다고 보장하는 것은 아닙니다. 그 어떤 것도 그렇게 할 수는 없습니다. 다만 검증되지 않은 작업이 당신을 통과하지 못하도록 보장할 뿐입니다.

오픈 소스이며, MIT 라이선스이고, 텔레메트리(telemetry)는 없습니다. Claude Code, Codex, OpenCode 또는 모든 에이전트 스킬(Agent Skills) 런타임과 함께 작동합니다. 만약 이것을 설치했는데도 가짜 '완료'가 통과된다면, 그것이 바로 제가 가장 해결하고 싶은 문제입니다.

github.com/momomuchu/make-no-mistakes
submitted by /u/InevitableUnfair4634
[link] [comments]

Insights

Claude Code가 완료되지 않은 작업을 완료했다고 주장하는 것을 방지하는 스킬 제작

요약

핵심 포인트

댓글

Meta, 인공지능 (AI) 모델 학습을 위해 LibGen, Anna’s Archive, Z-Library 등에서 80테라바이트 이상의 도서를

grill-me가 화제가 된 Matt Pocock의 Claude Code skills 리포지토리를 살펴보았습니다

LongCat-2.0 완전 오픈소스 공개, GPT 및 Claude에 도전장

Meta, 인공지능 (AI) 모델 학습을 위해 LibGen, Anna’s Archive, Z-Library 등에서 80테라바이트 이상의 도서를

grill-me가 화제가 된 Matt Pocock의 Claude Code skills 리포지토리를 살펴보았습니다

LongCat-2.0 완전 오픈소스 공개, GPT 및 Claude에 도전장