DoneCheck: Codex 에이전트를 위한 완료 증명(proof-of-done) 영수증
요약
AI 코딩 에이전트가 작업을 완료했다고 주장할 때, 실제 수행 결과에 대한 증거를 검증하는 DoneCheck를 소개합니다. 변경 파일, 검증 명령, 종료 코드 등을 통해 AI의 코드 누락이나 검증 미비 사항을 잡아내는 가벼운 게이트 역할을 합니다.
핵심 포인트
- Codex 등 AI 에이전트의 작업 완료 여부를 검증하는 도구
- 변경 파일, 종료 코드, 최근 출력 등을 포함한 '영수증' 생성
- TODO 누락, 검증 미비, 예외 처리 오류 등 AI의 실수 포착
- 린터나 테스트 프레임워크 전 단계의 가벼운 검증 게이트
저는 AI 코딩 에이전트를 위한 의존성 없는(zero-dependency) 아주 작은 완료 증명(proof-of-done) 게이트인 DoneCheck를 구축했습니다.
Codex 또는 다른 OpenAI 기반 코딩 에이전트가 "완료(done)"라고 말할 때, DoneCheck는 증거를 남기도록 만듭니다: 스캔된 변경 파일, 검증 명령(verification command), 종료 코드(exit code), 최근 출력, 그리고 DONECHECK 영수증입니다. 또한 TODO 자리 표시자(placeholders), 검증 누락, 오래된 영수증, 그리고 삼켜진 예외(swallowed exceptions)와 같은 명백한 AI 코드 누락 사항을 잡아냅니다.
GitHub에서 설치:
bash pipx install git+https://github.com/AtharvaMaik/donecheck donecheck --cmd "pytest -q"
저장소(Repo): https://github.com/AtharvaMaik/donecheck
이것은 린터(linter)나 테스트 프레임워크가 아닙니다. 에이전트, PR(Pull Request), 또는 CI(Continuous Integration) 실행이 작업이 완료되었다고 주장하기 전에 거치는 저렴한 첫 번째 게이트입니다.
submitted by /u/Clashking666 to r/OpenAI
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/OpenAI Codex (search)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기