Reddit요약2026. 06. 23. 03:36

DoneCheck: Codex 에이전트를 위한 완료 증명(proof-of-done) 영수증

요약

AI 코딩 에이전트가 작업을 완료했다고 주장할 때, 실제 수행 결과에 대한 증거를 검증하는 DoneCheck를 소개합니다. 변경 파일, 검증 명령, 종료 코드 등을 통해 AI의 코드 누락이나 검증 미비 사항을 잡아내는 가벼운 게이트 역할을 합니다.

핵심 포인트

Codex 등 AI 에이전트의 작업 완료 여부를 검증하는 도구
변경 파일, 종료 코드, 최근 출력 등을 포함한 '영수증' 생성
TODO 누락, 검증 미비, 예외 처리 오류 등 AI의 실수 포착
린터나 테스트 프레임워크 전 단계의 가벼운 검증 게이트

저는 AI 코딩 에이전트를 위한 의존성 없는(zero-dependency) 아주 작은 완료 증명(proof-of-done) 게이트인 DoneCheck를 구축했습니다.

Codex 또는 다른 OpenAI 기반 코딩 에이전트가 "완료(done)"라고 말할 때, DoneCheck는 증거를 남기도록 만듭니다: 스캔된 변경 파일, 검증 명령(verification command), 종료 코드(exit code), 최근 출력, 그리고 DONECHECK 영수증입니다. 또한 TODO 자리 표시자(placeholders), 검증 누락, 오래된 영수증, 그리고 삼켜진 예외(swallowed exceptions)와 같은 명백한 AI 코드 누락 사항을 잡아냅니다.

GitHub에서 설치:
bash pipx install git+https://github.com/AtharvaMaik/donecheck donecheck --cmd "pytest -q"

저장소(Repo): https://github.com/AtharvaMaik/donecheck

이것은 린터(linter)나 테스트 프레임워크가 아닙니다. 에이전트, PR(Pull Request), 또는 CI(Continuous Integration) 실행이 작업이 완료되었다고 주장하기 전에 거치는 저렴한 첫 번째 게이트입니다.
submitted by /u/Clashking666 to r/OpenAI
[link] [comments]

AI 자동 생성 콘텐츠

원문 바로가기

DoneCheck: Codex 에이전트를 위한 완료 증명(proof-of-done) 영수증

요약

핵심 포인트

댓글