
Dockerless
요약
Docker 없이 코드를 평가할 수 있는 환경 독립적인 코딩 에이전트용 패치 검증기입니다. 기존 오픈 소스 검증기 대비 뛰어난 성능을 보이며, 강화학습을 통해 SWE-bench Verified에서 62.0%의 높은 성적을 기록했습니다.
핵심 포인트
- Docker 실행 없이도 코드 평가가 가능한 환경 독립적 구조
- 기존 오픈 소스 검증기 대비 14.3 AUC 포인트 높은 성능
- 강화학습(RL) 사후 학습을 통한 성능 최적화
- SWE-bench Verified 벤치마크에서 62.0% 달성
코딩 에이전트(coding agents)를 위한 환경 독립적인 에이전트 기반 패치 검증기(agentic patch verifier).
이 도구는 실행이나 Docker 없이 코드를 평가하며, 가장 강력한 오픈 소스 검증기(open-source verifier)보다 14.3 AUC 포인트 더 높은 성능을 보여줍니다.
완전한 환경 독립적 강화학습 (RL) 사후 학습 (post-training)을 통해 SWE-bench Verified에서 62.0%에 도달했습니다. https://t.co/cX8AtC8lCp
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기