AutoTrainess: 언어 모델이 스스로 언어 모델을 개선하도록 가르치기

프런티어 언어 모델 (LM) 에이전트들이 소프트웨어 엔지니어링 및 기타 장기적 과업 (long-horizon tasks)에서 점점 더 유능해지고 있음에도 불구하고, 언어 모델 (LMs)을 학습시키는 것은 여전히 매우 많은 인력을 필요로 하는 과정입니다. 핵심적인 과제는 자율적인 사후 학습 (post-training)이 단순히 코딩 문제만이 아니라는 점입니다. 이는 에이전트가 반복적으로 반복 주기 (iterations)를 계획하고, 벤치마크에 부합하는 데이터를 구축하며, 안정적인 학습 작업 (training jobs)을 실행하고, 체크포인트 (checkpoints)를 평가하며, 수 시간에 걸친 상호작용 동안 실험 상태를 유지할 것을 요구합니다. 우리는 계획, 데이터 준비, 학습, 평가 및 로깅을 위한 에이전트-컴퓨터 인터페이스 (agent-computer interfaces) 저장소로서 이러한 작업들을 노출하는 LM 에이전트인 AutoTrainess를 제시합니다. 에이전트가 불충분하게 정의된 액션 공간 (action space)을 가진 가공되지 않은 CLI 환경에서 작동하도록 내버려 두는 대신, AutoTrainess는 이전의 인간 경험을 명시적인 워크플로 (workflows), 규칙 및 실행 제약 조건으로 외재화하여 에이전트가 효과적이고 신뢰할 수 있는 학습 동작을 수행하도록 안내합니다. PostTrainBench에서 AutoTrainess는 CLI 전용 베이스라인 (baselines)을 지속적으로 능가하며, GPT-5.4 (Codex)를 사용하여 CLI 전용의 23.21점 대비 26.94점의 평균 점수를 달성했습니다. 또한 모델과 하네스 (harnesses) 전반에 걸쳐 일반화 성능을 보이며, DeepSeek-V4-Flash (OpenCode)의 점수를 12.13에서 19.58로 향상시켰습니다.

Insights

AutoTrainess: 언어 모델이 스스로 언어 모델을 개선하도록 가르치기

요약

핵심 포인트

댓글

AI 에이전트가 코드베이스에 매몰되지 않도록 방지하는 "Context OS"를 구축했습니다

AI 파일럿이 프로덕션 단계로 넘어가기 전에 중단되는 이유

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들

AI 파일럿이 프로덕션 단계로 넘어가기 전에 중단되는 이유

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들