Kimi-Dev-72B 공개: 소프트웨어 엔지니어링을 위한 새로운 LLM
요약
Moonshot AI가 소프트웨어 엔지니어링에 특화된 오픈소스 LLM인 Kimi-Dev-72B를 공개했습니다. 이 모델은 SWE-bench Verified에서 오픈소스 모델 중 최고 성능을 기록했으며, 대규모 강화학습을 통해 최적화되었습니다.
핵심 포인트
- SWE-bench Verified에서 60.4% 달성하며 오픈소스 SOTA 기록
- Docker 환경 내 자율 패치 및 테스트 통과 기반의 강화학습 적용
- 파일 위치 파악 및 코드 편집의 2단계 프레임워크 채택
- Hugging Face와 GitHub을 통해 모델 및 코드 배포
소프트웨어 엔지니어링 작업을 위한 당사의 새로운 오픈소스 코딩 LLM인 Kimi-Dev-72B를 소개합니다. Kimi-Dev-72B는 open-source 모델 중 SWE-bench Verified에서 새로운 state-of-the-art(최신 기술 수준)를 달성했습니다.
Kimi-Dev-72B는 SWE-bench Verified에서 60.4%의 성능을 달성했습니다. 이는 준우승 기록을 뛰어넘으며 open-source 모델 중 새로운 state-of-the-art 결과를 설정한 것입니다.
Kimi-Dev-72B는 대규모 강화학습(RL)을 통해 최적화되었습니다. Docker 환경에서 실제 저장소에 자율적으로 패치하고, 전체 테스트 스위트가 통과할 때만 보상을 얻습니다. 이를 통해 실제 개발 표준에 부합하는 정확하고 견고한 솔루션을 보장합니다.
Kimi-Dev-72B는 Hugging Face와 GitHub에서 다운로드 및 배포가 가능합니다. 개발자와 연구원 여러분이 그 기능을 탐색하고 개발에 기여해 주시기를 환영합니다.
# repo 클론
git clone https://github.com/MoonshotAI/Kimi-Dev.git
# 환경 설정
...
벤치마크의 각 이슈(SWE-Bench Lite 및 SWE-Bench Verified 모두)에 대해 저장소를 체크아웃하고 파일을 처리해야 하므로, 미리 처리된 데이터인 swebench_repo_structure.zip을 여기서 다운로드하여 시간을 절약할 수 있습니다. 다운로드 후 압축을 풀고 다음 위치로 환경 변수를 설정해 주세요.
export PROJECT_FILE_LOC={저장한 폴더}
# CUDA 12.8을 사용하여 vLLM 설치.
# pip를 사용하는 경우.
pip install vllm --extra-index-url https://download.pytorch.org/whl/cu128
...
vllm serve Kimi-Dev-72B --served-model-name kimi-dev --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.95 --max-seq-len-to-capture 131072 --tensor-parallel-size 8
Kimi-Dev는 코드 수정 및 테스트 작성 작업을 처리하기 위해 간소화된 두 단계 프레임워크를 채택했습니다:
파일 위치 파악 (File Localization): 문제 설명과 저장소 구조를 기반으로 수정이 필요한 핵심 파일을 지능적으로 식별합니다.
코드 편집 (Code Editing): 발견된 파일에 버그 수정 또는 단위 테스트 삽입을 포함하여 정밀한 코드 수정을 수행합니다.
다단계 로컬라이제이션 (localization) 방식과 비교하여, 저희는 파일 수준에서 로컬라이제이션을 수행한 다음 전체 파일을 수정 (repair) 단계로 전달하여 더욱 상세한 추론 (reasoning)을 수행합니다.
롤아웃 (rollout) 스크립트 실행:
conda activate kimidev
# Bugfixer
python kimidev/examples/rollout_messages_bugfixer.py --model_name {vllm_serve_model}
...
저희는 이곳에 몇 가지 예시 결과 파일과 테스트 시간 스케일링 (test-time scaling)에 필요한 파일들을 제공합니다.
또한 이 파일들은 Google Drive에서 다운로드할 수 있습니다.
프로젝트 개선을 돕기 위해 Pull Request를 제출하거나 Issue를 생성하는 것을 환영합니다.
질문이 있으시면 언제든지 GitHub issue를 제출하거나 zhuhan@moonshot.cn으로 문의해 주세요.
저희의 코드와 모델이 유용하다고 생각되신다면, 다음 정보를 인용해 주시기 바랍니다.
@misc{yang2025kimidevagentlesstrainingskill,
title={Kimi-Dev: Agentless Training as Skill Prior for SWE-Agents},
author={Zonghan Yang and Shengjie Wang and Kelin Fu and Wenyang He and Weimin Xiong and Yibo Liu and Yibo Miao and Bofei Gao and Yejie Wang and Yingwei Ma and Yanhao Li and Yue Liu and Zhenxing Hu and Kaitai Zhang and Shuyi Wang and Huarong Chen and Flood Sung and Yang Liu and Yang Gao and Zhilin Yang and Tianyu Liu},
...
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub AI Coding Assistants의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기