본문으로 건너뛰기

© 2026 Molayo

HN요약2026. 05. 20. 13:22

Show HN: 다음 편집 자동 완성을 위한 오픈 웨이트 (Open-weights) 1.5B 모델, Sweep

요약

Sweep Next-Edit는 사용자의 다음 코드 편집을 예측하는 1.5B 파라미터 규모의 오픈 웨이트 모델입니다. Qwen2.5-Coder를 베이스로 하며, 추측 디코딩을 통해 로컬 환경에서 500ms 미만의 빠른 속도로 실행되면서도 대형 모델 대비 뛰어난 성능을 보여줍니다.

핵심 포인트

  • 사용자의 다음 편집 동작을 예측하여 개발 워크플로우를 가속화함
  • 1.5B 파라미터의 경량 모델로 로컬 노트북에서도 매우 빠른 실행 속도 제공
  • Q8_0 GGUF 양자화 형식을 지원하며 8192 토큰의 컨텍스트 길이를 가짐
  • 파일 컨텍스트, 최근 diff, 현재 상태를 활용하는 특화된 프롬프트 형식 사용
  • Apache 2.0 라이선스로 제공되는 오픈 웨이트 모델

Q8_0 GGUF 형식으로 양자화된(quantized) 다음 편집 자동 완성용 1.5B 파라미터 모델입니다.

Sweep Next-Edit는 사용자가 편집을 수행하기 전에 다음 코드 편집을 예측합니다. 이 모델은 (추측 디코딩 (speculative decoding)을 통해) 노트북에서 500ms 미만으로 로컬 실행되며, 다음 편집 벤치마크에서 자기보다 4배 이상 큰 모델들보다 뛰어난 성능을 보여줍니다. 자세한 내용은 여기서 확인하세요.

run_model.py와 모델 파일을 다운로드한 후, 다음을 실행하세요:

uv pip install llama-cpp-python huggingface_hub
python run_model.py

형식 (Format): GGUF (Q8_0 양자화 (quantization))
파라미터 (Parameters): 1.5B
컨텍스트 길이 (Context Length): 8192 토큰 (tokens)
베이스 모델 (Base Model): Qwen2.5-Coder

이 모델은 파일 컨텍스트 (file context), 최근 디프 (recent diffs), 그리고 현재 상태를 포함한 특정 프롬프트 형식을 사용하여 다음 편집을 예측합니다. 전체 예시는 run_model.py를 참조하세요.

  • 블로그 포스트 (Blog Post) - 기술적 세부 사항 및 벤치마크
  • JetBrains 플러그인 (JetBrains Plugin) - Sweep AI JetBrains 플러그인
  • HN 스레드 (HN Thread) - VSCode, Neovim 및 Emacs 구현에 대한 논의
  • 트위터 포스트 (Twitter Post) - 기타 질문하기

Apache 2.0

  • 지난달 다운로드 수
  • 1,298

AI 자동 생성 콘텐츠

본 콘텐츠는 HN Code Generation의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0