본문으로 건너뛰기

© 2026 Molayo

GitHub헤드라인2026. 06. 25. 11:27

## 변경된 내용 - launch: [@hoyyeva]가 [#15434](https://github.com/ollama/ollama/pull

요약

Ollama의 최신 업데이트 내역으로, Claude Code 자동 설치 지원 및 opencode의 thinking 기능 감지 기능이 추가되었습니다. 또한 추측 디코딩(speculative decoding) 통합과 Windows 환경에서의 Vulkan 및 CUDA 관련 최적화가 포함되었습니다.

핵심 포인트

  • Claude Code 및 opencode 자동 설치 기능 지원
  • 추측 디코딩(speculative decoding) 통합 및 튜닝
  • Windows 환경의 Vulkan 및 CUDA 아키텍처 최적화
  • 모델 드리프트 감지 및 프로젝트 메모리 오프로드 지원

변경된 내용

  • launch: [@hoyyeva]가 #15434에서 opencode에 생각(thinking) 기능 감지 추가

  • launch: [@hoyyeva]가 #16802에서 Claude Code 자동 설치

  • launch: [@hoyyeva]가 #16806에서 누락 시 opencode 자동 설치

  • discover: [@Sahil170595]가 #16669에서 Windows 하이브리드 그래픽의 뒤집힌 iGPU/dGPU Vulkan 분류 문제 수정

  • mlxrunner: [@jessegross]가 #16791에서 추측 디코딩(speculative decoding) 통합 및 튜닝

  • launch/codex: [@BruceMacD]가 #16864에서 Codex App UI 전환 시 모델 드리프트 감지

  • llama: [@anishesg]가 #16834에서 cuda_v13_windows 프리셋에 sm_86 아키텍처 추가

  • llm: [@dhiltgen]가 #16866에서 프로젝트 메모리(projector memory)를 통한 mmproj 오프로드 지원

  • docs: [@ParthSareen]가 #16877에서 최대 생각 레벨 문서화

  • llm: [@ParthSareen]가 #16856에서 이동된 프롬프트(shifted prompts)를 위한 생성 헤드룸 보존

  • llama: [@dhiltgen]가 #16868에서 기본 qwen2.5vl 윈도우 어텐션 메타데이터 설정

  • llm: [@dhiltgen]가 #16869에서 Windows용 호스트 Vulkan 로더 사용

  • mlx: @dhiltgen에 의해 CUDA JIT 패키징 업데이트 및 수정 #16871

  • llm: @discobot에 의해 부분 오프로드 (partial offload) 시 ollama ps가 mmap된 가중치를 중복 계산하는 문제 수정 #16709

  • docs: @hoyyeva에 의해 문서 랜딩 페이지 및 통합 개요 (integrations overview) 재설계 #16807

  • server: @dhiltgen에 의해 generate를 네이티브 채팅 템플릿 (native chat templates)과 일치시킴 #16878

  • jetson: @dhiltgen에 의해 CUDA v13을 위한 CC 87 추가 #16628

  • llama.cpp 버전 업데이트 @dhiltgen #16548

새로운 기여자

전체 변경 사항 (Full Changelog): v0.30.10...v0.30.11-rc0

AI 자동 생성 콘텐츠

본 콘텐츠는 RSS: GitHub ollama/ollama releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0