GitHub헤드라인2026. 06. 26. 16:28

## 변경 사항 - launch: [@hoyyeva](https://github.com/hoyyeva)가 [#15434](https://gi

요약

Ollama의 최신 업데이트 내역으로, Claude Code 자동 설치 기능과 opencode의 사고(thinking) 능력 감지 기능이 추가되었습니다. 또한 추측 디코딩(speculative decoding) 통합 및 Windows 환경의 Vulkan 관련 버그 수정 등 다양한 성능 개선이 포함되었습니다.

핵심 포인트

Claude Code 및 opencode 자동 설치 기능 지원
opencode 내 사고(thinking) 능력 감지 기능 추가
추측 디코딩(speculative decoding) 통합 및 조정
Windows 환경의 iGPU/dGPU Vulkan 분류 문제 수정
모델 드리프트 감지 및 메모리 오프로드 처리 개선

변경 사항

launch: @hoyyeva가 #15434에서 opencode에 사고(thinking) 능력 감지 기능을 추가함
launch: @hoyyeva가 #16802에서 Claude Code 자동 설치 기능을 추가함
launch: @hoyyeva가 #16806에서 누락 시 opencode 자동 설치 기능을 추가함
discover: @Sahil170595가 #16669에서 Windows 하이브리드 그래픽의 반전된 iGPU/dGPU Vulkan 분류 문제를 수정함
mlxrunner: @jessegross가 #16791에서 추측 디코딩(speculative decoding)을 통합하고 조정함
launch/codex: @BruceMacD가 #16864에서 Codex App UI 전환 시 모델 드리프트(model drift)를 감지하도록 함
llama: @anishesg가 #16834에서 cuda_v13_windows 프리셋에 sm_86 아키텍처를 추가함
llm: @dhiltgen가 #16866에서 프로젝트 메모리(projector memory)로 mmproj 오프로드를 처리함
docs: @ParthSareen가 #16877에서 최대 사고 레벨(max think level)을 문서화함
llm: @ParthSareen가 #16856에서 시프트된 프롬프트(shifted prompts)를 위해 생성 헤드룸을 유지함
llama: @dhiltgen가 #16868에서 기본 qwen2.5vl 윈도우 어텐션 메타데이터를 설정함
llm: @dhiltgen가 #16869에서 Windows에서 호스트 Vulkan 로더를 사용하도록 함
mlx: @dhiltgen이 #16871에서 CUDA JIT 패키징 업데이트 및 수정
llm: @discobot이 #16709에서 부분 오프로드 (partial offload) 시 ollama ps가 mmap된 가중치를 중복 계산하는 문제 수정
docs: @hoyyeva가 #16807에서 문서 랜딩 페이지 및 통합 개요 (integrations overview) 재설계
server: @dhiltgen이 #16878에서 generate를 네이티브 채팅 템플릿 (native chat templates)과 일치시킴
jetson: @dhiltgen이 #16628에서 CUDA v13을 위한 CC 87 추가
llama.cpp 버전 업데이트를 @dhiltgen이 #16548에서 수행

새로운 기여자

@Sahil170595가 #16669에서 첫 기여를 했습니다.
@anishesg가 #16834에서 첫 기여를 했습니다.
@discobot이 #16709에서 첫 기여를 했습니다.

전체 변경 로그 (Full Changelog): v0.30.10...v0.30.11-rc0

AI 자동 생성 콘텐츠

원문 바로가기

## 변경 사항 - launch: [@hoyyeva](https://github.com/hoyyeva)가 [#15434](https://gi

요약

핵심 포인트

변경 사항

새로운 기여자

댓글