GitHub헤드라인2026. 06. 25. 11:27

## 변경된 내용 - launch: [@hoyyeva]가 [#15434](https://github.com/ollama/ollama/pull

요약

Ollama의 최신 업데이트 내역으로, Claude Code 자동 설치 지원 및 opencode의 thinking 기능 감지 기능이 추가되었습니다. 또한 추측 디코딩(speculative decoding) 통합과 Windows 환경에서의 Vulkan 및 CUDA 관련 최적화가 포함되었습니다.

핵심 포인트

Claude Code 및 opencode 자동 설치 기능 지원
추측 디코딩(speculative decoding) 통합 및 튜닝
Windows 환경의 Vulkan 및 CUDA 아키텍처 최적화
모델 드리프트 감지 및 프로젝트 메모리 오프로드 지원

변경된 내용

launch: [@hoyyeva]가 #15434에서 opencode에 생각(thinking) 기능 감지 추가
launch: [@hoyyeva]가 #16802에서 Claude Code 자동 설치
launch: [@hoyyeva]가 #16806에서 누락 시 opencode 자동 설치
discover: [@Sahil170595]가 #16669에서 Windows 하이브리드 그래픽의 뒤집힌 iGPU/dGPU Vulkan 분류 문제 수정
mlxrunner: [@jessegross]가 #16791에서 추측 디코딩(speculative decoding) 통합 및 튜닝
launch/codex: [@BruceMacD]가 #16864에서 Codex App UI 전환 시 모델 드리프트 감지
llama: [@anishesg]가 #16834에서 cuda_v13_windows 프리셋에 sm_86 아키텍처 추가
llm: [@dhiltgen]가 #16866에서 프로젝트 메모리(projector memory)를 통한 mmproj 오프로드 지원
docs: [@ParthSareen]가 #16877에서 최대 생각 레벨 문서화
llm: [@ParthSareen]가 #16856에서 이동된 프롬프트(shifted prompts)를 위한 생성 헤드룸 보존
llama: [@dhiltgen]가 #16868에서 기본 qwen2.5vl 윈도우 어텐션 메타데이터 설정
llm: [@dhiltgen]가 #16869에서 Windows용 호스트 Vulkan 로더 사용
mlx: @dhiltgen에 의해 CUDA JIT 패키징 업데이트 및 수정 #16871
llm: @discobot에 의해 부분 오프로드 (partial offload) 시 ollama ps가 mmap된 가중치를 중복 계산하는 문제 수정 #16709
docs: @hoyyeva에 의해 문서 랜딩 페이지 및 통합 개요 (integrations overview) 재설계 #16807
server: @dhiltgen에 의해 generate를 네이티브 채팅 템플릿 (native chat templates)과 일치시킴 #16878
jetson: @dhiltgen에 의해 CUDA v13을 위한 CC 87 추가 #16628
llama.cpp 버전 업데이트 @dhiltgen #16548

새로운 기여자

@Sahil170595님이 #16669에서 첫 기여를 했습니다.
@anishesg님이 #16834에서 첫 기여를 했습니다.
@discobot님이 #16709에서 첫 기여를 했습니다.

전체 변경 사항 (Full Changelog): v0.30.10...v0.30.11-rc0

AI 자동 생성 콘텐츠

원문 바로가기

## 변경된 내용 - launch: [@hoyyeva]가 [#15434](https://github.com/ollama/ollama/pull

요약

핵심 포인트

변경된 내용

새로운 기여자

댓글