본문으로 건너뛰기

© 2026 Molayo

GitHub헤드라인2026. 06. 26. 16:28

## 변경 사항 - launch: [@hoyyeva](https://github.com/hoyyeva)가 [#15434](https://gi

요약

Ollama의 최신 업데이트 내역으로, Claude Code 자동 설치 기능과 opencode의 사고(thinking) 능력 감지 기능이 추가되었습니다. 또한 추측 디코딩(speculative decoding) 통합 및 Windows 환경의 Vulkan 관련 버그 수정 등 다양한 성능 개선이 포함되었습니다.

핵심 포인트

  • Claude Code 및 opencode 자동 설치 기능 지원
  • opencode 내 사고(thinking) 능력 감지 기능 추가
  • 추측 디코딩(speculative decoding) 통합 및 조정
  • Windows 환경의 iGPU/dGPU Vulkan 분류 문제 수정
  • 모델 드리프트 감지 및 메모리 오프로드 처리 개선

변경 사항

  • launch: @hoyyeva#15434에서 opencode에 사고(thinking) 능력 감지 기능을 추가함

  • launch: @hoyyeva#16802에서 Claude Code 자동 설치 기능을 추가함

  • launch: @hoyyeva#16806에서 누락 시 opencode 자동 설치 기능을 추가함

  • discover: @Sahil170595#16669에서 Windows 하이브리드 그래픽의 반전된 iGPU/dGPU Vulkan 분류 문제를 수정함

  • mlxrunner: @jessegross#16791에서 추측 디코딩(speculative decoding)을 통합하고 조정함

  • launch/codex: @BruceMacD#16864에서 Codex App UI 전환 시 모델 드리프트(model drift)를 감지하도록 함

  • llama: @anishesg#16834에서 cuda_v13_windows 프리셋에 sm_86 아키텍처를 추가함

  • llm: @dhiltgen#16866에서 프로젝트 메모리(projector memory)로 mmproj 오프로드를 처리함

  • docs: @ParthSareen#16877에서 최대 사고 레벨(max think level)을 문서화함

  • llm: @ParthSareen#16856에서 시프트된 프롬프트(shifted prompts)를 위해 생성 헤드룸을 유지함

  • llama: @dhiltgen#16868에서 기본 qwen2.5vl 윈도우 어텐션 메타데이터를 설정함

  • llm: @dhiltgen#16869에서 Windows에서 호스트 Vulkan 로더를 사용하도록 함

  • mlx: @dhiltgen#16871에서 CUDA JIT 패키징 업데이트 및 수정

  • llm: @discobot#16709에서 부분 오프로드 (partial offload) 시 ollama ps가 mmap된 가중치를 중복 계산하는 문제 수정

  • docs: @hoyyeva#16807에서 문서 랜딩 페이지 및 통합 개요 (integrations overview) 재설계

  • server: @dhiltgen#16878에서 generate를 네이티브 채팅 템플릿 (native chat templates)과 일치시킴

  • jetson: @dhiltgen#16628에서 CUDA v13을 위한 CC 87 추가

  • llama.cpp 버전 업데이트를 @dhiltgen#16548에서 수행

새로운 기여자

전체 변경 로그 (Full Changelog): v0.30.10...v0.30.11-rc0

AI 자동 생성 콘텐츠

본 콘텐츠는 RSS: GitHub ollama/ollama releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0