Ollama의 이번 버전은 GGML 위에 구축하는 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며, GGUF 파일 형식과의 호환성을
요약
Ollama가 GGML 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하여 GGUF 파일 형식과 호환됩니다. 또한 Apple Silicon의 추론 가속을 위해 MLX를 도입했습니다.
핵심 포인트
- llama.cpp 직접 지원을 통한 GGUF 호환성 확보
- Apple Silicon 가속을 위한 MLX 도입
- 사전 출시 버전으로서 성능 및 메모리 피드백 요청
Ollama의 이번 버전은 GGML 위에 구축하는 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며, GGUF 파일 형식과의 호환성을 허용합니다. Apple Silicon에서 모델 추론 (Inference)을 가속화하기 위해 MLX가 사용됩니다.
사전 출시 (Pre-release) 단계 동안 다음과 같은 사항에 대한 피드백을 환영합니다:
- 성능 향상 또는 저하
- 이전에 발생하지 않았던 오류 또는 충돌
- 메모리 사용량 (Memory utilization) 향상 또는 저하
알려진 문제 (Known issues):
laguna-xs.2는 아직 이 사전 출시 버전에서 지원되지 않습니다.llama3.2-vision은 아직 이 사전 출시 버전에서 지원되지 않습니다.
설치 방법 (Installing):
Mac/Linux
curl -fsSL https://ollama.com/install.sh | OLLAMA_VERSION=0.30.0-rc23 sh
Windows
$env:OLLAMA_VERSION="0.30.0-rc23"; irm https://ollama.com/install.ps1 | iex
AI 자동 생성 콘텐츠
본 콘텐츠는 RSS: GitHub ollama/ollama releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기