이번 Ollama 버전은 GGML을 기반으로 구축하는 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며, GGUF 파일 형식과의 호환
요약
Ollama가 GGML 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며 GGUF 형식과 호환됩니다. Apple Silicon 가속을 위해 MLX를 도입하였으며, 현재 프리릴리스 단계에서 성능 및 메모리 피드백을 수집 중입니다.
핵심 포인트
- llama.cpp 직접 지원 및 GGUF 파일 호환성 확보
- Apple Silicon 추론 가속을 위한 MLX 도입
- laguna-xs.2 및 llama3.2-vision 지원 미비
- 성능, 오류, 메모리 사용량에 대한 피드백 요청
이번 Ollama 버전은 GGML을 기반으로 구축하는 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며, GGUF 파일 형식과의 호환성을 허용합니다. Apple Silicon에서 모델 추론 (Inference)을 가속화하기 위해 MLX가 사용됩니다. 프리릴리스 (Pre-release) 단계 동안 다음과 같은 사항에 대한 피드백을 부탁드립니다:
- 성능 향상 또는 저하
- 이전에 발생하지 않았던 오류 또는 충돌
- 메모리 사용량 향상 또는 저하
알려진 문제:
- laguna-xs.2는 아직 이 프리릴리스에서 지원되지 않습니다.
- llama3.2-vision은 아직 이 프리릴리스에서 지원되지 않습니다.
설치 방법:
Mac/Linux
curl -fsSL https://ollama.com/install.sh | OLLAMA_VERSION=0.30.0-rc21 sh
Windows
$env:OLLAMA_VERSION="0.30.0-rc21"; irm https://ollama.com/install.ps1 | iex
AI 자동 생성 콘텐츠
본 콘텐츠는 Ollama Releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기