Ollama헤드라인2026. 05. 22. 01:38

이번 Ollama 버전은 GGML을 기반으로 구축하는 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며, GGUF 파일 형식과의 호환

요약

Ollama가 GGML 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며 GGUF 형식과 호환됩니다. Apple Silicon 가속을 위해 MLX를 도입하였으며, 현재 프리릴리스 단계에서 성능 및 메모리 피드백을 수집 중입니다.

핵심 포인트

llama.cpp 직접 지원 및 GGUF 파일 호환성 확보
Apple Silicon 추론 가속을 위한 MLX 도입
laguna-xs.2 및 llama3.2-vision 지원 미비
성능, 오류, 메모리 사용량에 대한 피드백 요청

이번 Ollama 버전은 GGML을 기반으로 구축하는 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며, GGUF 파일 형식과의 호환성을 허용합니다. Apple Silicon에서 모델 추론 (Inference)을 가속화하기 위해 MLX가 사용됩니다. 프리릴리스 (Pre-release) 단계 동안 다음과 같은 사항에 대한 피드백을 부탁드립니다:

성능 향상 또는 저하
이전에 발생하지 않았던 오류 또는 충돌
메모리 사용량 향상 또는 저하

알려진 문제:

laguna-xs.2는 아직 이 프리릴리스에서 지원되지 않습니다.
llama3.2-vision은 아직 이 프리릴리스에서 지원되지 않습니다.

설치 방법:
Mac/Linux
curl -fsSL https://ollama.com/install.sh | OLLAMA_VERSION=0.30.0-rc21 sh

Windows
$env:OLLAMA_VERSION="0.30.0-rc21"; irm https://ollama.com/install.ps1 | iex

AI 자동 생성 콘텐츠

원문 바로가기

이번 Ollama 버전은 GGML을 기반으로 구축하는 대신 llama.cpp를 직접 지원하도록 아키텍처를 변경하며, GGUF 파일 형식과의 호환

요약

핵심 포인트

댓글