llama.cpp헤드라인2026. 05. 02. 08:05

b8999

요약

이 기술 기사는 llama-quant 프로젝트의 주요 업데이트 및 수정 사항을 다루고 있습니다. 특히 `--tensor-type` 관련 기능 개선과 기본 양자화 타입(qtype) 오버라이드 처리 로직에 대한 수정을 포함합니다. 또한, macOS, Linux, Android, Windows, openEuler 등 광범위한 다양한 아키텍처와 프레임워크(CUDA, ROCm, Vulkan, OpenVINO, SYCL 등)를 지원하는 빌드 목록을 제공하며 프로젝트의 포괄적인 호환성을 강조하고 있습니다.

핵심 포인트

`llama-quant`에서 `--tensor-type` 관련 기능 개선 및 기본 `qtype` 오버라이드 로직 수정이 이루어졌습니다.
macOS (Apple Silicon, Intel), Linux (다양한 CPU/GPU 백엔드 포함), Android, Windows, openEuler 등 광범위한 플랫폼을 지원합니다.
CUDA 12/13, ROCm 7.2, Vulkan, OpenVINO, SYCL, HIP 등 최신 하드웨어 및 소프트웨어 가속화 기술 스택에 대한 포괄적인 호환성을 확보했습니다.

llama-quant: --tensor-type 수정 (기본 qtype 이 오버라이드될 때, #22572)
#22544 수정 (내 실수!)
@Anai-Guo 님께 감사드립니다. ref #22559 - 해당 이슈는 새로운 기여자 정책으로 인해 닫혔으므로, 여기에서 PR 을 다시 제출하는 것을 허락받습니다.

macOS/iOS:

macOS Apple Silicon (arm64)
macOS Apple Silicon (arm64, KleidiAI 활성화됨)
macOS Intel (x64)
iOS XCFramework

Linux:

Ubuntu x64 (CPU)
Ubuntu arm64 (CPU)
Ubuntu s390x (CPU)
Ubuntu x64 (Vulkan)
Ubuntu arm64 (Vulkan)
Ubuntu x64 (ROCm 7.2)
Ubuntu x64 (OpenVINO)
Ubuntu x64 (SYCL FP32)
Ubuntu x64 (SYCL FP16)

Android:

Android arm64 (CPU)

Windows:

Windows x64 (CPU)
Windows arm64 (CPU)
Windows x64 (CUDA 12) - CUDA 12.4 DLLs
Windows x64 (CUDA 13) - CUDA 13.1 DLLs
Windows x64 (Vulkan)
Windows x64 (SYCL)
Windows x64 (HIP)

openEuler:

openEuler x86 (310p)
openEuler x86 (910b, ACL Graph)
openEuler aarch64 (310p)
openEuler aarch64 (910b, ACL Graph)

AI 자동 생성 콘텐츠

원문 바로가기

b8999

요약

핵심 포인트

댓글