llama.cpp헤드라인2026. 05. 06. 21:47

ggml-cpu: CPU 백엔드에서 RMS_NORM + MUL 병합 ( #22423 )

요약

ggml-cpu 프로젝트는 CPU 백엔드에서 RMS_NORM과 MUL 연산을 병합하여 성능을 최적화했습니다. 이 업데이트를 통해 macOS(Apple Silicon 및 Intel), Linux(다양한 아키텍처 및 API 지원 포함), Android, Windows, openEuler 등 광범위한 플랫폼에 걸쳐 다양한 하드웨어 가속기 및 CPU 환경에서 개선된 효율성을 제공합니다.

핵심 포인트

CPU 백엔드의 RMS_NORM + MUL 연산 병합을 통해 성능 최적화가 이루어졌습니다.
macOS, Linux, Android, Windows 등 주요 운영체제와 다양한 아키텍처(x64, arm64)를 지원합니다.
CUDA, Vulkan, ROCm, OpenVINO, SYCL, HIP 등 광범위한 하드웨어 가속 및 컴퓨팅 API를 포괄적으로 지원합니다.
Apple Silicon (arm64), Intel x64, 그리고 다양한 리눅스 아키텍처(s390x 포함)에 대한 빌드가 제공됩니다.

ggml-cpu: CPU 백엔드에서 RMS_NORM + MUL 연산 병합
macOS/iOS:

macOS Apple Silicon (arm64)
macOS Apple Silicon (arm64, KleidiAI 활성화됨)
macOS Intel (x64)
iOS XCFramework
Linux:
Ubuntu x64 (CPU)
Ubuntu arm64 (CPU)
Ubuntu s390x (CPU)
Ubuntu x64 (Vulkan)
Ubuntu arm64 (Vulkan)
Ubuntu x64 (ROCm 7.2)
Ubuntu x64 (OpenVINO)
Ubuntu x64 (SYCL FP32)
Ubuntu x64 (SYCL FP16)
Android:
Android arm64 (CPU)
Windows:
Windows x64 (CPU)
Windows arm64 (CPU)
Windows x64 (CUDA 12) - CUDA 12.4 DLLs
Windows x64 (CUDA 13) - CUDA 13.1 DLLs
Windows x64 (Vulkan)
Windows x64 (SYCL)
Windows x64 (HIP)
openEuler:
openEuler x86 (310p)
openEuler x86 (910b, ACL Graph)
openEuler aarch64 (310p)
openEuler aarch64 (910b, ACL Graph)

AI 자동 생성 콘텐츠

원문 바로가기

ggml-cpu: CPU 백엔드에서 RMS_NORM + MUL 병합 ( #22423 )

요약

핵심 포인트

댓글