llama.cpp헤드라인2026. 05. 19. 10:02

llama.cpp b9221 릴리스: ggml-hexagon PAD 연산 HVX 커널 추가 및 플랫폼 지원 업데이트

요약

llama.cpp b9221 릴리스에서는 Hexagon HTP 백엔드를 위한 HVX 벡터화 커널 기반의 PAD 연산 지원이 추가되었습니다. 이를 통해 제로 패딩 및 순환 패딩을 4개 텐서 차원 전체에서 지원하며, macOS, Linux, Android, Windows, openEuler 등 다양한 플랫폼에 대한 지원 업데이트가 포함되었습니다.

핵심 포인트

Hexagon HTP 백엔드에서 HVX 벡터화 커널을 사용한 GGML_OP_PAD 구현
4개 텐서 차원에 대한 제로 패딩 및 순환 패딩 지원
macOS(Apple Silicon/Intel), Linux, Android, Windows, openEuler 등 광범위한 플랫폼 지원 업데이트
hex-ggml 중복 연산 케이스 제거 및 hex-pad 매크로 정렬 수정

ggml-hexagon: PAD 연산 HVX 커널 추가 ( #23078 )

ggml-hexagon: PAD 연산 HVX 커널 추가

Hexagon HTP 백엔드에서 HVX 벡터화 커널 (vectorized kernels)을 사용하여 GGML_OP_PAD를 구현합니다. 4개 텐서 차원 전체에 대해 제로 패딩 (zero-padding) 및 순환 패딩 (circular padding)을 지원합니다.

hex-ggml: 중복된 연산 케이스 제거 (병합 충돌 해결)
hex-pad: editorconfig 체크 및 매크로 정렬 수정

Co-authored-by: Max Krasnyansky maxk@qti.qualcomm.com

macOS/iOS:

macOS Apple Silicon (arm64)
macOS Apple Silicon (arm64, KleidiAI 활성화)
macOS Intel (x64)
iOS XCFramework

Linux:

Ubuntu x64 (CPU)
Ubuntu arm64 (CPU)
Ubuntu s390x (CPU)
Ubuntu x64 (Vulkan)
Ubuntu arm64 (Vulkan)
Ubuntu x64 (ROCm 7.2)
Ubuntu x64 (OpenVINO)
Ubuntu x64 (SYCL FP32)
Ubuntu x64 (SYCL FP16)

Android:

Android arm64 (CPU)

Windows:

Windows x64 (CPU)
Windows arm64 (CPU)
Windows x64 (CUDA 12) - CUDA 12.4 DLLs
Windows x64 (CUDA 13) - CUDA 13.1 DLLs
Windows x64 (Vulkan)
Windows x64 (SYCL)
Windows x64 (HIP)

openEuler:

openEuler x86 (310p)
openEuler x86 (910b, ACL Graph)
openEuler aarch64 (310p)
openEuler aarch64 (910b, ACL Graph)

AI 자동 생성 콘텐츠

원문 바로가기

llama.cpp b9221 릴리스: ggml-hexagon PAD 연산 HVX 커널 추가 및 플랫폼 지원 업데이트

요약

핵심 포인트

댓글