본문으로 건너뛰기

© 2026 Molayo

llama.cpp헤드라인2026. 05. 08. 18:07

b9070

요약

이 기술 기사는 OpenCL을 사용하여 Adreno GPU에 대한 Q4_0 MoE GEMM 및 CLC 패스 검증(sanity check) 기능을 추가한 업데이트 내용을 담고 있습니다. 주요 개선 사항으로는 코드 가독성 향상을 위한 `#if` 블록 분할, 사용하지 않는 `cl_program` 제거, 그리고 전반적인 공백 수정 등이 포함되었습니다. 이 릴리스는 macOS, iOS, Linux, Android, Windows 등 광범위한 플랫폼과 다양한 백엔드(CUDA, Vulkan, SYCL, ROCm 등)를 지원하며, 여러 아키텍처 및 운영체제 환경에 걸쳐 테스트가 이루어졌음을 보여줍니다.

핵심 포인트

  • Adreno GPU용 Q4_0 MoE GEMM 및 CLC 패스 검증 기능 추가
  • OpenCL 코드의 유지보수성 향상 (공백 수정, 불필요한 프로그램 제거, `#if` 블록 분할)
  • macOS, iOS, Linux, Android, Windows 등 광범위한 플랫폼 지원
  • CUDA, Vulkan, SYCL, ROCm 등 다양한 하드웨어 가속 백엔드를 포괄적으로 지원

opencl: Adreno( #22731 ) 에 대한 q4_0 MoE GEMM 추가
Q4_0 MoE CLC pass sanity check release program
opencl: 공백 수정
opencl: 사용하지 않는 cl_program 제거
opencl: 가독성을 높이기 위해 #if 블록 분할
format: Co-authored-by: Li He lih@qti.qualcomm.com
macOS/iOS:
macOS Apple Silicon (arm64)
macOS Apple Silicon (arm64, KleidiAI 활성화됨)
macOS Intel (x64)
iOS XCFramework
Linux:
Ubuntu x64 (CPU)
Ubuntu arm64 (CPU)
Ubuntu s390x (CPU)
Ubuntu x64 (Vulkan)
Ubuntu arm64 (Vulkan)
Ubuntu x64 (ROCm 7.2)
Ubuntu x64 (OpenVINO)
Ubuntu x64 (SYCL FP32)
Ubuntu x64 (SYCL FP16)
Android:
Android arm64 (CPU)
Windows:
Windows x64 (CPU)
Windows arm64 (CPU)
Windows x64 (CUDA 12) - CUDA 12.4 DLLs
Windows x64 (CUDA 13) - CUDA 13.1 DLLs
Windows x64 (Vulkan)
Windows x64 (SYCL)
Windows x64 (HIP)
openEuler:
openEuler x86 (310p)
openEuler x86 (910b, ACL Graph)
openEuler aarch64 (310p)
openEuler aarch64 (910b, ACL Graph)

AI 자동 생성 콘텐츠

본 콘텐츠는 llama.cpp Releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0