b8962
요약
이 기술 기사는 ggml-webgpu 프로젝트의 업데이트 내용을 담고 있으며, 특히 'ssm_scan' 함수의 버퍼 대역 사용 문제를 해결하고 관련 로직을 리팩토링한 작업에 초점을 맞추고 있습니다. 또한 포맷팅 처리 완료와 함께 macOS, Linux, Android, Windows, openEuler 등 광범위한 플랫폼 및 아키텍처(CPU, GPU 백엔드 포함)를 지원하는 빌드 목록을 제공하여 프로젝트의 높은 호환성과 확장성을 보여줍니다.
핵심 포인트
- ggml-webgpu에서 'ssm_scan' 함수의 버퍼 대역 사용 문제를 해결하고 로직을 리팩토링했습니다.
- 포맷팅(formatting) 처리 기능이 완료되어 사용자 경험 및 데이터 처리가 개선되었습니다.
- macOS, Linux, Android, Windows 등 주요 운영체제와 다양한 아키텍처를 지원합니다.
- CPU 기반 구현 외에도 Vulkan, ROCm, OpenVINO, SYCL, CUDA, HIP 등 광범위한 GPU 백엔드를 지원하여 높은 이식성을 확보했습니다.
ggml-webgpu: ssm_scan 의 버퍼 대역 사용 문제 해결 및 대역 논리 리팩토링 (#22456)
버퍼 대역 사용을 리팩토링하여 셰이더 라이브러리 결정 사항 정리 작업의 일부로 통합했습니다.
포맷팅 (formatting) 처리 완료.
macOS/iOS:
- macOS Apple Silicon (arm64)
- macOS Apple Silicon (arm64, KleidiAI 활성화)
- macOS Intel (x64)
- iOS XCFramework
Linux:
- Ubuntu x64 (CPU)
- Ubuntu arm64 (CPU)
- Ubuntu s390x (CPU)
- Ubuntu x64 (Vulkan)
- Ubuntu arm64 (Vulkan)
- Ubuntu x64 (ROCm 7.2)
- Ubuntu x64 (OpenVINO)
- Ubuntu x64 (SYCL FP32)
- Ubuntu x64 (SYCL FP16)
Android:
- Android arm64 (CPU)
Windows:
- Windows x64 (CPU)
- Windows arm64 (CPU)
- Windows x64 (CUDA 12) - CUDA 12.4 DLLs
- Windows x64 (CUDA 13) - CUDA 13.1 DLLs
- Windows x64 (Vulkan)
- Windows x64 (SYCL)
- Windows x64 (HIP)
openEuler:
- openEuler x86 (310p)
- openEuler x86 (910b, ACL Graph)
- openEuler aarch64 (310p)
- openEuler aarch64 (910b, ACL Graph)
AI 자동 생성 콘텐츠
본 콘텐츠는 llama.cpp Releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기