llama.cpp헤드라인2026. 05. 05. 06:05

b9019

요약

본 릴리스는 llama.cpp 프로젝트의 v0.0.27 업데이트로, 모델 구조 정의 개선과 빌드 시스템 전반에 걸친 대대적인 최적화가 이루어졌습니다. 주요 변경 사항으로는 `load_hparams` 및 `load_tensors` 함수의 위치 조정, git 친화적인 마이그레이션 추가, 그리고 CMake를 통한 구형 코드 제거 등이 포함됩니다. 이 버전은 macOS(Apple Silicon/Intel), Linux(CPU, Vulkan, ROCm, OpenVINO 등 다양한 백엔드 지원), Android, Windows(CUDA 12/13, Vulkan, SYCL, HIP), openEuler 등 광범위한 플랫폼과 아키텍처를 지원합니다.

핵심 포인트

모델 구조 정의(`model` 정의)가 개선되어 `load_hparams`와 `load_tensors`의 위치가 조정되었습니다.
빌드 시스템이 대폭 업데이트되어 CMake 기반으로 구형 코드 및 미사용 파라미터가 제거되었으며, 빌드 오류 자동 제거 기능이 추가되었습니다.
다양한 하드웨어 가속기 지원을 강화했습니다. 특히 Windows에서 CUDA 12/13, Vulkan, SYCL, HIP를 지원하며, Linux에서는 ROCm, OpenVINO 등 다양한 백엔드를 포함합니다.
macOS, iOS, Android, Windows, Linux, openEuler 등 광범위한 운영체제 및 아키텍처에 대한 빌드 환경을 제공하여 호환성을 극대화했습니다.

본 릴리스는 llama.cpp 프로젝트의 주요 업데이트를 담고 있습니다.

주요 변경 사항:

model 정의에 load_hparams 와 load_tensors 를 이동 ( #22004 )
git-friendly 마이그레이션 추가
build_graph nits 추가
구형 코드에서 빌드 제외
WIP: llm_arch_model_i 준비 및 하류 함수 추가
create_tensor_qkv 복원
누락된 include 파일 수정
단일 llm_build 아키텍처 강제
CMake: 미사용 모델 파라미터 구형 코드 제거

빌드 환경:

macOS Apple Silicon (arm64)
macOS Apple Silicon (arm64, KleidiAI 활성화)
macOS Intel (x64)
iOS XCFramework
Linux:
- Ubuntu x64 (CPU)
- Ubuntu arm64 (CPU)
- Ubuntu s390x (CPU)
- Ubuntu x64 (Vulkan)
- Ubuntu arm64 (Vulkan)
- Ubuntu x64 (ROCm 7.2)
- Ubuntu x64 (OpenVINO)
- Ubuntu x64 (SYCL FP32)
- Ubuntu x64 (SYCL FP16)
Android: Android arm64 (CPU)
Windows:
- Windows x64 (CPU)
- Windows arm64 (CPU)
- Windows x64 (CUDA 12) - CUDA 12.4 DLLs
- Windows x64 (CUDA 13) - CUDA 13.1 DLLs
- Windows x64 (Vulkan)
- Windows x64 (SYCL)
- Windows x64 (HIP)
openEuler:
- openEuler x86 (310p)
- openEuler x86 (910b, ACL Graph)
- openEuler aarch64 (310p)
- openEuler aarch64 (910b, ACL Graph)

추가 작업:

switch case 개선 및 하류 코드 이동
llama_model_base LLAMA_LOAD_LOCALS 순서 수정
빌드 오류 자동 제거
마이그레이션 스크립트 및 ifdef macOS/iOS 제거

AI 자동 생성 콘텐츠

원문 바로가기

b9019

요약

핵심 포인트

댓글