llama.cpp v0.0.27 (b9019) - 모델 구조 개선 및 빌드 시스템 업데이트
요약
본 릴리스는 llama.cpp 프로젝트의 v0.0.27 업데이트로, 모델 구조 정의 개선과 빌드 시스템 전반에 걸친 대대적인 최적화가 이루어졌습니다. 주요 변경 사항으로는 `load_hparams` 및 `load_tensors` 함수의 위치 조정, git 친화적인 마이그레이션 추가, 그리고 CMake를 통한 구형 코드 제거 등이 포함됩니다. 이 버전은 macOS(Apple Silicon/Intel), Linux(CPU, Vulkan, ROCm, OpenVINO 등 다양한 백엔드 지원), Android, Windows(CUDA 12/13, Vulkan, SYCL, HIP), openEuler 등 광범위한 플랫폼과 아키텍처를 지원합니다.
핵심 포인트
- 모델 구조 정의(`model` 정의)가 개선되어 `load_hparams`와 `load_tensors`의 위치가 조정되었습니다.
- 빌드 시스템이 대폭 업데이트되어 CMake 기반으로 구형 코드 및 미사용 파라미터가 제거되었으며, 빌드 오류 자동 제거 기능이 추가되었습니다.
- 다양한 하드웨어 가속기 지원을 강화했습니다. 특히 Windows에서 CUDA 12/13, Vulkan, SYCL, HIP를 지원하며, Linux에서는 ROCm, OpenVINO 등 다양한 백엔드를 포함합니다.
- macOS, iOS, Android, Windows, Linux, openEuler 등 광범위한 운영체제 및 아키텍처에 대한 빌드 환경을 제공하여 호환성을 극대화했습니다.
본 릴리스는 llama.cpp 프로젝트의 주요 업데이트를 담고 있습니다.
주요 변경 사항:
model정의에load_hparams와load_tensors를 이동 ( #22004 )- git-friendly 마이그레이션 추가
build_graphnits 추가- 구형 코드에서 빌드 제외
- WIP:
llm_arch_model_i준비 및 하류 함수 추가 create_tensor_qkv복원- 누락된 include 파일 수정
- 단일
llm_build아키텍처 강제 - CMake: 미사용 모델 파라미터 구형 코드 제거
빌드 환경:
- macOS Apple Silicon (arm64)
- macOS Apple Silicon (arm64, KleidiAI 활성화)
- macOS Intel (x64)
- iOS XCFramework
- Linux:
- Ubuntu x64 (CPU)
- Ubuntu arm64 (CPU)
- Ubuntu s390x (CPU)
- Ubuntu x64 (Vulkan)
- Ubuntu arm64 (Vulkan)
- Ubuntu x64 (ROCm 7.2)
- Ubuntu x64 (OpenVINO)
- Ubuntu x64 (SYCL FP32)
- Ubuntu x64 (SYCL FP16)
- Android: Android arm64 (CPU)
- Windows:
- Windows x64 (CPU)
- Windows arm64 (CPU)
- Windows x64 (CUDA 12) - CUDA 12.4 DLLs
- Windows x64 (CUDA 13) - CUDA 13.1 DLLs
- Windows x64 (Vulkan)
- Windows x64 (SYCL)
- Windows x64 (HIP)
- openEuler:
- openEuler x86 (310p)
- openEuler x86 (910b, ACL Graph)
- openEuler aarch64 (310p)
- openEuler aarch64 (910b, ACL Graph)
추가 작업:
switch case개선 및 하류 코드 이동llama_model_base LLAMA_LOAD_LOCALS순서 수정- 빌드 오류 자동 제거
- 마이그레이션 스크립트 및 ifdef macOS/iOS 제거
AI 자동 생성 콘텐츠
본 콘텐츠는 llama.cpp Releases의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기