llama.cpp헤드라인2026. 05. 26. 08:17

ggml: `gguf_init_from_callback` 및 `gguf_init_from_buffer` ([#22341](https://gith

요약

ggml 라이브러리에 GGUF 모델 로딩을 위한 새로운 함수인 `gguf_init_from_callback` 및 `gguf_init_from_buffer`가 추가되었습니다. 이번 업데이트는 메모리 로드 방식의 일관성을 확보하고 오프셋 계산 오류 및 오버플로 방어 로직을 강화하는 데 중점을 두었습니다.

핵심 포인트

GGUF 모델 로딩을 위한 콜백 및 버퍼 기반 초기화 함수 추가
파일 및 버퍼 로드 시 메모리 분해(memory breakdown) 일관성 수정
파일 오프셋 계산 방식 개선 및 오버플로 방어 로직 강화
macOS, iOS, Linux 등 다양한 플랫폼용 바이너리 릴리즈

ggml: gguf_init_from_callback 및 gguf_init_from_buffer (#22341)

ggml: gguf_init_from_buffer 구현
test: gguf_init_from_buffer 테스트
fix: 파일로부터 no_alloc을 통해 로드된 모델의 메모리 분해 (memory breakdown)가 버퍼로부터 로드되는 것과 일치하도록 수정
fix: GGML_UNUSED 사용

Co-authored-by: Copilot copilot@github.com

fix: gguf_reader에서 total_size 제거
fix: 파일 오프셋 (file offset) 계산 수정, offset을 data_offset으로 이름 변경

Co-authored-by: Copilot copilot@github.com

refactor: 모델 로더 버그 수정 사항을 다른 PR로 추출
feat: gguf_init_from_callback 추가
fix: 항상 최대 예상 크기 (max expected size)를 요구하도록 수정
fix: gguf_reader_callback_t의 output 타입을 void *로 변경, max_expected_size 및 오프셋을 uint64_t로 변경
fix: 버퍼 읽기 시 오프셋 오버플로 (offset overflow)에 대한 방어 강화
fix: 콜백에서 탐색 (seek) 동작 제거
feat: max_chunk_read == 0은 SIZE_MAX를 의미함
fix: 텐서가 없는 gguf 파일에서의 탐색 (seeking) 수정

Co-authored-by: Copilot copilot@github.com

macOS/iOS:

Linux:

Linux:

Android:

Android arm64 (CPU)

Windows:

openEuler:

UI:

AI 자동 생성 콘텐츠

원문 바로가기

ggml: `gguf_init_from_callback` 및 `gguf_init_from_buffer` ([#22341](https://gith

요약

핵심 포인트

댓글