llama.cpp헤드라인2026. 05. 18. 01:09

server : honor --embd-normalize CLI arg ( #23125 ) --embd-normalize 플래그(flag)가 임

요약

llama-server의 CLI 인자 `--embd-normalize` 플래그가 임베딩 및 디버그 예제에만 등록되어 있어, 서버가 이를 거부하고 기본값(L2)을 사용하던 문제를 해결했습니다. 이 변경 사항은 `LLAMA_EXAMPLE_SERVER`를 업데이트하여 해당 플래그의 예제 세트에 추가하고, 핸들러가 파라미터에서 `embd_normalize` 값을 읽도록 수정함으로써 이루어졌습니다. 요청 본문에 포함된

핵심 포인트

llama-server는 `--embd-normalize` 플래그의 기본값 사용 문제를 해결했습니다.
해당 플래그가 `LLAMA_EXAMPLE_SERVER`에 추가되어 예제 세트에서 사용할 수 있게 되었습니다.
이제 핸들러는 파라미터 객체(`params.embd_normalize`)를 읽어 기본값을 설정하며, 요청 본문의 값이 여전히 최우선권을 가집니다.

server : honor --embd-normalize CLI arg ( #23125 ) --embd-normalize 플래그(flag)가 임베딩(embedding) 및 디버그(debug) 예제에만 등록되어 있었기 때문에, llama-server가 이를 거부하고 /embedding 핸들러(handler)가 하드코딩된 기본값인 2 (L2)를 사용했습니다. LLAMA_EXAMPLE_SERVER를 플래그의 예제 세트에 추가하고, 핸들러의 기본값으로 params.embd_normalize를 읽도록 합니다. 요청당(per-request) "embd_normalize" 바디(body) 필드는 계속해서 우선권을 가집니다. macOS/iOS: macOS Apple Silicon (arm64) macOS Apple Silicon (arm64, KleidiAI enabled) macOS Intel (x64) iOS XCFramework Linux: Ubuntu x64 (CPU) Ubuntu arm64 (CPU) Ubuntu s390x (CPU) Ubuntu x64 (Vulkan) Ubuntu arm64 (Vulkan) Ubuntu x64 (ROCm 7.2) Ubuntu x64 (OpenVINO) Ubuntu x64 (SYCL FP32) Ubuntu x64 (SYCL FP16) Android: Android arm64 (CPU) Windows: Windows x64 (CPU) Windows arm64 (CPU) Windows x64 (CUDA 12) - CUDA 12.4 DLLs Windows x64 (CUDA 13) - CUDA 13.1 DLLs Windows x64 (Vulkan) Windows x64 (SYCL) Windows x64 (HIP) openEuler: openEuler x86 (310p) openEuler x86 (910b, ACL Graph) openEuler aarch64 (310p) openEuler aarch64 (910b, ACL Graph)

AI 자동 생성 콘텐츠

원문 바로가기

server : honor --embd-normalize CLI arg ( #23125 ) --embd-normalize 플래그(flag)가 임

요약

핵심 포인트

댓글