Ollama헤드라인2026. 04. 30. 19:29

# v0.22.1 ## 변경 사항 - mlxrunner: #15736 에서 @jessegross 에 의해 여러 시퀀스 간 샘플러를 배치 (bat

요약

이 버전(v0.22.1)은 여러 주요 업데이트를 포함하고 있으며, 특히 mlxrunner에서 여러 시퀀스에 대한 샘플러 배치 처리를 지원하도록 개선되었습니다. 또한 토크나이저의 다중 정규식 BPE 오프셋 처리 수정, NVIDIA TensorRT Model Optimizer 가져오기 지원 등 모델 및 인프라 관련 기능들이 강화되었습니다. 전반적으로 모델 배포와 성능 최적화에 초점을 맞춘 업데이트입니다.

핵심 포인트

mlxrunner가 여러 시퀀스에 대한 샘플러 배치 처리를 지원하여 효율성이 향상되었습니다.
토크나이저에서 다중 정규식 BPE 오프셋 처리 로직이 수정되어 정확도가 높아졌습니다.
NVIDIA TensorRT Model Optimizer 가져오기 기능이 추가되어 모델 최적화 및 배포가 용이해졌습니다.
데스크톱 앱 시작 시 발생하던 활성 `ollama launch` 세션 종료 문제가 해결되었습니다.

v0.22.1

변경 사항

mlxrunner: #15736 에서 @jessegross 에 의해 여러 시퀀스 간 샘플러를 배치 (batch) 처리
tokenizer: #15844 에서 @dhiltgen 에 의해 다중 정규식 BPE 오프셋 처리 수정
mlx: #15566 에서 @dhiltgen 에 의해 NVIDIA TensorRT Model Optimizer 가져오기 지원
app/server: #15657 에서 @hoyyeva 에 의해 데스크톱 앱 시작 시 활성 ollama launch 세션 종료 문제 수정
모델 배치에 대한 지원 (#15814, @jessegross)
새로운 모델 (#15861, @dhiltgen)

전체 변경 로그: v0.21.3-rc0...v0.22.1-rc0

AI 자동 생성 콘텐츠

원문 바로가기

# v0.22.1 ## 변경 사항 - mlxrunner: #15736 에서 @jessegross 에 의해 여러 시퀀스 간 샘플러를 배치 (bat

요약

핵심 포인트

v0.22.1

변경 사항

댓글