r/LocalLLaMA분석2026. 06. 16. 10:14

vLLM, nightly 버전에 Qwen3+를 위한 새로운 스트리밍 파서(streaming parser) 추가

원문 발행 2026. 06. 16. 08:34원문 언어 영어AI 한국어 번역r/LocalLLaMA 원문 보기

요약

vLLM nightly 버전에 Qwen3+ 모델을 위한 새로운 스트리밍 파서가 추가되었습니다. 이를 통해 Qwen3.6-27b 모델의 대화 중단 현상과 스트리밍 도구 호출 실패 문제를 해결하여 에이전트 워크플로우의 안정성을 높였습니다.

핵심 포인트

Qwen3.6-27b 모델의 대화 중단 문제 해결
스트리밍 도구 호출(tool calls) 실패 오류 수정
에이전트 워크플로우의 안정성 및 신뢰도 향상
vLLM nightly 버전에 새로운 스트리밍 파서 적용

새로운 파서(parser)는 많은 사용자들이 겪고 있던 Qwen3.6-27b 모델이 대화 중간에 멈추는 문제와, 청크 경계(chunk boundaries)로 인해 스트리밍 도구 호출(streaming tool calls)이 실패하는 문제를 해결한 것으로 알려졌습니다.

대화 중간에 멈추는 현상은 에이전트 워크플로우(agentic workflows)에 모델을 사용하려 할 때 특히 짜증스러운 부분입니다. 오늘 저녁 진행한 제한적인 테스트에서는 더 이상 해당 현상이 발생하지 않는 것을 확인했으며, 이 문제가 완전히 해결되었기를 바랍니다!
submitted by /u/rmhubbert
[link] [comments]

AI 자동 생성 콘텐츠

원문 바로가기

Insights

vLLM, nightly 버전에 Qwen3+를 위한 새로운 스트리밍 파서(streaming parser) 추가

요약

핵심 포인트

댓글

칩 주식의 변동성이 지속되는 가운데 AMD, 2분기 실적 발표 예정

중국, 개정 규정을 통해 칩 설계 보호 강화

남아프리카 공화국, 국경 간 암호화폐 거래에 대한 초안 규정 발표