본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 05. 23. 17:57

llama.cpp용 Gemma4 31B를 위한 실험적인 "사고 과정 보존(Preserve Thinking)" Jinja 템플릿

요약

llama.cpp 환경에서 Gemma4 31B 모델의 사고 과정(thinking process)을 안정적으로 유지하기 위한 실험적인 Jinja 템플릿을 소개합니다. 이 템플릿은 멀티턴 도구 호출 시 발생하는 사고 태그 누락이나 조기 종료 문제를 해결하는 데 중점을 둡니다.

핵심 포인트

  • Gemma4 31B 모델을 위한 실험적 Jinja 템플릿 제공
  • 사고 태그(thinking tag)의 누락 및 오류 방지
  • 멀티턴 도구 호출 상황에서의 안정성 향상
  • llama.cpp 및 GGUF 환경 최적화

https://huggingface.co/stevelikesrhino/gemma-4-31B-it-nvfp4-GGUF/blob/main/gemma4-improved.jinja

여러분 모두 자유롭게 사용해 보시고 피드백을 주셔도 좋습니다. 제가 Pi-coding-agent에서 직접 테스트해 본 결과, 더 이상 "사고 태그(thinking tag) 닫기 누락", "사고 태그 열기 누락", "사고 태그 너무 일찍 닫음"과 같은 문제가 발생하지 않았습니다. 여러 차례의 프롬프트가 이어지는 멀티턴 도구 호출(multi-turn tool calls) 상황에서 더욱 안정적입니다.

면책 조항: 이것은 Google에서 권장하는 방식이 아닙니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0