Reddit요약2026. 06. 15. 09:33

공지: Gemma 4 12B의 코딩 및 도구 호출 (Tool Calling) 기능이 완전히 망가진 것은 아닙니다. 특수한 채팅 템플릿

요약

Gemma 4 12B 모델의 도구 호출(Tool Calling) 기능 오류를 해결하기 위한 특수 채팅 템플릿 사용법을 안내합니다. llama.cpp 환경에서 특정 Jinja 템플릿을 적용하면 모델의 코딩 및 도구 활용 능력을 정상적으로 평가할 수 있습니다.

핵심 포인트

Gemma 4 12B의 도구 호출 실패는 채팅 템플릿 문제일 가능성이 높음
llama.cpp에서 커스텀 Jinja 템플릿 파일을 사용하여 해결 가능
올바른 템플릿 적용 시 OpenCode 등 하네스에서 정상 작동 확인
모델의 코딩 능력을 평가하기 전 반드시 템플릿 설정을 확인 권장

이 글은 저처럼 직접 시도해 보았다가 도구 호출 (Tool calls)이 사방에서 실패하여 OpenCode와 같은 하네스 (Harnesses)조차 제대로 작동하지 않는 벽에 부딪혔던 분들을 위한 공지 (PSA)입니다. 해결 방법이 있습니다. 더 나은 채팅 템플릿 (Chat template) 파일을 전달해야 하는데, 해당 파일은 이미 존재합니다 (제가 작성한 것은 아닙니다). 이 댓글도 참고하세요. llama.cpp에서 실제로 이를 사용하려면, 먼저 llama.cpp를 소스에서 컴파일한 다음, 위에 링크된 채팅 템플릿 파일을 다운로드하고, 다음과 같이 시도해 보세요 (이 경우에는 8비트 양자화 (8 bit quant) 기준입니다): ./build/bin/llama-server -hf unsloth/gemma-4-12b-it-GGUF:UD-Q8_K_XL --host 127.0.0.1 --port 8899 --jinja --chat-template-file ./custom-pub-chat-template-gemma4.jinja 결과가 훌륭하다거나, 좋다거나, 혹은 Qwen 3 9B나 다른 모델보다 낫다거나 나쁘다는 말을 하려는 것이 아닙니다! 하지만 이 설정을 사용하면 도구 호출 (Tool calling) 버그가 사라지며, OpenCode에서 모델의 능력을 진정으로 평가할 수 있습니다. 그러니 모델의 코딩 능력을 판단하기 전에 꼭 그렇게 해보시기 바랍니다. 그 후에 판단하셔도 좋습니다 😀 제가 이 글을 올리는 이유는 "Gemma 4 12B로는 코딩을 할 수 없다, 도구 호출이 전혀 작동하지 않는다"라는 댓글을 너무 많이 봐서, 모델에 대해 논의할 때 소음 속에서 진실을 가려내기가 어렵기 때문입니다. 해결책을 알려준 u/HVACcontrolsGuru에게 감사드립니다. 그분의 공을 가로채려는 것은 아니며, 단지 더 많은 사람의 관심을 끌 때가 되었다고 생각했을 뿐입니다.

AI 자동 생성 콘텐츠

원문 바로가기