Gemma Avatar: Gemma 4-31B와 얼굴을 마주하며 대화하기

이것은 3D 아바타와 대화할 수 있는 Gemma 4 31B와의 음성 채팅입니다. 사용자가 말하는 동안 경청하며, 목소리와 얼굴로 답변합니다 (아바타는 set_mood, make_hand_gesture, make_facial_expression과 같은 함수 도구(function tools)로서 LLM에 노출되어 있으며, Gemma가 스스로 표정을 결정합니다).

기술 스택은 모두 오픈 모델(open models)로 구성되어 있습니다: silero VAD, STT를 위한 parakeet, Gemma 4 31B (Cerebras를 통해 서빙되어 응답 속도가 매우 빠름), Qwen3-TTS. 일반 WebSocket을 통한 Raw PCM 방식을 사용합니다.