Dev.to헤드라인2026. 06. 28. 19:13

HSK 말하기 테스트 AI 구축하기: Gemini를 활용한 실시간 성조 채점

요약

Gemini 2.5 Flash를 활용하여 사용자의 중국어 성조와 문법을 실시간으로 채점하는 HSK 말하기 테스트 AI 구축 과정을 소개합니다. Web Audio API를 통한 음성 데이터 처리와 백엔드에서의 PCM 변환 과정을 상세히 다룹니다.

저는 성조와 문법을 실시간으로 채점하는 무료 중국어 말하기 평가 도구를 만들었습니다. 그 뒤에 숨겨진 엔지니어링 과정을 소개합니다.

HSK (중국어 능력 시험)에는 말하기 영역(HSKK)이 있지만, 대부분의 학습자는 자신의 수준을 스스로 평가할 수 없습니다. 온라인 튜터는 비용이 많이 듭니다. 일반적인 AI 대화 도구들은 성조를 채점하지 않습니다.

그래서 저는 ToneTutor를 만들었습니다. 이는 사용자의 말하기 수준을 추정하고 약점을 파악하는 3분 분량의 구어체 HSK 테스트입니다.

프론트엔드 (Frontend):

백엔드 (Backend):

도전 과제:

Web Audio API는 WebM 형식으로 녹음합니다. 하지만 Gemini는 LINEAR16 (WAV) 형식을 기대합니다. 또한 iOS Safari는 WebM을 지원하지 않습니다. 그래서 다음과 같이 해결했습니다:


python
async def grade_session(transcript: str):
...

AI 자동 생성 콘텐츠