도메인 특화 LLM 사후 학습을 통한 피트니스 지능 강화

과학적 피트니스 코칭 (Scientific Fitness Coaching, SFC)은 일반적으로 인간 전문가에 의해 제공되며, 이로 인해 많은 이들에게 비용이 많이 들고 접근성이 낮습니다. 최근 거대 언어 모델 (Large Language Models, LLMs)의 발전은 더욱 포용적인 피트니스 코칭에 상당한 가능성을 보여주고 있지만, 기존의 범용 LLM을 SFC에 직접 배포하는 것은 결정적인 한계를 드러냅니다. 이러한 모델들은 종종 충분한 도메인 특화 지식 통합이 부족하여, 복잡한 SFC 시나리오에서 취약한 성능을 보입니다. 본 논문에서는 SFC 애플리케이션을 위한 신뢰성과 도메인 전문성을 향상시키도록 설계된 일련의 피트니스 LLM (8B 및 32B 파라미터)인 FitOne을 소개합니다. Qwen3 파운데이션 모델을 기반으로 구축된 FitOne은 엄격한 지식 공학에서 파생된 대규모 고품질 데이터셋을 사용하여 지속적 사전 학습 (continual pre-training), 지도 미세 조정 (supervised fine-tuning), 그리고 강화 학습 (reinforcement learning)으로 구성된 3단계 사후 학습 (post-training) 파이프라인을 통해 개발되었습니다. 우리는 ACSM-EP 및 NSCA-CSCS를 포함한 전문 피트니스 자격 시험과 지식 추론 및 지시 이행과 같은 일반적인 역량에 대해 FitOne을 종합적으로 평가했습니다. 실험 결과, FitOne-8B/32B는 강력한 일반 역량을 유지하면서도 Qwen3 베이스 모델과 비교했을 때 ACSM-EP 및 NSCA-CSCS 시험에서 각각 평균적으로 최대 10.09%/9.29% 및 12.73%/7.01%의 향상을 달성했습니다. 또한, 심층적인 어블레이션 연구 (ablation studies)를 통해 각 학습 단계의 필요성을 확인하였으며, 도메인 전문성 강화와 일반 능력 유지 사이의 균형을 맞추는 데 있어 해당 파이프라인의 효과를 강조했습니다. 우리는 본 연구가 LLM 시스템을 더욱 신뢰할 수 있는 피트니스 지능으로 발전시키며, 도메인 특화 LLM 개발에 대한 향후 연구에 영감을 줄 것이라고 믿습니다.

Insights

도메인 특화 LLM 사후 학습을 통한 피트니스 지능 강화

요약

핵심 포인트

댓글

측정 장치로서의 언어 모델 (Language Models as Measurement Apparatus)과 문화

[audio.cpp] GGML의 소리 — C++/GGML 네이티브 ACE-Step, Stable Audio, HeartMuLa

AI 에이전트(Claude Code)를 1년 동안 '사원'으로서 실무에 사용하며 알게 된 것 ―― 자사 사이트를 12.89초에서 2.03초로

Claude Code가 파일을 다시 읽고 명령 출력을 확인하며 낭비하는 토큰 양을 일주일 동안 측정해 보았습니다. 약 1,050만 개에

측정 장치로서의 언어 모델 (Language Models as Measurement Apparatus)과 문화

[audio.cpp] GGML의 소리 — C++/GGML 네이티브 ACE-Step, Stable Audio, HeartMuLa

AI 에이전트(Claude Code)를 1년 동안 '사원'으로서 실무에 사용하며 알게 된 것 ―― 자사 사이트를 12.89초에서 2.03초로

Claude Code가 파일을 다시 읽고 명령 출력을 확인하며 낭비하는 토큰 양을 일주일 동안 측정해 보았습니다. 약 1,050만 개에