도메인 특화 LLM 사후 학습을 통한 피트니스 지능 강화
요약
범용 LLM의 피트니스 코칭 한계를 극복하기 위해 개발된 도메인 특화 모델 FitOne을 소개합니다. Qwen3를 기반으로 3단계 사후 학습 파이프라인을 적용하여 전문 지식과 일반 역량을 동시에 강화했습니다.
핵심 포인트
- FitOne-8B/32B 모델 개발 및 3단계 사후 학습 파이프라인 제안
- 지속적 사전 학습, SFT, 강화 학습을 통한 도메인 전문성 확보
- 전문 피트니스 자격 시험(ACSM-EP, NSCA-CSCS)에서 성능 대폭 향상
- 도메인 특화 지식과 일반적인 지시 이행 능력 간의 균형 달성
과학적 피트니스 코칭 (Scientific Fitness Coaching, SFC)은 일반적으로 인간 전문가에 의해 제공되며, 이로 인해 많은 이들에게 비용이 많이 들고 접근성이 낮습니다. 최근 거대 언어 모델 (Large Language Models, LLMs)의 발전은 더욱 포용적인 피트니스 코칭에 상당한 가능성을 보여주고 있지만, 기존의 범용 LLM을 SFC에 직접 배포하는 것은 결정적인 한계를 드러냅니다. 이러한 모델들은 종종 충분한 도메인 특화 지식 통합이 부족하여, 복잡한 SFC 시나리오에서 취약한 성능을 보입니다. 본 논문에서는 SFC 애플리케이션을 위한 신뢰성과 도메인 전문성을 향상시키도록 설계된 일련의 피트니스 LLM (8B 및 32B 파라미터)인 FitOne을 소개합니다. Qwen3 파운데이션 모델을 기반으로 구축된 FitOne은 엄격한 지식 공학에서 파생된 대규모 고품질 데이터셋을 사용하여 지속적 사전 학습 (continual pre-training), 지도 미세 조정 (supervised fine-tuning), 그리고 강화 학습 (reinforcement learning)으로 구성된 3단계 사후 학습 (post-training) 파이프라인을 통해 개발되었습니다. 우리는 ACSM-EP 및 NSCA-CSCS를 포함한 전문 피트니스 자격 시험과 지식 추론 및 지시 이행과 같은 일반적인 역량에 대해 FitOne을 종합적으로 평가했습니다. 실험 결과, FitOne-8B/32B는 강력한 일반 역량을 유지하면서도 Qwen3 베이스 모델과 비교했을 때 ACSM-EP 및 NSCA-CSCS 시험에서 각각 평균적으로 최대 10.09%/9.29% 및 12.73%/7.01%의 향상을 달성했습니다. 또한, 심층적인 어블레이션 연구 (ablation studies)를 통해 각 학습 단계의 필요성을 확인하였으며, 도메인 전문성 강화와 일반 능력 유지 사이의 균형을 맞추는 데 있어 해당 파이프라인의 효과를 강조했습니다. 우리는 본 연구가 LLM 시스템을 더욱 신뢰할 수 있는 피트니스 지능으로 발전시키며, 도메인 특화 LLM 개발에 대한 향후 연구에 영감을 줄 것이라고 믿습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기