모바일 헬스를 위한 다중 시계열 행동 예측용 딥러닝 아키텍처 비교 연구
요약
웨어러블 및 스마트폰 데이터를 활용한 다중 시계열 행동 예측을 위해 6개의 딥러닝 아키텍처와 2개의 파운데이션 모델을 비교 연구했습니다. PatchTST가 우수한 성능을 보였으며, TimesFM과 같은 파운데이션 모델의 제로샷 성능과 개인화 미세 조정의 효과를 검증했습니다.
핵심 포인트
- PatchTST가 학습된 모델 중 가장 우수한 성능을 기록함
- TimesFM 파운데이션 모델이 데이터가 적은 환경에서 강력한 제로샷 성능을 보임
- 참가자 수준의 미세 조정 시 RMSE가 16~60% 감소하여 개인화 효과 입증
- 수면 데이터가 개인화 미세 조정에 가장 큰 혜택을 받음
웨어러블 기기와 스마트폰은 선제적인 건강 개입을 지원할 수 있는 풍부한 행동 시계열 (behavioural time series) 데이터를 생성하지만, 이러한 데이터를 위한 현대적인 예측 아키텍처에 대한 체계적인 비교 연구는 부족한 실정입니다. 특히, 모델이 인구 집단 전반에 걸쳐 어떻게 일반화되는지, 서로 다른 아키텍처가 참가자 수준의 미세 조정 (fine-tuning)에 어떻게 반응하는지, 그리고 다중 일수 예측 범위 (multi-day horizons)에 따라 예측 정확도가 어떻게 저하되는지는 여전히 불분명합니다. 본 연구에서는 800명 이상의 참가자를 포함하는 세 가지 공개 데이터셋을 사용하여 6개의 딥러닝 아키텍처, 2개의 제로샷 파운데이션 모델 (Foundation Models, FM) 및 통계적 베이스라인 (statistical baselines)을 벤치마킹하였으며, 18일의 예측 범위에 대해 걸음 수, 화면 사용 시간 및 수면 시간의 특성별 지표를 보고합니다. 나아가, 6개 아키텍처 모두에 대해 특성별 개인화 (personalisation) 연구를 수행하고, 데이터셋 크기 및 시간적 입도 (temporal granularities)에 따른 FM의 전이 가능성 (transferability)을 평가합니다. 주요 연구 결과는 다음과 같습니다: (i) 압도적인 단일 아키텍처는 없으며, 학습된 모델 중에서는 PatchTST가 앞서지만 그다음 세 모델 (TCN, MLP, Transformer) 사이에는 유의미한 성능 차이가 없습니다; (ii) FM인 TimesFM은 제로샷 (zero-shot) 환경에서, 특히 데이터가 적은 환경에서 학습된 모델과 대등하거나 이를 능가합니다; (iii) 참가자 수준의 미세 조정 (fine-tuning)은 특성별 RMSE를 1660% 감소시키며, 수면 데이터가 가장 큰 혜택을 보고 걸음 수가 가장 적은 혜택을 받습니다. 이러한 결과는 모바일 헬스 예측을 위한 아키텍처 선택, FM 적용 가능성 및 개인화 전략에 대한 실질적인 지침을 제공합니다. 저희가 알고 있는 바로는, 본 연구는 웨어러블 기기 기반의 다중 시계열 행동 예측을 위해 현대적인 딥러닝, FM 및 개인화를 공동으로 평가한 첫 번째 연구입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기