arXiv논문2026. 05. 22. 12:55

웨어러블 건강 데이터를 위한 범용 지능 및 인터페이스를 향하여

요약

웨어러블 센서 데이터를 개인화된 건강 통찰력으로 변환하기 위한 대규모 파운데이션 모델을 제안합니다. 500만 명의 코호트에서 추출한 1조 분 이상의 데이터를 사전 학습하여 심혈관, 수면, 정신 건강 등 35개 작업에서 뛰어난 성능을 입증했습니다.

핵심 포인트

1조 분 이상의 레이블 없는 센서 신호를 활용한 사전 학습
모델 용량과 데이터 볼륨 스케일링을 통한 성능 향상 입증
LLM 에이전트를 활용한 다운스트림 예측 헤드 자율 탐색
개인 건강 에이전트 통합을 통한 맥락 인식 및 안전한 응답 지원

도처에 존재하는 웨어러블 센서가 풍부한 행동 및 생리적 정보를 포착하고 있지만, 이러한 신호를 개인화된 건강 통찰력(insights)으로 효과적으로 변환하는 것은 도전적인 과제입니다. 구체적으로, 높은 표현형 다양성(phenotypic diversity)과 개인의 기저 건강, 생리 및 라이프스타일 요인의 변동성으로 인해 저수준(low-level) 센서 데이터를 상위 수준의 상태를 특징짓는 표현(representations)으로 변환하는 것은 어렵습니다. 더욱이, 건강 결과 주석(annotations)이 결합된 웨어러블 데이터를 수집하는 것은 노동 집약적이고 비용이 많이 들며, 사후 주석(retrospective annotation) 작업은 실질적으로 불가능하여 고품질 레이블이 포함된 데이터의 부족을 초래합니다. 이러한 한계를 극복하기 위해, 우리는 500만 명의 대규모 코호트(cohort)에서 추출한 1조 분 이상의 레이블이 없는 센서 신호로 사전 학습(pretrained)된 웨어러블 건강을 위한 파운데이션 모델(foundation model)을 제안합니다. 우리는 모델 용량(capacity)과 사전 학습 데이터 볼륨의 공동 스케일링(joint scaling)이 심혈관, 대사, 수면, 정신 건강뿐만 아니라 라이프스타일 선택 및 인구통계학적 요인을 아우르는 35개의 다양한 건강 예측 작업에서 평가했을 때 체계적인 성능 향상으로 이어진다는 것을 입증합니다. 우리는 이러한 인구 규모의 표현(population scale representation)이 레이블 효율적인 퓨샷 학습(few-shot learning)과 견고한 일일 지표 추정을 위한 생성 능력(generative capabilities)을 가능하게 한다는 것을 발견했습니다. 이 학습된 표현을 더욱 활용하기 위해, 우리는 모델 임베딩(embeddings)을 기반으로 구축된 다운스트림 예측 헤드(downstream predictive heads)의 공간을 자율적으로 탐색하는 LLM 에이전트 교실(classroom of LLM agents)을 배치하였으며, LLM 모델 용량이 커질수록 증가하는 광범위한 성능 향상을 보여주었습니다. 마지막으로, 이러한 다운스트림 예측기들을 개인 건강 에이전트(Personal Health Agent)에 통합함으로써 더욱 관련성 있고, 맥락을 인식하며, 안전한 모델 응답을 지원할 수 있음을 보여주며, 이를 임상의 코호트로부터 얻은 1,860개의 평가를 통해 검증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

웨어러블 건강 데이터를 위한 범용 지능 및 인터페이스를 향하여

요약

핵심 포인트

댓글