WEQA: 질의 적응형 에이전트 추론을 이용한 웨어러블 건강 질의응답
요약
웨어러블 건강 데이터를 활용한 질의응답을 위해 질의 적응형 에이전트 프레임워크인 WEQA를 제안합니다. LLM 컨트롤러가 센서 분석 도구와 모델을 동적으로 라우팅하여 고차원 센서 데이터를 효과적으로 처리합니다. 실험 결과 기존 에이전트 방식보다 정확도가 24% 향상되었음을 입증했습니다.
핵심 포인트
- 웨어러블 센서 데이터의 연속성 및 고차원성 문제 해결
- 질의에 따라 분석 도구를 동적으로 선택하는 에이전트 프레임워크 제안
- 외부 지식을 활용한 근거 기반의 응답 감사 수행
- 기존 LLM 및 에이전트 베이스라인 대비 정확도 24% 향상
- 의료 전문가 테스트를 통해 임상적 타당성 확인
언어 모델(Language models)은 의료 질의응답(medical question answering) 분야에서 매우 뛰어난 능력을 보여주며, 어떤 경우에는 일반의(general physicians)의 정확도를 능가하기도 합니다. 그러나 웨어러블 건강 데이터에 관한 질문에 답하는 것은 여전히 도전적이며 연구가 미흡한 상태입니다. 이러한 유비쿼터스 센서들은 연속적이고 고차원적이며 종단적(longitudinal)인 데이터를 생성하는데, 이는 LLM(Large Language Model) 사전 학습(pretraining)의 텍스트 중심 분포와 정렬하기가 쉽지 않기 때문입니다. 센서 모달리티(modalities)의 다양성과 사용자 의도는 고정된 추론 워크플로우(reasoning workflow)나 단일 사전 학습된 파운데이션 모델(foundation model)만으로는 효과적으로 처리할 수 없습니다. 이러한 과제를 해결하기 위해, 우리는 LLM 추론을 전문적인 웨어러블 분석 및 모델링 도구와 통합하는 질의 적응형(query-adaptive) 에이전트 프레임워크인 WEQA를 제안합니다. LLM 컨트롤러(controller)를 사용하여 실행 계획을 합성하고, 각 질의를 센서 분석 및 사전 학습된 모델의 적절한 조합으로 동적으로 라우팅(route)하며, 외부 지식을 활용하여 근거 기반의 응답 감사(grounded response auditing)를 수행합니다. 또한 우리는 세 가지 다른 건강 영역에서 분석 및 예측 작업을 포함하는 4개의 공개 웨어러블 데이터셋을 아우르는 벤치마크를 큐레이션했습니다. 실험 결과, 우리의 프레임워크는 LLM 및 에이전트 기반(agentic) 베이스라인보다 24% 더 높은 정확도를 보였으며, 12명의 의료 전문가와 8명의 사용자를 대상으로 한 블라인드 테스트(blinded study) 결과 유용성과 임상적 타당성(clinical soundness) 측면에서 상당한 개선을 확인했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기