COTCAgent: 확률적 사고의 사슬 완성을 통한 예방적 상담
요약
본 연구는 종단적 전자 건강 기록(EHR) 분석에서 발생하는 LLM의 통계적 추론 및 장기 시간 의존성 포착의 한계를 극복하기 위해 COTCAgent라는 계층적 추론 프레임워크를 제안합니다. 이 에이전트는 시계열-통계 어댑터(TSA), 사고의 사슬 완성(COTC) 계층, 유계 완성 모듈로 구성되어 통계 계산과 언어 생성을 분리하여 엄격하고 신뢰할 수 있는 임상 추론을 가능하게 합니다. 실험 결과, COTCAgent는 기존 모델 대비 높은 정확도를 보여 의료 분야에서의 활용 잠재력을 입증했습니다.
핵심 포인트
- COTCAgent는 종단적 EHR 분석을 위한 계층적 추론 프레임워크이다.
- 통계적 계산과 언어 생성을 분리하여 LLM의 환각 및 통계적 추론 오류를 방지한다.
- TSA 모듈은 분석 계획을 코드로 변환하여 표준화된 추세 출력을 생성한다.
- COTC 계층과 유계 완성 모듈은 구조화된 증거 확보와 질병 위험 평가에 기여한다.
- Baichuan-M2 기반 COTCAgent는 자체 데이터셋에서 90.47%의 Top-1 정확도를 달성했다.
대규모 언어 모델 (Large Language Models, LLMs)이 의료 분야에 힘을 실어줌에 따라, 지능형 임상 의사결정 지원 (Clinical Decision Support)이 빠르게 발전하고 있습니다. 종단적 전자 건강 기록 (Longitudinal Electronic Health Records, EHR)은 정확한 임상 진단 및 분석을 위한 필수적인 시계열적 증거를 제공합니다. 그러나 현재의 대규모 언어 모델은 종단적 EHR 추론에 있어 치명적인 결함을 가지고 있습니다. 첫째, 세밀한 통계적 추론 (Statistical Reasoning)이 부족하여, 정량적 증거가 텍스트로 암시되어 있을 때 임상적 추세와 지표를 환각 (Hallucinate)하는 경우가 많으며, 이는 진단 추론에 편향을 일으킵니다. 둘째, 종단적 EHR의 비균일한 시계열 데이터와 부족한 레이블 (Labels)은 모델이 장기적인 시간적 의존성 (Long-range Temporal Dependencies)을 포착하는 것을 방해하여, 신뢰할 수 있는 임상 추론을 제한합니다.
이러한 한계를 해결하기 위해, 본 연구는 종단적 전자 건강 기록을 위한 계층적 추론 프레임워크인 확률적 사고의 사슬 완성 에이전트 (Probabilistic Chain-of-Thought Completion Agent, COTCAgent)를 제시합니다. 이는 세 가지 핵심 모듈로 구성됩니다. 시계열-통계 어댑터 (Temporal-Statistics Adapter, TSA)는 분석 계획을 실행 가능한 코드로 변환하여 표준화된 추세 출력을 생성합니다. 사고의 사슬 완성 (Chain-of-Thought Completion, COTC) 계층은 가중치 점수 산정 방식이 적용된 증상-추세-질병 지식 베이스를 활용하여 질병 위험을 평가하며, 유계 완성 (Bounded Completion) 모듈은 표준화된 질의와 반복적인 점수 제약을 통해 구조화된 증거를 확보함으로써 엄격한 추론을 보장합니다. 통계적 계산, 특징 매칭 (Feature Matching), 언어 생성을 분리함으로써, 이 프레임워크는 복잡한 다중 모달 (Multi-modal) 입력에 대한 의존성을 제거하고 더 낮은 계산 오버헤드로 효율적인 종단적 기록 분석을 가능하게 합니다.
실험 결과, Baichuan-M2를 기반으로 구동되는 COTCAgent는 자체 구축 데이터셋에서 90.47%의 Top-1 정확도를 달성하였고, HealthBench에서는 70.41%를 기록하며 기존의 의료 에이전트 및 주류 대규모 언어 모델들을 능가했습니다. 코드는 https://github.com/FrankDengAI/COTCAgent/ 에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기