COTCAgent: 확률적 사고의 사슬 완성을 통한 예방적 상담

대규모 언어 모델 (Large Language Models, LLMs)이 의료 분야에 힘을 실어줌에 따라, 지능형 임상 의사결정 지원 (Clinical Decision Support)이 빠르게 발전하고 있습니다. 종단적 전자 건강 기록 (Longitudinal Electronic Health Records, EHR)은 정확한 임상 진단 및 분석을 위한 필수적인 시계열적 증거를 제공합니다. 그러나 현재의 대규모 언어 모델은 종단적 EHR 추론에 있어 치명적인 결함을 가지고 있습니다. 첫째, 세밀한 통계적 추론 (Statistical Reasoning)이 부족하여, 정량적 증거가 텍스트로 암시되어 있을 때 임상적 추세와 지표를 환각 (Hallucinate)하는 경우가 많으며, 이는 진단 추론에 편향을 일으킵니다. 둘째, 종단적 EHR의 비균일한 시계열 데이터와 부족한 레이블 (Labels)은 모델이 장기적인 시간적 의존성 (Long-range Temporal Dependencies)을 포착하는 것을 방해하여, 신뢰할 수 있는 임상 추론을 제한합니다.

이러한 한계를 해결하기 위해, 본 연구는 종단적 전자 건강 기록을 위한 계층적 추론 프레임워크인 확률적 사고의 사슬 완성 에이전트 (Probabilistic Chain-of-Thought Completion Agent, COTCAgent)를 제시합니다. 이는 세 가지 핵심 모듈로 구성됩니다. 시계열-통계 어댑터 (Temporal-Statistics Adapter, TSA)는 분석 계획을 실행 가능한 코드로 변환하여 표준화된 추세 출력을 생성합니다. 사고의 사슬 완성 (Chain-of-Thought Completion, COTC) 계층은 가중치 점수 산정 방식이 적용된 증상-추세-질병 지식 베이스를 활용하여 질병 위험을 평가하며, 유계 완성 (Bounded Completion) 모듈은 표준화된 질의와 반복적인 점수 제약을 통해 구조화된 증거를 확보함으로써 엄격한 추론을 보장합니다. 통계적 계산, 특징 매칭 (Feature Matching), 언어 생성을 분리함으로써, 이 프레임워크는 복잡한 다중 모달 (Multi-modal) 입력에 대한 의존성을 제거하고 더 낮은 계산 오버헤드로 효율적인 종단적 기록 분석을 가능하게 합니다.

실험 결과, Baichuan-M2를 기반으로 구동되는 COTCAgent는 자체 구축 데이터셋에서 90.47%의 Top-1 정확도를 달성하였고, HealthBench에서는 70.41%를 기록하며 기존의 의료 에이전트 및 주류 대규모 언어 모델들을 능가했습니다. 코드는 https://github.com/FrankDengAI/COTCAgent/ 에서 확인할 수 있습니다.

Insights

COTCAgent: 확률적 사고의 사슬 완성을 통한 예방적 상담

요약

핵심 포인트

댓글

AI 에이전트의 다음 단계인 「Graph Engineering」이란? ~Claude Code가 바꾸는 AI 시스템 설계~

AI 에이전트를 위한 기계 결제 가능 API를 구축하고 낯선 이들로부터 0달러를 벌었습니다. 모든 수치를 공개합니다.

IBM의 Krishna CEO, AI가 자사 소프트웨어 부문을 위협하지 않을 것이라며 투자자 안심시키려 노력

AMD EPYC Zen 7 "Florence", ACE 및 차세대 메모리 탑재 확인

AI 에이전트의 다음 단계인 「Graph Engineering」이란? ~Claude Code가 바꾸는 AI 시스템 설계~

AI 에이전트를 위한 기계 결제 가능 API를 구축하고 낯선 이들로부터 0달러를 벌었습니다. 모든 수치를 공개합니다.

IBM의 Krishna CEO, AI가 자사 소프트웨어 부문을 위협하지 않을 것이라며 투자자 안심시키려 노력

AMD EPYC Zen 7 "Florence", ACE 및 차세대 메모리 탑재 확인