
TRIAGE, 임상 LLM의 위험 양극화(Risk Polarization) 문제 해결
요약
임상 LLM이 위험도를 이진 출력으로 붕괴시키는 문제를 해결하기 위해, 연속적 위험 점수와 검증 가능한 근거를 생성하는 TRIAGE 모델을 제안합니다. 의료 시계열 데이터를 활용하여 양측의 위험을 모두 고려하는 단일 모델 학습 방식을 다룹니다.
핵심 포인트
- 임상 LLM의 위험도 양극화(Risk Polarization) 문제 해결
- 보정된 연속적 위험 점수 및 검증 가능한 근거 생성
- 의료 시계열 데이터 기반의 단일 모델 학습 방식 제안
- SFT 및 SFT-RL을 활용한 모델 학습 및 데이터 파이프라인 제공
LLM(Large Language Models)은 종종 단계별 위험도를 과도하게 확신하는 이진 출력(binary outputs)으로 붕괴시키곤 합니다.
본 연구는 불규칙한 의료 시계열 데이터(medical time series)로부터 보정된 연속적 위험 점수(calibrated continuous risk scores)와 검증 가능한 근거(verifiable rationales)를 생성하기 위해, 양측의 무게를 모두 고려하는 단일 모델을 학습시킵니다.
논문:
https://paperswithcode.co/paper/2606.090
30
…
모델 체크포인트:
https://huggingface.co/collections/Hyungwon/triage
…
GitHub에 학습 코드와 데이터 전처리 파이프라인이 포함된 P12 및 P19 SFT + SFT-RL 모델이 포함되어 있습니다.
OmniVideo-100K: 소리와 시각을 아우르는 추론
구조화된 스크립트와 증거 체인(evidence chains)으로 구축된 100K개의 인스트럭션 튜닝(instruction-tuning) 샘플입니다. 이를 통해 미세 조정(fine-tuned)된 모델은 오디오-비주얼 이해도에서 20% 이상의 성능 향상을 보입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기