스페인어 임상 기록에서의 신뢰할 수 있는 자동 분류: 위험 인지형 HIV 의심 식별을 위한 하이브리드 프레임워크

표준적인 임상 자연어 처리 (Natural Language Processing (NLP)) 벤치마크는 모호한 사례에 대해 결정론적 분류 (deterministic classification)를 강제함으로써 지표를 부풀리는 경우가 많으며, 이로 인해 과도하게 확신하는 예측 (overconfident predictions)이 초래하는 임상적 위험을 가리게 됩니다. 이러한 격차를 해소하기 위해, 본 연구에서는 스페인어 임상 기록에서의 초기 인간 면역 결핍 바이러스 (Human Immunodeficiency Virus (HIV)) 의심 식별을 대상으로 평가된 위험 인지형 하이브리드 선택적 분류 (hybrid selective classification) 프레임워크를 제안합니다. 우리의 이중 검증 (dual-verification) 접근 방식은 Mondrian conformal prediction을 통해 우연적 불확실성 (aleatoric uncertainty)을 명시적으로 분리하고, Multi-Centroid Mahalanobis Distance 거부 (veto)를 사용하여 인식론적 불확실성 (epistemic uncertainty)을 분리합니다. 실증적 평가 결과, 표준 불확실성 지표와 베이스라인 분류기 (baseline classifiers)는 안전한 의료 분류 (medical triage)를 수행하기에는 구조적으로 불충분하며, 엄격한 신뢰성 제약 조건 하에서 작동하도록 강제될 때 심각한 커버리지 붕괴 (coverage collapse)를 겪는 것으로 나타났습니다. 이와 대조적으로, 임상 서사가 확률적 및 기하학적 보호 장치를 모두 통과하도록 요구함으로써, 제안된 프레임워크는 매우 신뢰할 수 있는 운영 영역을 성공적으로 격리합니다.

Insights

스페인어 임상 기록에서의 신뢰할 수 있는 자동 분류: 위험 인지형 HIV 의심 식별을 위한 하이브리드 프레임워크

요약

핵심 포인트

댓글

자기 진화 AI 에이전트에 대한 종합 조사: 파운데이션 모델과 평생 에이전트 시스템을 연결하는 새로운 패러다임

Apple이 Hugging Face에 HAT을 공개하다

Grok 4.5의 실제 사용 비용은 Opus 4.8의 1/17 수준입니다.

Grok 4.5가 Cursor에서 공식 출시되었습니다.

Apple이 Hugging Face에 HAT을 공개하다

Grok 4.5의 실제 사용 비용은 Opus 4.8의 1/17 수준입니다.

Grok 4.5가 Cursor에서 공식 출시되었습니다.