arXiv논문2026. 06. 02. 12:22

증거 보강 머신러닝 접근법을 이용한 응급실 분류 기록 기반의 전이 가능한 자해 감시

요약

응급실 분류 기록을 활용하여 자해를 탐지하는 3단계 머신러닝 접근법을 제안합니다. LLM 기반의 증거 추출 기술을 결합하여 기존 진단 코드의 한계를 극복하고 높은 전이 가능성을 입증했습니다.

핵심 포인트

LLM 기반 스크리닝과 머신러닝을 결합한 3단계 모델 개발
호주 3개 병원 대상 검증 결과 높은 AUPRC 달성
재학습 없이도 외부 사이트에서 우수한 전이 성능 확인
주요 자해 방법을 95% 정확도로 세분화하여 식별 가능

자해(Self-harm)는 주요한 공중 보건 문제이지만, 진단 코드(diagnostic codes)의 낮은 민감도로 인해 병원 내원 기록에 의존하는 현재의 감시 체계는 불충분합니다. 최초 접점 단계에서 기록되는 응급실 (Emergency Department, ED) 분류(triage) 기록은 내원 상황에 대한 간결한 요약을 제공하며 자해를 식별할 수 있는 기회를 제공합니다. 우리는 응급실 분류 기록에서 자해를 탐지하기 위해, 전통적인 머신러닝 (machine learning)에 대규모 언어 모델 (large language model, LLM) 기반의 스크리닝 및 증거 추출을 결합하여 보강한 3단계 접근법을 개발했습니다. 우리는 호주의 3개 병원을 대상으로 모델의 전이 가능성 (transferability)을 평가했습니다. 우리의 접근법은 내부 및 외부 검증 과정에서 각각 0.887 +/- 0.016 및 0.884 +/- 0.012의 AUPRC를 보여주었습니다. 전향적(Prospectively)으로, 개발 사이트에서는 0.881 +/- 0.008의 AUPRC를 달성하였으며, 사이트별 재학습(retraining) 없이도 두 곳의 외부 사이트에서 각각 0.879 +/- 0.012 및 0.816 +/- 0.015의 AUPRC를 기록했습니다. 이 접근법의 핵심적인 장점은 주요 자해 방법을 95%의 정확도로 식별할 수 있다는 점이며, 이는 이진 분류 (binary classification)를 넘어 더욱 세분화된 감시를 지원합니다.

AI 자동 생성 콘텐츠

원문 바로가기

증거 보강 머신러닝 접근법을 이용한 응급실 분류 기록 기반의 전이 가능한 자해 감시

요약

핵심 포인트

댓글