arXiv논문2026. 06. 26. 11:20

RecallRisk-BERT: 보고 후 의료기기 리콜 분류를 위한 멀티태스크 프레임워크

요약

의료기기 리콜의 심각도와 근본 원인을 동시에 예측하기 위한 멀티태스크 프레임워크 RecallRisk-BERT를 제안합니다. PubMedBERT 기반의 텍스트 표현과 구조화된 범주형 데이터를 결합하여 기존 단일 작업 모델보다 뛰어난 성능을 입증했습니다.

핵심 포인트

PubMedBERT와 정형 데이터를 결합한 멀티태스크 학습 모델 개발
리콜 심각도(Class I/II/III)와 9개 근본 원인 범주 동시 예측
텍스트-정형 데이터 결합 모델이 단일 작업 모델보다 우수한 성능 달성
규제 의사 결정 및 자동화된 리콜 분류 지원 가능성 확인

의료기기 리콜(Medical device recalls)은 환자 안전을 보호하기 위한 중요한 규제 메커니즘입니다. 증가하는 FDA 리콜 기록의 양은 보고 후 리콜 분류(recall triage), 심각도 평가(severity assessment), 그리고 근본 원인 해석(root-cause interpretation)에 있어 어려움을 야기합니다. 기존 연구들은 주로 리콜 발생 예측이나 근본 원인 분석을 별도로 다루는 반면, 리콜 심각도와 근본 원인 범주를 결합하여 모델링하는 연구는 제한적인 관심을 받아왔습니다. 본 연구에서는 2002년부터 2025년 10월까지의 기간을 포괄하는 openFDA의 FDA 의료기기 리콜 기록 54,165건을 사용하여 자동화된 리콜 분류 프레임워크를 개발했습니다. 먼저 리콜 심각도 및 근본 원인 범주 예측을 위해 전통적인 머신러닝(machine learning) 및 부스팅(boosting) 기반 모델들을 평가했습니다. 그 다음, 리콜 서술(recall narratives)의 PubMedBERT 기반 텍스트 표현과 제품 코드(product code), 규정 번호(regulation number), 의료 전문 분야(medical specialty)를 포함한 구조화된 범주형 특징(structured categorical features)의 임베딩(embedding) 기반 표현을 결합한 멀티태스크(multi-task) 모델인 RecallRisk-BERT를 개발했습니다. 이 모델은 리콜 심각도(Class I/II/III)와 통합된 근본 원인 범주(9개 클래스)를 동시에 예측합니다. 성능은 정확도(accuracy), 매크로 평균 정밀도(macro-averaged precision), 재현율(recall), F1-score, 그리고 ROC-AUC를 사용하여 평가되었습니다. 단일 작업(single-task) 심각도 예측에서는 당사의 LightGBM 기반 텍스트-정형 데이터(text--tabular) 구성이 정확도 0.963, macro-F1 0.856, ROC-AUC 0.974로 가장 강력한 성능을 달성했습니다. 멀티태스크 설정에서 RecallRisk-BERT는 단일 작업 PubMedBERT 베이스라인을 실질적으로 능가했습니다. 모델에서 도출된 위험 순위(risk rankings)는 관찰된 근본 원인 심각도 패턴과 강력한 일관성을 보였습니다 (rho = 0.983, p = 1.936e-6). 이러한 결과는 텍스트-정형 데이터 학습(text--tabular learning)이 확장 가능한 보고 후 리콜 분류, 규제 의사 결정 지원, 그리고 모델 기반의 근본 원인 위험 분석을 지원할 수 있음을 나타냅니다.

AI 자동 생성 콘텐츠

원문 바로가기

RecallRisk-BERT: 보고 후 의료기기 리콜 분류를 위한 멀티태스크 프레임워크

요약

핵심 포인트

댓글