arXiv논문2026. 06. 23. 11:03

하이브리드 자연어 및 임상 보상 학습을 통한 정밀도-재현율 제어 가능 방사선 보고서 생성

요약

임상적 정밀도와 재현율을 제어할 수 있는 새로운 방사선 보고서 생성(RRG) 강화학습 프레임워크를 제안합니다. 기존 NLG 지표의 한계를 넘어 임상 보상과 그룹 상대적 훈련 전략을 통해 임상적 효능을 극대화했습니다.

핵심 포인트

정밀도와 재현율 사이의 트레이드오프를 명시적으로 제어 가능
임상적 효능(CE) 향상을 위한 임상 보상(Clinical Reward) 도입
훈련 안정성을 높이기 위한 그룹 상대적 훈련 전략 적용
MIMIC-CXR 데이터셋에서 기존 SOTA 방식 대비 우수한 성능 입증

자동화된 방사선 보고서 생성 (Radiology Report Generation, RRG)은 임상 보고서 작성의 과중한 업무량을 줄일 수 있기 때문에 점점 더 많은 관심을 받고 있습니다. 그러나 기존의 대부분의 방법은 언어의 유창성에 초점을 맞춘 자연어 생성 (Natural Language Generation, NLG) 지표를 주로 최적화하는 반면, 정밀도 (Precision) 및 재현율 (Recall)과 같이 임상적으로 중요한 요소에 대한 제어 기능은 거의 제공하지 못합니다. 그 결과, 생성된 보고서는 유창할 수는 있지만 다양한 임상적 요구 사항과 잘 일치하지 않을 수 있습니다. 이러한 문제를 해결하기 위해, 우리는 추론 과정에서 제어 파라미터가 임상적 정밀도와 재현율 사이의 트레이드오프 (Trade-off)를 명시적으로 조정하는, 정밀도-재현율 제어 가능 RRG를 위한 강화학습 (Reinforcement Learning) 프레임워크를 제안합니다. 이러한 설계는 모델이 다양한 임상 요구 사항에 따라 유연하게 보고서를 생성할 수 있도록 합니다. 임상적 정확성을 보장하기 위해, 우리는 훈련 목표에 lue{임상 보상 (clinical reward)}을 도입하여, 표준 언어 기반 최적화를 넘어 임상적 효능 (Clinical Efficacy, CE)을 향상시키는 데 도움을 줍니다. 또한, 각 훈련 그룹 내에서 보상을 정규화하여 보상 분산을 줄이고 훈련 안정성을 높이는 그룹 상대적 훈련 (Group-relative training) 전략을 적용합니다. MIMIC-CXR 데이터셋에 대한 광범위한 실험 결과, 우리의 방법은 NLG 및 CE 평가 지표 모두에서 최신 기술 (State-of-the-art) 방식들을 지속적으로 능가하는 동시에, CE 정밀도-재현율 트레이드오프에 대한 신뢰할 수 있는 제어를 제공함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

하이브리드 자연어 및 임상 보상 학습을 통한 정밀도-재현율 제어 가능 방사선 보고서 생성

요약

핵심 포인트

댓글