하이브리드 자연어 및 임상 보상 학습을 통한 정밀도-재현율 제어 가능 방사선 보고서 생성
요약
임상적 정밀도와 재현율을 제어할 수 있는 새로운 방사선 보고서 생성(RRG) 강화학습 프레임워크를 제안합니다. 기존 NLG 지표의 한계를 넘어 임상 보상과 그룹 상대적 훈련 전략을 통해 임상적 효능을 극대화했습니다.
핵심 포인트
- 정밀도와 재현율 사이의 트레이드오프를 명시적으로 제어 가능
- 임상적 효능(CE) 향상을 위한 임상 보상(Clinical Reward) 도입
- 훈련 안정성을 높이기 위한 그룹 상대적 훈련 전략 적용
- MIMIC-CXR 데이터셋에서 기존 SOTA 방식 대비 우수한 성능 입증
자동화된 방사선 보고서 생성 (Radiology Report Generation, RRG)은 임상 보고서 작성의 과중한 업무량을 줄일 수 있기 때문에 점점 더 많은 관심을 받고 있습니다. 그러나 기존의 대부분의 방법은 언어의 유창성에 초점을 맞춘 자연어 생성 (Natural Language Generation, NLG) 지표를 주로 최적화하는 반면, 정밀도 (Precision) 및 재현율 (Recall)과 같이 임상적으로 중요한 요소에 대한 제어 기능은 거의 제공하지 못합니다. 그 결과, 생성된 보고서는 유창할 수는 있지만 다양한 임상적 요구 사항과 잘 일치하지 않을 수 있습니다. 이러한 문제를 해결하기 위해, 우리는 추론 과정에서 제어 파라미터가 임상적 정밀도와 재현율 사이의 트레이드오프 (Trade-off)를 명시적으로 조정하는, 정밀도-재현율 제어 가능 RRG를 위한 강화학습 (Reinforcement Learning) 프레임워크를 제안합니다. 이러한 설계는 모델이 다양한 임상 요구 사항에 따라 유연하게 보고서를 생성할 수 있도록 합니다. 임상적 정확성을 보장하기 위해, 우리는 훈련 목표에 lue{임상 보상 (clinical reward)}을 도입하여, 표준 언어 기반 최적화를 넘어 임상적 효능 (Clinical Efficacy, CE)을 향상시키는 데 도움을 줍니다. 또한, 각 훈련 그룹 내에서 보상을 정규화하여 보상 분산을 줄이고 훈련 안정성을 높이는 그룹 상대적 훈련 (Group-relative training) 전략을 적용합니다. MIMIC-CXR 데이터셋에 대한 광범위한 실험 결과, 우리의 방법은 NLG 및 CE 평가 지표 모두에서 최신 기술 (State-of-the-art) 방식들을 지속적으로 능가하는 동시에, CE 정밀도-재현율 트레이드오프에 대한 신뢰할 수 있는 제어를 제공함을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기