본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 29. 16:32

의료 엔티리 트리 학습: MLLM 을 위한 엔티리 중심 의료 데이터 엔지니어링 프레임워크

요약

본 논문은 기존의 파편화된 데이터 큐레이션 방식이 MLLM의 잠재력을 제한하는 문제를 해결하기 위해, 엔티리 중심 의료 데이터 엔지니어링 프레임워크를 제안합니다. 이 프레임워크는 권위 있는 의학 문헌에서 질병, 해부학적 구조 등의 핵심 엔티티를 추출하여 계층적인 '의료 엔티티 트리(MET)'를 구축하는 것이 핵심입니다. MET를 기반으로 노드 기반 검색, 하이브리드 필터링/정렬 파이프라인, 지식 인식 데이터 합성 등 고급 데이터 엔진을 개발했으며, 이를 통해 MLLM의 복잡한 임상 추론 능력을 크게 향상시켰음을 입증했습니다.

핵심 포인트

  • MLLMs의 의료 성능 저해 원인: 기존의 모달리티/부서별 파편화된 데이터 큐레이션 방식.
  • 핵심 제안: 엔티리 중심 의료 데이터 엔지니어링 프레임워크를 통해 '의료 엔티티 트리(MET)' 구축.
  • MET 기반 고급 엔진 구성 요소: 노드 기반 검색, 시각-의미 대응을 위한 하이브리드 필터링/정렬 파이프라인, 지식 인식 데이터 합성.
  • 성과 입증: 6가지 의료 벤치마크에서 MLLM의 복잡한 임상 쿼리 처리 및 추론 능력을 현저히 향상시킴.

멀티모달 대형 언어 모델 (MLLMs) 은 의료 분야에서 변혁적인 잠재력을 보여주었으나, 모달리티나 부서별로 거칠게 분할하는 기존 데이터 큐레이션 전략에 의해 성능이 저해되고 있습니다. 이러한 파편화된 접근 방식은 임상 의학 지식의 계층적이고 상호 연결된 성격을 포착하지 못하여, 모델의 세밀한 인식과 복잡한 추론 능력을 제한합니다. 본 논문에서는 새로운 엔티리 중심 의료 데이터 엔지니어링 (Entity-Centric Medical Data Engineering) 프레임워크를 제안합니다. 우리는 권위 있는 의학 문헌에서 엔티리를 자동으로 추출하여 질병, 해부학적 구조, 모달리티, 증상 등을 통합된 지식 저장소에 체계적으로 인코딩하는 계층적 구조인 의료 엔티리 트리 (Medical Entity Tree, MET) 를 구성합니다. MET 를 기반으로 하여, 우리는 다음을 포함한 고급 데이터 엔진을 제안합니다: (1) 노드 기반 검색 (node-guided retrieval) 을 통해 원본 데이터를 특정 의학 개념에 고정시키고, (2) 정확한 시각-의미 대응을 보장하기 위한 2 단계 하이브리드 필터링 및 정렬 파이프라인, (3) 구조적 제약을 활용하여 풍부한 캡션과 표적 추론 VQA 쌍을 생성하는 지식 인식 데이터 합성 (knowledge-aware data synthesis) 입니다. 여섯 가지 의료 벤치마크에 대한 광범위한 평가 결과, 우리의 접근 방식은 범용 MLLM 의 의학 능력을 현저히 향상시켜 복잡한 임상 쿼리를 처리하고 다양한 의료 컨텍스트에서 최첨단 성능을 달성할 수 있는 능력을 개선함을 입증했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
5

댓글

0