본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 14. 07:05

EHR-RAGp: 전자 건강 기록 (Electronic Health Records)을 위한 검색 증강 프로토타입 가이드 파운데이션 모델

요약

EHR-RAGp는 전자 건강 기록(EHR)의 복잡한 역사적 데이터를 효과적으로 활용하기 위해 설계된 검색 증강 파운데이션 모델입니다. 이 모델은 다양한 임상 이벤트 유형에 걸쳐 가장 관련성 높은 환자 이력을 동적으로 통합하는 프로토타입 가이드 검색 모듈을 제안합니다. EHR-RAGp는 기존의 고정된 윈도우 방식의 한계를 극복하고, 여러 임상 예측 작업에서 최첨단 성능을 보여주며 장기적인 임상 문맥 활용에 효율적인 프레임워크를 제공합니다.

핵심 포인트

  • EHR 데이터는 종단적이고 이질적이며 시간적으로 불규칙하여 분석이 어렵다.
  • EHR-RAGp는 검색 증강(Retrieval-Augmented) 방식을 사용하여 가장 관련성 높은 환자 이력을 동적으로 통합한다.
  • 핵심은 '프로토타입 가이드 검색 모듈'로, 주어진 예측 작업에 대한 역사적 청크의 관련성을 추정하여 모델을 안내한다.
  • EHR-RAGp는 기존 EHR 파운데이션 모델 및 트랜스포머 기반 베이스라인보다 일관되게 높은 성능을 보인다.
  • 이 프레임워크는 다운스트림 임상 예측 작업의 성능 향상을 위한 확장 가능하고 효율적인 방법을 제공한다.

전자 건강 기록 (Electronic Health Records, EHR)은 풍부한 종단적 환자 정보를 포함하고 있으며 예측 모델링 애플리케이션에서 널리 사용됩니다. 그러나 긴 궤적 (long trajectories), 이질적인 이벤트 (heterogeneous events), 시간적 불규칙성 (temporal irregularity), 그리고 과거 임상 문맥 (clinical context)의 가변적인 관련성으로 인해 역사적 데이터를 효과적으로 활용하는 것은 여전히 어려운 과제로 남아 있습니다. 기존의 접근 방식들은 종종 고정된 윈도우 (fixed windows) 또는 균일한 집계 (uniform aggregation)에 의존하며, 이는 임상적으로 중요한 신호를 가릴 수 있습니다. 본 연구에서는 다양한 임상 이벤트 유형에 걸쳐 가장 관련성이 높은 환자 이력을 동적으로 통합하는 검색 증강 파운데이션 모델 (retrieval-augmented foundation model)인 EHR-RAGp를 소개합니다. 우리는 정렬 메커니즘 (alignment mechanism) 역할을 하며 주어진 예측 작업에 대한 검색된 역사적 청크 (historical chunks)의 관련성을 추정하여 모델이 가장 정보가 많은 문맥을 향하도록 안내하는 프로토타입 가이드 검색 모듈 (prototype-guided retrieval module)을 제안합니다. 여러 임상 예측 작업에 걸쳐, EHR-RAGp는 최첨단 (state-of-the-art) EHR 파운데이션 모델 및 트랜스포머 (transformer) 기반 베이스라인 모델들을 일관되게 능가합니다. 또한, EHR-RAGp를 기존의 임상 파운데이션 모델과 통합하면 상당한 성능 향상을 얻을 수 있습니다. 종합적으로, EHR-RAGp는 다운스트림 성능을 향상시키기 위해 장기적인 임상 문맥을 활용할 수 있는 확장 가능하고 효율적인 프레임워크를 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0