본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 30. 16:46

ArchEHR-QA 2026 HealthNLP_Retrievers: 근거 기반 임상 질문 답변을 위한 연동형 LLM 파이프라인

요약

본 논문은 전자 건강 기록(EHRs)을 대상으로 하는 근거 기반 질문 답변(grounded QA) 과제를 해결하기 위한 연동형 LLM 파이프라인인 HealthNLP_Retrievers 시스템을 제시합니다. 이 시스템은 Gemini 2.5 Pro를 기반으로 하며, 환자 쿼리 재형식화, 증거 스코어링, 근거 기반 답변 생성, 그리고 정밀한 답변-증거 정렬의 네 가지 통합 모듈로 구성됩니다. 이러한 다단계 파이프라인 접근 방식은 LLM을 구조화하여 근거 기반성, 정밀도 및 전문적인 건강 커뮤니케이션 능력을 크게 향상시켰습니다.

핵심 포인트

  • EHRs를 위한 근거 기반 질문 답변(grounded QA)에 초점을 맞춘 시스템 아키텍처를 제안함.
  • Gemini 2.5 Pro를 핵심 LLM으로 사용하며, 네 가지 모듈로 구성된 다단계 파이프라인을 구축함.
  • 파이프라인은 (1) 쿼리 재형식화, (2) 증거 스코어링, (3) 근거 기반 답변 생성, (4) 답변-증거 정렬의 순서로 작동하여 정확도를 높임.
  • 구조화된 다단계 파이프라인 통합을 통해 LLM의 근거 기반성(grounding)과 전문성을 향상시킬 수 있음을 입증함.

환자 포털은 이제 개인이 전자 건강 기록 (EHRs) 에 직접 접근할 수 있게 해주지만, 접근성만으로는 환자들이 이러한 기록에 포함된 복잡한 임상 정보를 이해하거나 행동하는 것을 보장하지는 않습니다. ArchEHR-QA 2026 공유 과제는 EHRs 를 대상으로 한 근거 기반 질문 답변 (grounded question answering) 에 초점을 맞추어 이 과제를 해결하며, 본 논문은 HealthNLP_Retrievers 팀이 개발한 해당 과제를 위한 시스템을 제시합니다. 제안된 접근법은 Gemini 2.5 Pro 대형 언어 모델을 기반으로 한 다단계 연동 파이프라인을 사용하여 환자 작성 질문을 해석하고 긴 임상 노트에서 관련 증거를 검색합니다. 우리의 아키텍처는 네 가지 통합 모듈로 구성됩니다: (1) 장황한 환자 쿼리를 요약하는 퓨샷 쿼리 재형식화 단위, (2) 회상 (recall) 을 최우선으로 하기 위해 임상 문장을 순위 매기는 휴리스틱 기반 증거 스코어러, (3) 식별된 증거에만 엄격히 제한된 전문가 수준의 답변을 종합하는 근거 기반 응답 생성기, (4) 생성된 답변을 지원 임상 문장과 연결하는 고정밀 다대다 정렬 프레임워크입니다. 이 연동 방식은 경쟁력 있는 결과를 달성했습니다. 개별 트랙별로 시스템은 질문 해석에서 1 위, 답변 생성에서 5 위, 증거 식별에서 7 위, 답변-증거 정렬에서 9 위를 차지했습니다. 이러한 결과는 대형 언어 모델을 구조화된 다단계 파이프라인 내에 통합함으로써 근거 기반성 (grounding), 정밀도 및 환자 지향적 건강 커뮤니케이션의 전문성을 향상시킨다는 것을 보여줍니다. 재현성을 지원하기 위해 소스 코드는 우리의 GitHub 저장소에 공개되어 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
4

댓글

0