본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 22. 14:05

ChronoMedKG: 임상 추론을 위한 시간적 근거 기반 생물 의학 지식 그래프 및 벤치마크

요약

임상 추론의 핵심인 시간적 정보를 반영한 생물 의학 지식 그래프 ChronoMedKG와 벤치마크 ChronoTQA를 제안합니다. 기존 KG의 한계를 넘어 질병의 발병 시기와 진행 단계를 포함하며, LLM의 시간적 추론 능력을 크게 향상시킵니다.

핵심 포인트

  • 시간적 구성 요소를 포함한 46만 개의 증거 연결 트리플 구축
  • 멀티 에이전트 파이프라인을 통한 고신뢰도 지식 추출
  • 희귀 질환을 포함한 6,250개의 새로운 시간적 근거 추가
  • ChronoTQA 벤치마크를 통한 LLM의 시간적 추론 성능 검증
  • RAG 적용 시 LLM의 롱테일 실패 사례를 최대 65% 개선

생물 의학 지식 그래프 (Knowledge Graphs, KGs)는 질병 연관성을 정적인 사실로 취급하지만, 시간적 정보는 임상 추론 (Clinical Reasoning)에 있어 매우 중요합니다. 예를 들어, 3세 때 특정 질병을 진단하는 증상이 13세 때는 다른 질병을 의미할 수 있습니다. PrimeKG, Hetionet, iKraph와 같은 기존의 KGs는 질병의 경과에 따라 특정 소견이 언제 임상적으로 유의미해지는지를 인코딩하지 않습니다. 이는 종단적 임상 추론 (Longitudinal Clinical Reasoning) 및 검색 증강 (Retrieval Augmentation)에 대한 유용성을 제한합니다. 우리는 13,431개의 질병을 다루며 (1,300만 개의 원시 추출 데이터에서 필터링된) 460,497개의 증거 연결 트리플 (Evidence-linked Triples)을 포함하는 시간적 생물 의학 지식 그래프인 ChronoMedKG를 소개합니다. 각 연관성은 발병 시기 (Onset Window) 또는 진행 단계 (Progression Stage)와 같은 시간적 구성 요소와 연결되어 있으며, 이는 PMID 추적이 가능한 증거와 다중 신호 신뢰도 점수 (Multi-signal Credibility Score)에 의해 뒷받침됩니다. 이 그래프는 여러 최첨단 LLM (Frontier LLMs)이 PubMed 및 PMC 문헌에서 독립적으로 지식을 추출하는 질병 자율형 멀티 에이전트 파이프라인 (Disease-autonomous Multi-agent Pipeline)을 통해 구축되었습니다. 다중 모델 합의 (Multi-model Consensus)를 통해 지원되고, 신뢰도 필터링 (Credibility Filtering) 및 온톨로지 정렬 (Ontology Alignment)을 통과한 관계들만이 유지됩니다. ChronoMedKG는 Orphadata에 대해 92.7%의 일치도를 기록했으며, HPOA, Orphadata, Phenopackets에 존재하지 않는 6,250개의 질병에 대한 시간적 근거를 추가하였고, 여기에는 Orphanet 코드가 부여된 1,657개의 희귀 질환이 포함됩니다. 우리는 더 나아가 8가지 작업 유형 (6가지 시간적 유형 및 2가지 정적 대조군)에 걸친 3,341개의 질문과 12개의 질문으로 구성된 보충 조사 (Supplementary Probe)를 포함하는 벤치마크인 ChronoTQA를 소개합니다. 최첨단 LLM들은 정적 질문에서 시간적 질문으로 넘어갈 때 약 30점의 점수 하락을 보였습니다. ChronoMedKG 검색은 이들의 롱테일 실패 (Long-tail Failures) 중 47-65%를 구제해냈으며, 이는 HPOA-RAG의 17-29%와 대조적입니다. 이와 같이, ChronoMedKG는 기존에 부재했던 검색 증강 임상 시스템을 위한 결정적인 시간적 축을 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0