신뢰할 수 있는 교차 시스템 의료 추론을 위한 쿼리 조건부 지식 정렬
요약
본 논문은 이기종 의료 시스템 통합 시 발생하는 엔티티 정렬의 한계를 극복하기 위해 쿼리 조건부 엔티티 정렬(QCEA) 프레임워크를 제안합니다. 기존의 정적인 매칭 방식 대신 텍스트 설명을 쿼리로 활용하여 문맥 의존적이고 비대칭적인 다대다 대응 관계를 포착합니다. 실험 결과, 증상 및 약재-분자 정렬 작업에서 성능 향상을 보였으며, RAG 시스템의 검색 정확도와 답변 신뢰성을 높이는 데 기여함을 입증했습니다.
핵심 포인트
- 엔티티 정렬을 정적 매칭이 아닌 쿼리 조건부 대응 문제로 재정의
- 의미론적 인코딩, 그래프 기반 표현 학습, 방향 인식 변환 모듈을 통합한 QCEA 프레임워크 제안
- 비대칭적 및 다대다(many-to-many) 대응 관계를 효과적으로 포착
- 개선된 정렬이 RAG의 증거 검색 및 근거 제시(grounding) 성능을 향상시킴
도메인 간 지식 정렬(Cross-domain knowledge alignment)은 이기종 의료 시스템을 통합하는 데 필수적이지만, 기존 방식들은 일반적으로 엔티티 정렬(entity alignment)을 정적인 매칭 문제로 취급하여 쿼리 문맥(query context)과 시스템 간 비대칭성(cross-system asymmetry)을 무시합니다. 이러한 한계는 개념 간의 대응 관계가 본질적으로 문맥 의존적이고, 일대일 대응이 아니며(non-bijective), 방향에 민감한(direction-sensitive) 통합 의료 환경에서 특히 치명적입니다. 본 논문에서는 엔티티 정렬을 쿼리 조건부 대응 문제로 재정의하는 쿼리 조건부 엔티티 정렬(Query-Conditioned Entity Alignment, QCEA)을 제안합니다. QCEA는 엔티티 표현(entity representations) 간의 고정된 매핑을 학습하는 대신, 소스 엔티티의 텍스트 설명을 쿼리로 취급하고 타겟 그래프 내의 후보 엔티티들의 순위를 매김으로써 문맥 의존적인 정렬을 가능하게 합니다. 이 프레임워크는 의미론적 인코딩(semantic encoding), 그래프 기반 표현 학습(graph-based representation learning), 그리고 방향 인식 변환 모듈(direction-aware transformation module)을 통합하여 이기종 지식 시스템 전반에 걸친 비대칭적 및 다대다(many-to-many) 대응 관계를 포착합니다. 우리는 SymMap에서 파생된 TCM--WM 지식 그래프를 사용하여 증상 정렬(symptom alignment) 및 약재-분자 정렬(herb--molecule alignment) 작업을 모두 포함하여 QCEA를 평가합니다. 실험 결과, 대표적인 베이스라인(baselines) 모델들과 비교하여 Hit@K 및 MRR과 같은 순위 민감 지표(rank-sensitive metrics)에서 일관된 개선을 보였습니다. 나아가, 다운스트림 검색 증강 생성(Retrieval-Augmented Generation, RAG) 실험을 통해 개선된 정렬이 더 나은 증거 검색, 더 강력한 근거 제시(grounding), 그리고 더 높은 답변 정확도로 이어진다는 것을 입증했습니다. 이러한 결과는 정렬이 단순한 데이터 통합 단계가 아니라, 교차 시스템 의료 추론에서 지식의 접근성과 신뢰성을 형성하는 핵심 요소임을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기