arXiv논문2026. 06. 24. 10:12

RetiSEM: 파편화된 생물 의학 데이터를 위한 인과 모델의 일반화

요약

파편화된 생물 의학 데이터 환경에서 인과 그래프 복구와 매개 분석을 수행하는 RetiSEM 프레임워크를 제안합니다. 도메인 제약 구조 방정식 모델링(SEM)을 통해 제한된 멀티모달 자원에서도 높은 인과 정확도를 달성합니다.

핵심 포인트

생물학적 정보를 활용한 블록 구성 및 금지된 엣지 제약 적용
경로 효과를 TE, NDE, NIE 구성 요소로 정밀하게 분해
합성 벤치마크 및 실제 NHANES 데이터를 통한 성능 검증
기존 베이스라인 대비 낮은 구조적 오류와 높은 인과 정확도 달성

파편화된 생물 의학 데이터(biomedical data)로부터 인과 모델(causal models)을 학습하는 것은 임상, 분자 및 영상 변수들이 종종 불완전하거나 공동으로 관찰되지 않기 때문에 매우 어렵습니다. 우리는 제한된 멀티모달 자원(multimodal resources) 환경에서 인과 그래프 복구(causal graph recovery) 및 매개 분석(mediation analysis)을 위한 도메인 제약 구조 방정식 모델링 (SEM, structural equation modelling) 프레임워크인 RetiSEM을 제안합니다. 본 연구에서 제안하는 작업은 변수들을 생물학적으로 정보가 제공된 블록(biologically informed blocks)으로 구성하고, 금지된 엣지 제약(forbidden-edge constraints)을 적용하며, 경로 수준의 효과를 TE(total effect), NDE(natural direct effect), NIE(natural indirect effect) 구성 요소로 분해합니다. 우리는 차원(dimensionality), 비선형성(nonlinearity), 인과적 깊이(causal depth), 경로 구조(pathway structure)가 다양한 10개의 합성 벤치마크 시나리오와, NHANES 임상 변수와 외부에서 유도된 망막 표현(retinal representations)을 결합한 파편화된 실제 환경을 통해 RetiSEM을 평가합니다. 이 접근 방식은 합성 벤치마크 전반에서 제약이 없는 베이스라인(baselines)보다 더 낮은 구조적 오류(structural error)와 더 높은 인과 정확도(causal accuracy)를 달성합니다. 실제 데이터 분석에서 망막 변수는 주로 하위 단계의 바이오마커와 같은 지표로 작동하며, 작지만 감지 가능한 간접 효과(indirect effects)를 보입니다. 이러한 결과는 우리의 전략이 자원이 제한된 생물 의학 AI에서 구조화된 인과 가설을 테스트하기 위한 해석 가능한 프레임워크임을 뒷받침합니다. 본 연구의 코드와 리소스는 다음에서 공개적으로 사용할 수 있습니다: https://github.com/Inamullah-Colab/ReitSEM.

AI 자동 생성 콘텐츠

원문 바로가기

RetiSEM: 파편화된 생물 의학 데이터를 위한 인과 모델의 일반화

요약

핵심 포인트

댓글