토양 유기 탄소 (SOC) 예측을 위한 Mixture of Experts 기반 멀티모달 시공간 그래프 신경망
요약
토양 유기 탄소(SOC) 예측을 위해 멀티모달 시공간 그래프 신경망인 SpTGNN을 제안합니다. 이 모델은 이종 그래프 어텐션과 MoE 모듈을 결합하여 분광 및 시공간 정보를 효과적으로 융합하며, 기존 머신러닝 모델보다 뛰어난 예측 성능을 보여줍니다.
핵심 포인트
- 이종 그래프와 관계형 어텐션을 통한 공간적/분광적 패턴 학습
- TerraMind 인코더를 활용한 멀티모달 신호 특징 추출
- MoE(Mixture-of-Experts) 모듈을 통한 다중 스트림 데이터 융합
- 이분산 회귀와 딥 앙상블을 결합한 정교한 불확실성 정량화
- 글로벌 데이터셋 테스트 결과 XGBoost 대비 높은 예측 정확도 달성
표토 유기 탄소 (SOC) 예측은 농업의 지속 가능성, 토지 이용 정책 및 시비 계획에 있어 필수적입니다. 기존 방식들은 두 가지 한계에 직면해 있습니다. 첫째, 수작업으로 제작된 공변량 (covariates)을 고전적인 머신러닝 (ML) 또는 단일 모달 (single-modal) 딥러닝 모델과 결합하여 풍부한 분광 및 시간 정보를 놓치고 있으며, 둘째, 그리드 기반 아키텍처는 필드 측정값의 불규칙한 공간 구조를 무시합니다. 우리는 이 두 가지 문제를 모두 해결하는 멀티모달 시공간 그래프 신경망인 SpTGNN을 소개합니다. SpTGNN은 토양 측정값을 세 가지 엣지 유형(공간적 근접성, 분광 유사성, 고도)을 가진 이종 그래프 (heterogeneous graph)의 노드로 표현하며, 관계별로 별도의 패턴을 학습하기 위해 관계형 그래프 어텐션 (relational graph attention)을 적용합니다. 미세 조정된 (fine-tuned) TerraMind 인코더는 Sentinel-2, Sentinel-1 및 DEM 신호로부터 노드 특징을 추출하며, 이는 샘플별 환경 공변량 및 학습된 위치 및 시간 임베딩 (embeddings)과 결합됩니다. 희소 Mixture-of-Experts (MoE) 모듈은 top-$k$ 라우팅을 통해 네 가지 스트림을 융합합니다. 불확실성 (uncertainty)은 이분산 회귀 (heteroscedastic regression, aleatoric)와 딥 앙상블 (deep ensembles, epistemic)을 결합하여 포착하며, Moran's $I$ 페널티가 공간적 자기상관 (spatial autocorrelation)을 규제합니다. 우리는 세 개의 지역적 인스턴스로 분할된 글로벌 SOC 코퍼스(전 세계 약 49k 샘플, 아프리카 약 26k, 유럽 약 14k)에서 평가를 수행했습니다. 우리의 5개 멤버 딥 앙상블은 아프리카 테스트 분할에서 $R^2=0.762$, RMSE $=3.51 ext{ extpm}0.48$ g/kg 및 MAPE $=22.9 ext{ extperthousand}$를 기록하며 표 형식의 XGBoost 베이스라인보다 성능을 개선했습니다. 최상의 단일 체크포인트는 검증 $R^2=0.864$에 도달했습니다. 절제 연구 (Ablations)를 통해 이종 그래프, MoE 융합 및 미세 조정된 백본 (backbone)이 각각 실질적으로 기여함을 확인했으며, 앙상블 UQ 스택은 사후 교정 (post-calibration) 후 ECE $0.031$ (하이브리드) 및 $0.026$ ($eta$-NLL)을 달성했습니다. 우리가 알기로, 이는 SOC 추정을 위해 파운데이션 모델 (foundation-model) 특징 추출, 이종 그래프 어텐션 및 분해된 불확실성 정량화 (uncertainty quantification)를 통합한 최초의 프레임워크입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기