arXiv논문2026. 06. 17. 11:18

LLM 특징이 GNN에 해를 끼칠 수 있는 이유: 동종성(Homophilous) 그래프 벤치마크에서의 결합 간섭

요약

LLM 특징을 GNN에 단순 결합할 때 동종성(homophily)이 높은 그래프 벤치마크에서 정확도가 오히려 저하될 수 있음을 발견했습니다. 연구팀은 이를 예측하기 위한 지표인 Delta_sig를 제안하며, 결합의 이득과 손실을 결정하는 메커니즘을 분석했습니다.

핵심 포인트

LLM 특징의 단순 결합이 특정 그래프 데이터셋의 정확도를 체계적으로 저하시킴
동종성(Homophily) 수준에 따라 LLM 특징 결합의 효과가 반전됨
LLM의 판별력을 나타내는 Delta_sig 지표를 통해 결합 비용 예측 가능
차원 및 가중치 감쇠 등 인위적 오류가 아닌 구조적 문제임을 입증

LLM(Large Language Model)이 생성한 노드 특징(node features)을 그래프 신경망(GNNs)에 추가하는 것은 표준 벤치마크에서 정확도를 향상시킨다고 널리 보고되어 왔습니다. 우리는 이와 상반되는 관찰 결과를 기록합니다. LLM 특징이 (공동 학습(joint training), 증류(distillation), 또는 프롬프트 조건화(prompt-conditioning)가 아닌) 순수 입력 결합(pure input concatenation)을 통해 도입될 때, 엔드투엔드(end-to-end) LLM 파이프라인이 성공하는 동일한 동종성(homophilous) 벤치마크에서 정확도를 체계적으로 저하시킬 수 있다는 점입니다. Planetoid 공개 분할(public split) 데이터셋과 bag-of-words 원본 특징을 사용하고 MLP 백본(backbone)을 적용했을 때, SBERT로 인코딩된 GPT-4o-mini TAPE 특징을 결합하면 PubMed 테스트 정확도는 -17.0 +/- 0.3 pp, Cora는 -4.3 +/- 0.6 pp 감소합니다 (CiteSeer는 -0.6 +/- 0.8 pp로, 시드 노이즈(seed noise) 범위 내에 있음). 이러한 하락은 각 조건(GCN / GCNII / GAT 백본, 무작위 분할, 더 작은 인코더)을 완화함에 따라 약화되며, 중간 정도의 동종성을 가진 WikiCS (+4.4 pp) 및 ogbn-arxiv (+11.7 pp)에서는 반전됩니다. 결합이 도움이 되는지 아니면 해가 되는지를 예측하기 위해, 우리는 LLM 단독 판별력(discriminability)의 단순한 척도인 Delta_sig를 보고합니다. 9개 데이터셋에 대해 Delta_sig는 점 추정치(point estimate)에서 동종성보다 결합 비용(concatenation cost)과 더 강력하게 상관관계가 있습니다 (r^2 = 0.38 대 0.06; N=9, 부트스트랩 신뢰 구간(bootstrap CIs) 중첩). 부트스트랩 최적 변화 지점(change-point)은 tau = 13.8 pp이며, "Delta_sig <= tau는 비양수 결합 비용을 예측한다"는 규칙은 9개 데이터셋 중 7개를 정확하게 분류합니다. 부트스트랩 샘플의 60%가 tau를 [5, 30] pp 범위에 두기 때문에, 우리는 Delta_sig를 정밀 필터라기보다는 해석적 관점으로 취급합니다. PubMed에 대한 차원 제어 절제 연구(dimension-controlled ablation) 결과, LLM 특징으로 인한 하락은 동일 소스 PCA (-2.3 pp)와 동일 차원 가우시안 노이즈 (-37.3 pp) 사이에 위치하여, 차원(dimensionality) 및 가중치 감쇠(weight-decay)로 인한 인위적 오류(artifacts)를 배제합니다. 9개의 PubMed 구성은 |Delta_concat|이 (sqrt(d_l/n))^1.31에 비례한다는 멱법칙(power law)을 따르며 r^2 = 0.97을 나타냅니다. 낮은 Delta_sig와 작은 n의 영역이 바로 헤드라인에 언급된 -17 pp의 PubMed 결손이 나타나는 지점입니다.

AI 자동 생성 콘텐츠

원문 바로가기

LLM 특징이 GNN에 해를 끼칠 수 있는 이유: 동종성(Homophilous) 그래프 벤치마크에서의 결합 간섭

요약

핵심 포인트

댓글