TAG-DLM: 텍스트 속성 그래프 학습을 위한 확산 언어 모델 (Diffusion Language Models)
요약
텍스트 속성 그래프(TAG) 학습을 위해 텍스트 추론과 그래프 메시지 패싱을 통합한 마스크 확산 언어 모델(TAG-DLM)을 제안합니다. 이 모델은 토폴로지 어텐션 마스크를 통해 그래프 구조를 주입하며, 별도의 미세 조정 없이도 다양한 그래프 태스크를 수행할 수 있습니다.
핵심 포인트
- 텍스트와 그래프 토폴로지를 단일 확산 언어 모델 내에서 통합 처리
- 토폴로지 어텐션 마스크를 통한 그래프 구조 주입 및 선형화 구현
- 프롬프트 변경만으로 노드 분류, 링크 예측 등 다양한 태스크 적응 가능
- 기존 GNN, Graph Transformer 및 LLM 기반 모델 대비 성능 우위 입증
각 노드가 자연어 설명을 포함하는 텍스트 속성 그래프 (Text-attributed graphs, TAGs)는 텍스트와 그래프 토폴로지 (topology)를 공동으로 추론할 수 있는 모델을 필요로 합니다. 기존 방식들은 종종 이 두 가지 모달리티 (modalities)를 별도로 처리합니다. 즉, 그래프 신경망 (Graph Neural Networks, GNNs)은 얕은 텍스트 특징 (text features) 위에서 작동하며, LLM과 그래프의 하이브리드 모델은 언어 모델을 주로 텍스트 인코더 (text encoder)로 사용하고 구조 학습 (structure learning)은 별도의 그래프 모듈에 위임합니다. 우리는 양방향 어텐션 (bidirectional attention)과 생성적 디코딩 (generative decoding)을 갖춘 언어 모델인 마스크 확산 언어 모델 (masked diffusion language model) 내에서 텍스트 추론과 그래프 메시지 패싱 (message passing)을 통합하는 방법을 제안합니다. 각 그래프 인스턴스에 대해, 이 방법은 샘플링된 로컬 이웃 (local neighbourhood)을 토큰 시퀀스 (token sequence)로 선형화하고, 그래프 상의 메시지 패싱을 구현하는 토폴로지 어텐션 마스크 (topology attention mask)를 통해 그래프 구조를 주입합니다. 확산 언어 모델은 텍스트를 해석하고 생성할 수 모두 가능하기 때문에, 이 방법은 프롬프트 (prompt)를 변경하는 것만으로 다양한 태스크에 적응할 수 있으며, 타겟 특정 미세 조정 (target-specific fine-tuning) 없이 노드 분류 (node classification), 링크 예측 (link prediction), 그리고 교차 데이터셋 전이 (cross-dataset transfer)를 지원합니다. 실험 결과, 이 방법은 두 가지 태스크에 걸친 세 가지 TAG 벤치마크 모두에서 그래프 신경망 (GNNs), 그래프 트랜스포머 (Graph Transformers), 그리고 LLM 기반 베이스라인 (baselines)보다 뛰어난 성능을 보였으며, 가장 강력한 베이스라인보다 최대 3.9포인트 향상된 성능을 기록했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기