RADD: 다중 모드 지식 그래프 완성 위한 검색 증강 이산 확산
요약
본 논문은 다중 모드 지식 그래프 완성(MMKGC) 모델에서 발생하는 검색과 의사결정 과정의 병목 현상을 해결하기 위해 RADD(Retrieval-Augmented Discrete Diffusion) 프레임워크를 제안합니다. 기존 방식이 단일 임베딩 스코어로 전역 검색과 로컬 세밀화 작업을 결합하는 한계를 지적하며, RADD는 이 두 과정을 분리하여 성능을 향상시킵니다. 구체적으로 관계 인식 리트리버가 후보군(쇼트리스트)을 생성하고, 조건부 확산 모델이 이를 재순위화하여 정밀도와 검색 능력을 모두 극대화합니다.
핵심 포인트
- MMKGC의 핵심 병목 현상: 전역 검색과 로컬 세밀화는 서로 다른 유도 편향을 요구하므로 분리가 필요함.
- RADD 프레임워크 제안: 검색(Retrieve) 단계와 재순위화(Rerank) 단계를 명확히 분리하여 모델의 성능을 개선함.
- 구성 요소 역할: 관계 인식 다중 모드 KGE 리트리버가 전역 후보군을 생성하고, 조건부 이산 노이즈 제거기가 쇼트리스트를 정교하게 재순위화함.
- 학습 및 추론 과정: KGE 지도 신호와 확산 모델의 크로스 엔트로피 손실, 그리고 지식 증류(Knowledge Distillation)를 결합하여 학습하며, 추론 시에는 리트리버 $ ightarrow$ 노이즈 제거기 순서로 작동함.
- 성능 입증: 세 가지 MMKGC 벤치마크에서 기존 및 최신 베이스라인 대비 가장 우수한 성능을 달성했음을 실험적으로 입증함.
대부분의 다중 모드 지식 그래프 완성 (MMKGC) 모델은 전체 엔티티 세트에 대한 검색과 최종 의사결정을 모두 수행하기 위해 하나의 임베딩 스코어 (embedding scorer) 를 사용합니다. 우리는 이러한 결합이 핵심 병목 현상이라고 주장합니다: 전역 고 리콜 (high-recall) 검색과 로컬 세밀한 다의성 제거 (fine-grained disambiguation) 는 서로 다른 유도 편향 (inductive biases) 을 요구하기 때문입니다. 따라서 우리는 MMKGC 의 검색 (retrieve) 과 재순위화 (reranking) 를 분리하기 위해 Retrieval-Augmented Discrete Diffusion (RADD) 프레임워크를 제안합니다. 관계 인식 다중 모드 KGE 리트리버 (relation-aware multimodal KGE retriever) 는 전역 리트리버이자 지식 증류 교사로 역할을 수행하며, 조건부 이산 노이즈 제거기 (conditional discrete denoiser) 는 재순위화를 위한 쇼트리스트 레벨 엔티티-아이디 생성을 수행합니다. 학습은 KGE 지도 신호, 노이즈 제거 크로스 엔트로피, 그리고 리트리버에서 노이즈 제거기로 가는 온도 스케일링 지식 증류 (temperature-scaled distillation) 를 결합합니다. 추론 단계에서는 설계된 Diff-Rerank 가 먼저 리트리버를 통해 톱-$K$ 쇼트리스트를 형성한 다음 노이즈 제거기로 이를 재순위화하여, 정밀도가 리콜의 엄격한 전제조건임을 보장합니다. 세 가지 MMKGC 벤치마크에서 수행한 실험 결과, RADD 는 가장 우수한 성능을 보이며 강력한 단일 모드, 다중 모드 및 LLM 기반 베이스라인 대비 일관된 개선을 달성했습니다. 또한 아블레이션 (ablations) 을 통해 각 구성 요소의 기여를 추가로 검증했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기