엔티티 정렬 (Entity Alignment) 파운데이션 모델을 위한 구조적 컨텍스트 활용
요약
이기종 지식 그래프 간 엔티티 정렬(EA) 성능을 높이기 위해 구조적 컨텍스트를 활용하는 ContextEA 프레임워크를 제안합니다. 앵커 브리지를 통한 교차 그래프 상호작용 인코더와 구조적 보정 디코더를 통해 미학습 KG에 대한 전이 능력을 크게 향상시켰습니다.
핵심 포인트
- ContextEA: 구조적 컨텍스트를 강화한 인코더-디코더 프레임워크
- 교차 KG 상호작용 인코더를 통한 관계 인식 그래프 전파 구현
- 구조적 보정 디코더로 엔티티 및 이웃 수준의 정렬 점수 정밀화
- 29개 데이터셋 실험 결과, 미세 조정된 베이스라인보다 높은 전이 성능 입증
엔티티 정렬 (Entity Alignment, EA)은 이기종 지식 그래프 (Knowledge Graphs, KGs) 간의 동등한 엔티티를 식별하는 것을 목표로 하며, 지식 융합 및 교차 KG 추론 (cross-KG reasoning)의 핵심 구성 요소입니다. 최근의 EA 파운데이션 모델은 일단 사전 학습된 정렬 지식이 이전에 본 적 없는 다양한 KG 쌍에 직접 적용될 수 있음을 보여주었습니다. 그러나 여전히 두 가지 측면에서 구조적 컨텍스트 (structural context)를 충분히 활용하지 못하고 있습니다: 인코딩 (encoding) 과정 중 교차 KG 상호작용이 약하며, 최종 후보 순위 지정 (candidate ranking)이 여전히 거친 유사도 (coarse similarity)에 너무 많이 의존한다는 점입니다. 우리는 전이 가능한 EA를 위한 강화된 인코더-디코더 (encoder-decoder) 프레임워크인 ContextEA를 통해 이러한 한계를 해결합니다. 인코더 측면에서는, 앵커 브리지 (anchor bridges)를 통해 두 KG를 통합하고 더 이른 단계에서 관계 인식 교차 그래프 전파 (relation-aware cross-graph propagation)를 수행하는 교차 KG 상호작용 인코더를 도입합니다. 디코더 측면에서는, 엔티티 수준, 이웃 수준, 관계 수준 및 앵커 인식 구조적 증거를 통해 정렬 점수를 보정하는 구조적 보정 디코더 (structural calibration decoder)를 도입합니다. 이러한 설계는 경량성을 유지하면서 구조적 컨텍스트 구축과 구조적 컨텍스트 활용을 모두 강화합니다. OpenEA, SRPRS, DBP의 29개 EA 데이터셋에 대한 실험 결과, 강력한 전이 가능 베이스라인 (transferable baselines) 대비 일관된 성능 향상을 보여주었습니다. 특히, 사전 학습된 ContextEA는 세 가지 벤치마크 그룹 모두에서 미세 조정된 (finetuned) 베이스라인을 이미 능가하며, 보지 못한 KG에 대해 실질적으로 더 강력한 전이 능력을 입증했습니다. 이러한 결과는 구조적 컨텍스트를 명시적으로 활용하는 것이 EA 파운데이션 모델을 개선하는 데 효과적인 방향임을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기