불완전한 그래프 증거 하에서의 LLM 추론 그라운딩 (Grounding)
요약
불완전한 지식 그래프 증거를 바탕으로 LLM의 추론 궤적을 그라운딩하는 이론적 프레임워크를 제안합니다. 하드 그라운딩의 한계를 지적하며, LLM의 사전 확률을 활용한 소프트 그라운딩(soft grounding) 방식의 유효성을 입증합니다.
핵심 포인트
- 불완전한 지식 그래프 하에서의 LLM 추론 그라운딩 이론 개발
- 하드 그라운딩의 한계와 소프트 그라운딩의 필요성 제시
- KL 정규화를 통한 LLM 사전 확률의 변형 방식 제안
- GraphRAG, KGQA, 그래프 에이전트 등에 적용 가능한 프레임워크
지식 그래프 (Knowledge graphs)는 대규모 언어 모델 (LLMs)의 추론을 안내할 수 있지만, 시스템이 보는 그래프는 진실에 대한 완전한 기록이라기보다는 일반적으로 검색되고, 연결되며, 시간적 범위가 지정된 불완전한 증거 상태 (evidence state)입니다. 우리는 이러한 불완전한 그래프 증거 하에서 관찰 가능한 LLM 궤적 (trajectories)을 그라운딩 (grounding)하는 것에 대한 이론적 관점을 개발합니다. 증거 상태는 엔티티 앵커 (entity anchors), 유형화된 관계 잔차 (typed relation residuals), 경로 에너지 (path energies), 그리고 지원 영역 (support regions)을 유도하는 반면, 언어 모델은 후보 궤적에 대한 사전 확률 (prior)을 제공합니다. 우리는 오픈 월드 불완전성 (open-world incompleteness) 하에서, 관찰된 상태에만 기반한 어떠한 엄격한 규칙 (hard rule)도 모든 거짓된 미지원 궤적을 거부하면서 동시에 관찰되지 않았지만 참인 모든 궤적을 유지할 수는 없음을 보여줍니다. 그런 다음 우리는 소프트 그라운딩 (soft grounding)을 LLM 사전 확률의 KL 정규화된 변형 (KL-regularized deformation)으로 규정합니다. 유한한 여유 (finite slack)는 지원되지 않지만 모순되지 않은 궤적에 대한 지지력을 보존하는 반면, 하드 컨디셔닝 (hard conditioning)은 무한 페널티 극한 (infinite-penalty limit)으로 나타납니다. 이 프레임워크는 또한 증거 섭동 (evidence perturbations) 하에서의 안정성 경계 (stability bounds)를 산출하며, GraphRAG, KGQA, 그래프 에이전트 (graph agents), 제약 조건이 있는 디코딩 (constrained decoding), 그리고 충실한 생성 (faithful generation)에 적합한 제약 조건 체계를 명확히 합니다. 이러한 주장들은 증거 상대적 (evidence-relative)입니다. 즉, KG 호환성은 사실적 진실이 아니라 선언된 지원 (declared support)으로 취급됩니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기