arXiv논문2026. 05. 28. 13:21

GraphSteal: Traversal Reconstruction을 통한 Graph RAG의 구조적 지식 탈취

요약

Graph RAG 시스템이 지식 그래프의 구조적 정보를 유출할 수 있는 새로운 보안 취약점을 분석한 연구입니다. 공격자가 블랙박스 상호작용을 통해 그래프의 노드 속성과 토폴로지를 90% 이상 재구성할 수 있음을 입증했습니다.

핵심 포인트

Graph RAG의 구조적 지식이 새로운 프라이버시 공격 표면이 됨
Depth-Wise 및 Breadth-Wise 탐색을 통한 그래프 재구성 프레임워크 제안
실험 결과 원본 지식 그래프의 90% 이상을 높은 충실도로 복구 가능
기존 가드레일의 한계와 구조적 프라이버시 보호의 어려움 강조

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 생성 과정을 질의와 관련된 외부 증거에 기반하게 함으로써 대규모 언어 모델 (LLMs)의 성능을 향상시킵니다. 비정형 텍스트 코퍼스 (text corpora)를 넘어, Graph RAG는 지식 그래프 (knowledge graphs)를 검색 파이프라인에 통합하여 LLMs가 구조화된 지식에 인코딩된 엔티티 (entities), 관계 (relations), 그리고 멀티홉 의존성 (multi-hop dependencies)에 접근할 수 있도록 합니다. 그러나 Graph RAG에 힘을 실어주는 동일한 구조적 지식은 새로운 프라이버시 공격 표면 (attack surface)을 생성하기도 합니다. 본 연구에서는 Graph RAG 시스템이 구조적 오라클 (structural oracles)로 변질될 수 있음을 입증합니다. 적응형 블랙박스 상호작용 (adaptive black-box interactions)을 통해 공격자는 숨겨진 지식 그래프의 상당 부분을 재구성할 수 있을 만큼 충분한 관계적 증거를 이끌어낼 수 있습니다. 우리는 로컬 (local) 및 글로벌 (global) 관점 모두에서 대상 그래프를 복구하는 구조 지향적 재구성 프레임워크를 제안합니다. 구체적으로, Depth-Wise Heuristic Search는 엔티티 중심의 증거를 재귀적으로 확장함으로써 세밀한 노드 속성 (node attributes)을 추출하며, Breadth-Wise Diffusion Search는 관계에 의해 유도된 이웃 (neighborhoods)을 가로질러 전파함으로써 그래프 토폴로지 (graph topology)를 추론합니다. 일반적인 시나리오 및 의료 시나리오에서의 실험을 통해, 우리의 방법론이 대표적인 Graph RAG 시스템으로부터 원본 지식 그래프의 90% 이상을 복구할 수 있음을 입증하였으며, 민감한 엔티티, 관계, 그리고 구조적 의존성을 높은 충실도 (fidelity)로 드러냈습니다. 기존의 가드레일 (guardrails)은 우리의 공격에 대해 제한적인 방어만을 제공하며, 이는 Graph RAG 파이프라인에서 구조적 프라이버시를 보호하는 것이 본질적으로 어렵다는 점을 강조합니다.

AI 자동 생성 콘텐츠

원문 바로가기

GraphSteal: Traversal Reconstruction을 통한 Graph RAG의 구조적 지식 탈취

요약

핵심 포인트

댓글