arXiv논문2026. 06. 24. 10:04

멀티 에이전트 의미론적 재작성을 통한 개인정보 보호 RAG: 문맥적 충실도를 저해하지 않는 기밀성 달성

요약

RAG 시스템의 개인정보 유출 위험을 방지하기 위해 멀티 에이전트 기반의 의미론적 재작성 프레임워크를 제안합니다. 세 개의 특화된 에이전트가 협력하여 문맥적 충실도를 유지하면서도 민감한 식별자를 효과적으로 제거합니다.

핵심 포인트

멀티 에이전트를 활용한 개인정보 보호 RAG 프레임워크 제안
의미론적 핵심을 보존하며 민감한 식별자를 협력적으로 제거
LLaMA-3-8B 기준 표적 정보 노출 사례를 144개에서 1개로 대폭 감소
기존 SAGE 방식보다 높은 문맥적 충실도(BLEU-1) 달성
비동기 오프라인 전처리 방식으로 추론 지연 시간 최소화

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 외부 지식을 통합하여 대규모 언어 모델 (Large Language Models, LLMs)을 향상시키지만, 민감한 시나리오에 이를 배포할 경우 악의적인 프롬프트를 통한 개인정보 유출 위험이 있습니다. 이를 해결하기 위해, 우리는 의미론적 재작성 (Semantic Rewriting)을 통해 검색된 콘텐츠를 정화하는 멀티 에이전트 프레임워크를 제안합니다. 개인정보 추출, 의미 분석, 그리고 재구성을 위해 특화된 세 가지 에이전트를 채택함으로써, 우리의 접근 방식은 의미론적 핵심을 보존하면서 민감한 식별자를 협력적으로 제거합니다. 우리는 ChatDoctor 및 Wiki-PII 데이터셋을 사용하여 6개의 대규모 언어 모델에 대해 이 프레임워크를 평가했습니다. 실험 결과, 표적 공격 (Targeted Attacks) 하에서 개인정보 유출이 크게 감소함을 입증했습니다. 예를 들어, LLaMA-3-8B에서 표적 정보 노출을 베이스라인의 144개 사례에서 단 1개로 줄였습니다. 또한, 우리는 0.122의 BLEU-1 점수로 강력한 문맥적 충실도 (Contextual Fidelity)를 유지하며, 이는 기존 SAGE 방식의 0.117보다 뛰어난 성능입니다. 마지막으로, 모든 재작성은 일회성 오프라인 전처리 단계로 실행되므로, 이 프레임워크는 비동기 전처리 모듈로 작동하여 온라인 추론에 추가적인 지연 시간 (Latency)을 발생시키지 않습니다. 재현성을 높이기 위해, 본 연구의 소스 코드는 https://github.com/foursoils/Privacy-Preserving-RAG 에서 공개적으로 사용할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

멀티 에이전트 의미론적 재작성을 통한 개인정보 보호 RAG: 문맥적 충실도를 저해하지 않는 기밀성 달성

요약

핵심 포인트

댓글