검색 증강 생성(RAG)의 보안 및 개인정보 보호: 신뢰할 수 있는 시스템 구축을 위한 아키텍처, 위협, 방어 및 향후 방향
요약
RAG 시스템의 보안 및 개인정보 보호 위협을 분석하고 신뢰할 수 있는 아키텍처 구축 방안을 제시합니다. 검색, 컨텍스트 구축, 생성 단계에서 발생할 수 있는 다양한 공격 유형과 방어 기법을 체계적으로 검토합니다.
핵심 포인트
- RAG 파이프라인의 새로운 보안 및 개인정보 보호 위험 분석
- 멤버십 추론, 포이즈닝, 그래디언트 누출 등 공격 클래스 분류
- 중앙 집중식부터 온디바이스, 연합 학습까지 다양한 패러다임 검토
- 개인정보 보호와 시스템 효용성 간의 트레이드오프 분석
검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 외부 지식을 통해 대규모 언어 모델 (Large Language Models, LLMs)을 강화하는 지배적인 패러다임으로 부상했습니다. RAG 시스템은 검색 메커니즘을 생성 모델과 결합함으로써 사실적 근거 (Factual grounding)와 도메인 간 적응성을 향상시킵니다. 그러나 검색 파이프라인을 통합하는 것은 기존의 언어 모델링 위협을 넘어선 새로운 보안 및 개인정보 보호 위험을 초래합니다. 검색 인덱스 (Retrieval indices), 쿼리 로그 (Query logs), 컨텍스트 구축 (Context construction) 또는 연합 업데이트 (Federated updates)를 통해 민감한 정보가 노출될 수 있으며, 지식 베이스 (Knowledge bases)에 대한 적대적 조작은 생성된 출력물에 대한 신뢰를 저해할 수 있습니다. 본 서베이(Survey)는 중앙 집중식, 온디바이스 (Micro-RAG), 연합 (Federated) 및 하이브리드 패러다임에서 배포되는 RAG 시스템 전반의 개인정보 보호 및 보안 과제에 대한 포괄적인 검토를 제공합니다. 우리는 검색, 컨텍스트 구축 및 생성 단계를 아우르는 위협 표면 (Threat surfaces)에 대한 통합된 분류 체계 (Taxonomy)를 제시하며, 멤버십 추론 (Membership inference), 인덱스 추론 (Index inference), 포이즈닝 (Poisoning), 그래디언트 누출 (Gradient leakage) 및 공모 (Collusion)를 포함한 공격 클래스를 체계적으로 분석합니다. 나아가 아키텍처, 알고리즘 및 암호학적 방어 기법을 검토하고, 개인정보 보호와 효용성 간의 트레이드오프 (Trade-offs) 및 배포 시 고려 사항을 강조합니다. 마지막으로, 실제 응용 분야를 위한 신뢰할 수 있고 안전하며 탄력적인 RAG 시스템을 구축하기 위한 미해결 연구 과제들을 개괄합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기