arXiv논문2026. 05. 22. 11:28

LCGuard: 멀티 에이전트 시스템 내 안전한 KV 공유를 위한 잠재 통신 가드 (Latent Communication Guard)

요약

멀티 에이전트 시스템에서 KV 캐시를 통한 잠재 통신 시 발생할 수 있는 민감 정보 유출 문제를 해결하기 위한 LCGuard 프레임워크를 제안합니다. 적대적 학습을 통해 작업 관련 의미론은 보존하면서도 민감한 정보의 재구성을 방지하는 변환 기술을 다룹니다.

핵심 포인트

KV 캐시 기반 잠재 통신의 보안 취약점 식별
적대적 디코더를 활용한 정보 유출 운영적 공식화
작업 성능을 유지하며 민감 정보 재구성을 차단하는 변환 학습
다양한 모델 및 벤치마크를 통한 보안 성능 검증

대규모 언어 모델 (LLM) 기반의 멀티 에이전트 시스템 (Multi-agent systems)은 복잡한 작업을 조정하기 위해 중간 통신 (Intermediate communication)에 점점 더 많이 의존하고 있습니다. 대부분의 기존 시스템은 자연어를 통해 통신하지만, 최근 연구에 따르면 Transformer의 키-값 (KV) 캐시를 통한 잠재 통신 (Latent communication)이 효율성을 높이고 더 풍부한 작업 관련 정보를 보존할 수 있음을 보여줍니다. 그러나 KV 캐시는 문맥적 입력 (Contextual inputs), 중간 추론 상태 (Intermediate reasoning states), 그리고 에이전트별 정보를 인코딩하기도 하여, 명시적인 텍스트 공개 없이도 민감한 콘텐츠가 에이전트 간에 전파될 수 있는 불투명한 채널을 생성합니다. 이를 해결하기 위해, 우리는 멀티 에이전트 LLM 시스템에서 안전한 KV 기반 잠재 통신을 위한 프레임워크인 \textbf{LCGuard} (Latent Communication Guard)를 소개합니다. LCGuard는 공유된 KV 캐시를 잠재적 작업 메모리 (Latent working memory)로 취급하며, 캐시 아티팩트 (Cache artifacts)가 에이전트 간에 전송되기 전에 표현 수준의 변환 (Representation-level transformations)을 학습합니다. 우리는 재구성 (Reconstruction)을 통해 표현 수준의 민감한 정보 유출을 운영적으로 공식화합니다. 즉, 적대적 디코더 (Adversarial decoder)가 공유된 캐시 아티팩트로부터 에이전트별 민감한 입력을 복구할 수 있다면 해당 아티팩트는 안전하지 않은 것으로 간주합니다. 이는 적대자가 민감한 입력을 재구성하는 법을 배우는 동안, LCGuard는 작업 관련 의미론 (Task-relevant semantics)을 보존하면서 재구성 가능한 정보를 줄이는 변환을 학습하는 적대적 학습 (Adversarial training) 공식으로 이어집니다. 여러 모델 제품군과 멀티 에이전트 벤치마크를 통한 실증적 평가 결과, LCGuard는 표준 KV 공유 베이스라인과 비교했을 때 경쟁력 있는 작업 성능을 유지하면서도 재구성 기반 유출 및 공격 성공률을 일관되게 감소시킴을 보여주었습니다.

AI 자동 생성 콘텐츠

원문 바로가기

LCGuard: 멀티 에이전트 시스템 내 안전한 KV 공유를 위한 잠재 통신 가드 (Latent Communication Guard)

요약

핵심 포인트

댓글