arXiv논문2026. 05. 05. 13:00

제로 트러스트 에이전틱 AI 의 하이브리드 검사 및 작업 기반 접근 제어

요약

본 논문은 LLM 기반 에이전트가 동적으로 도구 호출 및 보호된 자원에 접근할 때 발생하는 보안 위험을 해결하기 위한 새로운 프레임워크를 제안합니다. 기존의 승인 흐름으로는 복잡한 다중 턴 대화 환경에서의 권한 오용을 막기 어렵습니다. 이를 위해 결정론적 제어와 의미 기반 검사를 결합한 하이브리드 런타임 강제 모델과, 다단계 작업 추출 및 도구 매칭 과정을 포함하는 향상된 작업 기반 접근 제어(TBAC) 기법을 제시합니다.

핵심 포인트

LLM 에이전트의 동적 도구 호출은 복잡한 보안 위험을 초래하며, 기존 승인 메커니즘으로는 충분하지 않습니다.
제안된 하이브리드 런타임 강제 모델은 결정론적 제어(메시지 무결성)와 의미 기반 검사(사용자 의도 일치 여부)를 결합하여 보안을 강화합니다.
작업 기반 접근 제어(TBAC)는 다중 턴 대화에 맞게 확장되어, 사용자 목표 추출 단계와 요청 도구 적절성 평가 단계를 분리했습니다.
새로운 데이터셋과 실험 결과를 통해 복잡한 다중 턴 대화 환경에서의 TBAC 적용 가능성을 입증합니다.

대형 언어 모델 (LLM) 을 기반으로 한 에이전트를 동적으로 도구 호출하고 보호된 자원에 접근하도록 승인할 경우, 이는 상당한 보안 리스크를 초래하며, 에이전트가 다중 턴 대화에 참여하고 분산 협업으로 확장함에 따라 이러한 리스크는 급격히 증가합니다. 침해되거나 악의적인 에이전틱 애플리케이션은 도구 호출을 조작하거나 결과를 위조하거나, 사용자의 의도된 작업 범위를 초과하여 권한 요청을 할 수 있으며, 이는 기존에 사용자의 의도를 볼 수 없는 데임그리테이션 승인 흐름 (delegated authorization flows) 을 통해 무관심하게 간과될 수 있습니다. 이에 따라 우리는 지속적 에이전트 의미 인증 (Continuous Agent Semantic Authorization, CASA) 에 대한 다음과 같은 기여를 합니다. 첫째, 우리는 결정론적 제어와 의미 기반 제어를 결합한 제로 트러스트 인터셉션 레이어에 의해 활성화된 하이브리드 런타임 강제 모델을 제안합니다. 5 개의 결정론적 제어가 메시지 흐름의 구조적 및 데이터 무결성을 보장하며, 의미 검사 레이어는 도구 호출 선택이 에이전트에 의뢰된 의도된 작업과 일치하는지 평가합니다. 둘째, 기존 단일 턴 상호작용에 작용하는 작업 기반 접근 제어 (Task-Based Access Control, TBAC) 기법들과 달리, 우리는 의미 레이어를 두 단계로 분해합니다: i) 인터셉션 레이어에서 다중 턴 대화에서 사용자의 목표를 추출하는 작업 추출 단계와 ii) 승인 서버에서 추출된 작업에 대한 요청 도구가 적절할지 평가하는 작업-도구 의미 매칭 단계입니다. 셋째, 우리는 이전 작업에서 소개한 ASTRA 데이터셋을 확장하며, 주어진 작업에 대한 관련 및 불관련 도구 호출을 포함하는 다중 턴 상호작용을 가진 새로운 대화-도구 데이터셋을 생성합니다. 마지막으로, 우리는 다중 턴 대화 하에서의 TBAC 에 대한 첫 번째 실험 결과를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

제로 트러스트 에이전틱 AI 의 하이브리드 검사 및 작업 기반 접근 제어

요약

핵심 포인트

댓글