제로 트러스트 에이전틱 AI 의 하이브리드 검사 및 작업 기반 접근 제어
요약
본 논문은 LLM 기반 에이전트가 동적으로 도구 호출 및 보호된 자원에 접근할 때 발생하는 보안 위험을 해결하기 위한 새로운 프레임워크를 제안합니다. 기존의 승인 흐름으로는 복잡한 다중 턴 대화 환경에서의 권한 오용을 막기 어렵습니다. 이를 위해 결정론적 제어와 의미 기반 검사를 결합한 하이브리드 런타임 강제 모델과, 다단계 작업 추출 및 도구 매칭 과정을 포함하는 향상된 작업 기반 접근 제어(TBAC) 기법을 제시합니다.
핵심 포인트
- LLM 에이전트의 동적 도구 호출은 복잡한 보안 위험을 초래하며, 기존 승인 메커니즘으로는 충분하지 않습니다.
- 제안된 하이브리드 런타임 강제 모델은 결정론적 제어(메시지 무결성)와 의미 기반 검사(사용자 의도 일치 여부)를 결합하여 보안을 강화합니다.
- 작업 기반 접근 제어(TBAC)는 다중 턴 대화에 맞게 확장되어, 사용자 목표 추출 단계와 요청 도구 적절성 평가 단계를 분리했습니다.
- 새로운 데이터셋과 실험 결과를 통해 복잡한 다중 턴 대화 환경에서의 TBAC 적용 가능성을 입증합니다.
대형 언어 모델 (LLM) 을 기반으로 한 에이전트를 동적으로 도구 호출하고 보호된 자원에 접근하도록 승인할 경우, 이는 상당한 보안 리스크를 초래하며, 에이전트가 다중 턴 대화에 참여하고 분산 협업으로 확장함에 따라 이러한 리스크는 급격히 증가합니다. 침해되거나 악의적인 에이전틱 애플리케이션은 도구 호출을 조작하거나 결과를 위조하거나, 사용자의 의도된 작업 범위를 초과하여 권한 요청을 할 수 있으며, 이는 기존에 사용자의 의도를 볼 수 없는 데임그리테이션 승인 흐름 (delegated authorization flows) 을 통해 무관심하게 간과될 수 있습니다. 이에 따라 우리는 지속적 에이전트 의미 인증 (Continuous Agent Semantic Authorization, CASA) 에 대한 다음과 같은 기여를 합니다. 첫째, 우리는 결정론적 제어와 의미 기반 제어를 결합한 제로 트러스트 인터셉션 레이어에 의해 활성화된 하이브리드 런타임 강제 모델을 제안합니다. 5 개의 결정론적 제어가 메시지 흐름의 구조적 및 데이터 무결성을 보장하며, 의미 검사 레이어는 도구 호출 선택이 에이전트에 의뢰된 의도된 작업과 일치하는지 평가합니다. 둘째, 기존 단일 턴 상호작용에 작용하는 작업 기반 접근 제어 (Task-Based Access Control, TBAC) 기법들과 달리, 우리는 의미 레이어를 두 단계로 분해합니다: i) 인터셉션 레이어에서 다중 턴 대화에서 사용자의 목표를 추출하는 작업 추출 단계와 ii) 승인 서버에서 추출된 작업에 대한 요청 도구가 적절할지 평가하는 작업-도구 의미 매칭 단계입니다. 셋째, 우리는 이전 작업에서 소개한 ASTRA 데이터셋을 확장하며, 주어진 작업에 대한 관련 및 불관련 도구 호출을 포함하는 다중 턴 상호작용을 가진 새로운 대화-도구 데이터셋을 생성합니다. 마지막으로, 우리는 다중 턴 대화 하에서의 TBAC 에 대한 첫 번째 실험 결과를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기