arXiv논문2026. 05. 22. 22:45

자신을 속이지 않고 보안 측정하기: 에이전트 벤치마킹이 어려운 이유

요약

AI 에이전트의 보안성을 평가하는 기존 벤치마크의 한계를 분석한 연구입니다. 벤치마크 취약성, 시간적 노후화, 런타임 불확실성이라는 세 가지 핵심 과제를 규명하고 신뢰할 수 있는 평가 프레임워크 구축 방향을 제시합니다.

핵심 포인트

AI 에이전트 보안 평가의 세 가지 핵심 과제 규명
벤치마크 취약성 및 데이터 노후화 문제 지적
런타임 불확실성으로 인한 평가의 어려움 분석
강력하고 신뢰할 수 있는 평가 프레임워크 구축 방향 제시

Computer Science > Cryptography and Security

Title: Measuring Security Without Fooling Ourselves: Why Benchmarking Agents Is Hard

View PDF HTML (experimental)Abstract: 보안이 중요한 역할을 수행하는 AI 에이전트(AI agents)를 평가하는 데 사용되는 벤치마크(benchmarks)는 결정적인 약점을 가지고 있습니다. 최근의 실증적 증거를 바탕으로, 우리는 보안 평가를 저해하는 세 가지 핵심 과제인 벤치마크 취약성(benchmark vulnerabilities), 시간적 노후화(temporal staleness), 그리고 런타임 불확실성(runtime uncertainty)을 규명합니다. 그런 다음, 더 강력하고 신뢰할 수 있는 평가 프레임워크(evaluation frameworks)를 구축하기 위한 실질적인 방향을 제시합니다.

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: community collaborators와 함께하는 실험적 프로젝트

arXivLabs는 협력자들이 우리 웹사이트에서 직접 새로운 arXiv 기능을 개발하고 공유할 수 있도록 하는 프레임워크입니다.

arXivLabs와 함께 일하는 개인 및 조직은 개방성, 커뮤니티, 탁월함, 그리고 사용자 데이터 프라이버시라는 우리의 가치를 수용하고 받아들였습니다. arXiv는 이러한 가치에 전념하며, 이를 준수하는 파트너와만 협력합니다.

arXiv 커뮤니티에 가치를 더할 프로젝트 아이디어가 있나요? arXivLabs에 대해 더 알아보기.

AI 자동 생성 콘텐츠

원문 바로가기