arXiv논문2026. 06. 23. 11:41

AutoRAS: 원시 표현(Primitive Representations)을 통한 강건한 에이전트 시스템(Robust Agentic

요약

AutoRAS는 강건한 멀티 에이전트 시스템의 자동 설계를 위한 새로운 프레임워크를 제안합니다. 상징적 원시 표현을 사용하여 시스템을 설계하고, 안전 신호와 흐름 기반 목적 함수를 통해 최적화함으로써 적대적 환경에서도 높은 성능을 유지합니다.

핵심 포인트

강건한 에이전트 시스템 설계를 위한 AutoRAS 프레임워크 제안
상징적 원시 표현을 통한 구조적 연결성 및 행동 액션 인코딩
안전 신호와 흐름 기반 목적 함수를 활용한 시퀀스 최적화
적대적 공격 상황에서도 낮은 성능 저하와 높은 전이성 입증

에이전트 시스템(agentic systems)의 자동 설계는 대규모 언어 모델(LLMs)을 단일 에이전트 추론 너머로 확장할 수 있는 유망한 경로를 제공합니다. 기존 연구들은 수작업으로 제작하거나 자동으로 생성된 멀티 에이전트 워크플로우(multi-agent workflows)를 통해 작업 성능을 발전시켜 왔으나, 강건성(robustness)은 종종 사후 고려 사항으로 취급되어 시스템을 외부 공격자나 내부 실패에 취약하게 만들었습니다. 우리는 강건한 에이전트 시스템의 자동 설계를 위한 프레임워크인 AutoRAS를 제안합니다. AutoRAS는 시스템 설계를 구조적 연결성(structural connectivity)과 행동 액션(behavioral actions)을 공동으로 인코딩하는 상징적 원시 표현(symbolic primitives) 시퀀스를 생성하는 것으로 공식화하며, 실행에서 유도된 안전 신호(safety signals)와 흐름 기반 시퀀스 수준 목적 함수(flow-based sequence-level objectives)를 사용하여 이 시퀀스를 최적화하도록 학습합니다. 광범위한 실험을 통해 AutoRAS가 일반(vanilla) 설정과 적대적(adversarial) 설정 모두에서 최고의 성능을 달성하며, 공격 하에서도 가장 적은 성능 저하를 보임을 입증했습니다. 추가 분석을 통해 강력한 전이성(transferability), 안정적인 최적화 동작, 원시 집합(primitive sets) 간의 안정성, 그리고 유리한 비용 트레이드오프(cost trade-offs)를 보여줍니다. 우리의 코드는 $\href{https://github.com/guohezuy/AutoRAS}{\text{this https URL}}$에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AutoRAS: 원시 표현(Primitive Representations)을 통한 강건한 에이전트 시스템(Robust Agentic

요약

핵심 포인트

댓글