본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 29. 10:58

에이전트 네이티브 면역 시스템 (Agent-Native Immune System): 아키텍처, 분류 체계 및 엔지니어링

요약

자율 에이전트의 런타임 취약성을 해결하기 위해 인지 루프 내에 내장된 생물학적 영감 기반의 방어 아키텍처인 ANIS를 제안합니다. 6계층 면역 타워와 에이전트 백신 분류 체계, 그리고 동적 적응을 위한 하네스 트라이어드 프레임워크를 다룹니다.

핵심 포인트

  • 에이전트의 메모리 오염 및 도구 체인 조작 등 새로운 보안 위협 정의
  • 6계층 면역 타워(Immune Tower)를 통한 물리적·논리적 격리 설계
  • 에이전트 바이러스와 백신에 대한 통합 분류 체계 구축
  • 지속적 면역 학습(CIL)을 위한 하네스 트라이어드 백본 제안
  • 정적 모델 정렬과 동적 에이전트 면역 메커니즘의 차이 규명

정적 챗봇(chat bots)에서 지속적 메모리(persistent memory), 도구 사용 프로토콜(tool-use protocols), 그리고 멀티 에이전트 협업(multi-agent collaboration) 기능을 갖춘 자율 에이전트(autonomous agents)로의 전환은 AI 위협 환경을 근본적으로 확장시켰습니다. 경계 보안(perimeter security)이나 학습 단계의 정렬(training-time alignment)과 같은 현재의 방어 메커니즘은 에이전트의 능동적인 추론 루프(reasoning loop) 외부에 머물러 있습니다. 결과적으로 이러한 방식은 한계가 있습니다. 완전히 정렬된(aligned) 에이전트라 할지라도 메모리 오염(memory poisoning), 도구 체인 조작(tool-chain manipulation), 또는 멀티 에이전트 프로토콜 공격(multi-agent protocol attacks)을 통한 런타임 하이재킹(runtime hijacking)에 매우 취약합니다.

이러한 중대한 격차를 해결하기 위해, 우리는 에이전트의 인지 루프(cognitive loop) 내에 직접 내장된 최초의 생물학적 영감을 받은 내생적 방어 아키텍처인 에이전트 네이티브 면역 시스템 (Agent-Native Immune System, ANIS)을 소개합니다. 우리의 프레임워크는 네 가지 주요 기여를 제시합니다. 첫째, 우리는 비인지적(non-cognitive) 물리 및 논리적 격리 계층으로서 장벽 면역 (Barrier Immunity, L1)을 명확히 포함하는 6계층 면역 타워 (Immune Tower, L0-L5)를 설계합니다. 둘째, 우리는 에이전트 바이러스 (Agent Viruses)와 에이전트 백신 (Agent Vaccines)의 통합된 분류 체계를 구축하여, 표면적인 비매개변수적(non-parametric) 방어와 강력한 매개변수적(parametric) 백신 사이의 결정적인 차이를 공식화합니다. 셋째, 우리는 지속적 면역 학습 (Continual Immune Learning, CIL)을 구동하는 자기 모니터링 및 메타 인지 자동화 백본인 하네스 트라이어드 (Harness Triad)—메타(Meta), 셀프(Self), 오토(Auto)—를 개념화하여, 백신이 새로운 위협에 동적으로 적응할 수 있도록 합니다. 마지막으로, 우리는 모델 정렬 (model alignment)과 에이전트 면역 (agent immunity) 사이의 엄격한 이론적 경계를 설정합니다. 정렬이 학습 과정에서 정적인 "헌법적" 가치 기반을 제공한다면, ANIS는 런타임 동안 동적인 "법 집행" 메커니즘 역할을 합니다.

우리는 면역 프로토콜 표준화, 자가면역율 (Autoimmunity Rate, 위양성 개입률)과 같은 새로운 평가 지표, 그리고 집단 지성 생태계 내에서 병원체와 백신 사이의 공진화 역학을 포함하여 이 분야의 향후 과제들을 제시하며 결론을 맺습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0