본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 05. 26. 01:40

AI Daily Digest: 2026년 5월 26일 — 에이전트형 코딩 플랫폼, 멀티 에이전트 프로토콜, 구체화된 AI(Embodied

요약

Google의 Antigravity 2.0과 Managed Agents 도입, Anthropic의 보안 특화 모델 Project Glasswing, 그리고 에이전트 간 통신 표준인 Foundation Protocol 제안 등 에이전트 생태계의 급격한 진화를 다룹니다.

핵심 포인트

  • Google Antigravity 2.0: 멀티 에이전트 오케스트레이션 플랫폼 및 SDK 제공
  • Gemini Managed Agents: 단일 API 호출로 샌드박스 기반 에이전트 생성 가능
  • Anthropic Project Glasswing: Claude 모델을 활용한 대규모 보안 취약점 탐지 실적
  • Foundation Protocol: 에이전트 간 통신 및 조정을 위한 표준 프로토콜 제안

5분 만에 읽을 수 있는 · AI 시스템 아키텍트가 매일 엄선

주력 분야: Agentic Workflow · AI 코딩 도구 · 구체화된 AI (Embodied Intelligence)

【기술 핵심】

Google I/O 2026에서 발표된 Antigravity 2.0은 IDE 플러그인에서 본격적인 멀티 에이전트 오케스트레이션 (Multi-agent Orchestration) 플랫폼으로 진화했다. 새로운 데스크톱 앱에서는 복수 에이전트의 병렬 실행, 백그라운드 자동화 스케줄링, Google AI Studio / Android / Firebase와의 통합이 가능하다. CLI 도구는 Gemini CLI의 후속으로 제공되며, SDK를 사용하면 동일한 에이전트 하네스 (Agent Harness)를 프로그램으로 제어할 수 있다. Gemini 3.5 Flash와 함께 최적화되어 최대의 처리량 (Throughput)을 실현한다.

【주목해야 하는 이유】

Google이 Cursor, Windsurf/Devin, Claude Code에 대항하는 에이전트형 IDE 분야를 향한 최대의 한 수. 데스크톱/CLI/SDK의 3층 전략은 모든 개발자 페르소나를 커버하며, 월 $100의 AI Ultra 플랜(사용량 5배 상한)은 엔터프라이즈 시장에 대한 진지함을 보여준다.

【기술 핵심】

Google은 Gemini API에 Managed Agents 기능을 도입했다. 단일 API 호출로 추론, 도구 사용, 코드 실행이 가능한 본격적인 에이전트를 생성할 수 있다. 각 에이전트는 격리된 영구적 Linux 샌드박스 (Sandbox) 내에서 동작하며, 멀티 턴 (Multi-turn) 대화를 통해 파일과 상태가 유지된다. 커스텀 에이전트 정의는 마크다운 (Markdown) 파일로 기술하며, Interactions API와 Google AI Studio Playground 양쪽 모두에서 이용 가능하다.

【주목해야 하는 이유】

프로덕션 에이전트의 전개 장벽을 극적으로 낮춘다. 기존에는 LangGraph 그래프, MCP 서버, 도구 정의를 수동으로 조합해야 했으나, Managed Agents는 단 한 번의 호출로 완전한 에이전트를 제공한다. 영구적인 환경 덕분에 기존에 불안정했던 장시간 에이전트 태스크도 신뢰성 높은 상태 유지 (Stateful) 실행이 가능해졌다.

【기술 핵심】

Anthropic은 Project Glasswing의 1개월 진척 보고를 공개했다. 약 50개의 파트너 조직과 협력하여, 미공개 프론티어 모델인 Claude Mythos Preview (취약점 발견에 최적화)를 실제 운영 코드베이스에 적용한 결과, 10,000건 이상의 High 및 Critical severity 버그를 발견했다. 이와 별도로 Claude Security (5월 1일부터 퍼블릭 베타)는 Claude Opus 4.7을 활용한 매니지드 취약점 스캔 제품으로 제공 중이다.

【주목해야 하는 이유】

프론티어 AI 모델이 사이버 보안 분야에서 산업 규모의 실적을 보여준 첫 번째 사례다. 50개 조직에서 30일간 10,000건 이상이라는 숫자는 1개 조직당 하루 약 7건의 페이스로, 인간 레드팀 (Red Team)으로는 도저히 달성할 수 없는 처리량이다. Claude Mythos의 일반 제공이 가까워지고 있음을 시사하며, 이 능력이 널리 보급될 가능성이 높다.

【기술 핵심】

25명 이상의 저자가 참여한 대규모 공동 논문이 대규모 멀티 에이전트 시스템을 위한 표준화된 통신 및 조정 레이어인 「Foundation Protocol」을 제안했다. 에이전트 발견, 능력 협상, 태스크 위임, 결과 집약의 프리미티브 (Primitive)를 정의하며, LangGraph, CrewAI, 커스텀 구현을 불문하고 프레임워크에 의존하지 않도록 설계되었다. 말하자면 「AI 에이전트의 TCP/IP」다.

【주목해야 하는 이유】

에이전트 시스템이 단일 어시스턴트에서 전문화된 서브 에이전트(Sub-agent) 군집으로 성장함에 따라, 조정(Coordination) 문제가 병목 현상이 된다. TCP/IP가 인터넷에서 수행한 역할과 마찬가지로, Foundation Protocol은 「독립적인 이종 엔티티가 어떻게 상호 발견하고 신뢰성 있게 협력할 것인가」라는 근본적인 문제에 접근한다. 널리 채택된다면 MCP/A2A를 보완하며, 인터넷 규모의 멀티 에이전트 오케스트레이션을 실현하는 중요한 레이어가 될 수 있다.

【기술 핵심】

SkillOpt는 AI 에이전트가 시간이 지남에 따라 자율적으로 스킬셋 (Skillset)을 진화시키기 위한 실행 수준의 메타 전략 (Meta-strategy)을 도입한다. 개발자가 수동으로 도구 정의 (Tool definition)나 프롬프트 템플릿 (Prompt template)을 업데이트하는 대신, 에이전트는 자신의 성능을 관찰하고, 스킬 갭 (Skill gap)을 식별하며, 도구 호출 패턴 (Tool calling pattern), 추론 휴리스틱 (Reasoning heuristic), 서브 에이전트 구성 (Sub-agent configuration)을 포함한 새로운 기능을 제안 및 생성할 수 있다.

【왜 주목해야 하는가】

자기 개선 에이전트 (Self-improving agent)는 에이전트형 AI의 궁극적인 목표이다. SkillOpt는 '워크플로우를 실행하기만 하는 것'에서 '시간이 지남에 따라 더 잘 실행하는 방법을 학습하는' 에이전트로 나아가는 구체적인 한 걸음을 보여준다. 이것이 프로덕션 환경에 구현된다면, 에이전트 생태계 유지에 드는 엔지니어링 부하를 대폭 줄이고, 역할의 성격을 '에이전트 프로그래머 (Agent programmer)'에서 '에이전트 코치 (Agent coach)'로 변화시킬 가능성이 있다.

【기술 핵심】

5월 22일, 상하이 국가 지방 공동 건설 휴머노이드 로봇 혁신 센터가 구체화된 AI (Embodied AI) 시뮬레이션 플랫폼인 '격물 (Ge Wu)'을 발표했다. 핵심 기술은 유니버설 강화학습 (Universal Reinforcement Learning) 프레임워크와 자동 모델 적응 (Automatic model adaptation) 기술로, 단일 코드베이스 (Single codebase)만으로 100종류 이상의 서로 다른 로봇 형태를 추가 프로그래밍 없이 훈련할 수 있다. 동시에 상하이는 ISO/TC299 산하에 휴머노이드 로봇 분과위원회를 설립하는 국제 표준화 이니셔티브도 발표했다.

【왜 주목해야 하는가】

'1개 코드베이스로 100종류 이상의 로봇'이라는 주장이 검증된다면, 이는 로봇별 개별 엔지니어링에서 범용 구체화된 AI (Embodied AI) 훈련으로의 패러다임 전환을 의미한다. 상하이의 2027년까지 1,000대 로봇 훈련 목표, 그리고 2029년까지 106억 달러 규모로 예측되는 중국의 휴머노이드 로봇 시장과 맞물려, 구체화된 AI (Embodied AI) 상용화를 위한 인프라 계층이 급격히 구체화되고 있음을 보여준다.

【기술 핵심】

Unitree Robotics는 G1 휴머노이드 로봇이 자연어 음성 명령에 응답하고 실시간으로 자율 추론 (Autonomous reasoning)을 수행하는 새로운 데모 영상을 공개했다. 로봇은 음성 지시를 처리하고, 다단계 물리적 액션 (Physical action)을 계획 및 실행하는 동시에 동적 균형 (Dynamic balance)을 유지한다. 이는 G1의 기존 아이스 스케이팅, 스핀, 사이드 플립 데모에서 한 단계 진화한 모습이다.

【왜 주목해야 하는가】

물리적 로봇에서 실시간 '음성 $\rightarrow$ 액션'의 실현은 LLM 추론과 구체적 실행 (Embodied execution) 사이의 루프를 닫는 것을 의미한다. G1의 진화 — 즉, 짜여진 안무 형태의 플립에서 자율적인 음성 구동 행동으로의 변화 — 는 구체화된 AI (Embodied AI)의 더 넓은 궤적을 반영한다: 즉, 시나리오화된 데모에서 진정으로 상호작용 가능한 물리적 지능으로의 이동이다. 소비자용 가격대에서의 이러한 진보는 특히 중요하다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0