
AI 데일리 다이제스트: 2026년 6월 3일 — Microsoft Build MAI 모델, NVIDIA Cosmos 3, Claude
요약
Microsoft의 자체 코딩 모델 Project Polaris 발표와 NVIDIA의 물리 AI 모델 Cosmos 3 출시를 다룹니다. Microsoft는 OpenAI 의존도를 낮추는 자체 모델 생태계를 구축 중이며, NVIDIA는 로보틱스를 위한 통합 멀티모달 모델을 선보였습니다.
핵심 포인트
- Microsoft Project Polaris: GPT-4 Turbo를 대체하는 MoE 기반 코딩 모델
- NVIDIA Cosmos 3: 텍스트부터 로봇 관절 궤도까지 처리하는 물리 AI 모델
- Microsoft의 AI 수직 계열화: 모델부터 가속기까지 엔드투엔드 장악
- NVIDIA의 로보틱스 생태계 전략: GR00T 플랫폼을 통한 CUDA 모델 지향
5분 만에 읽는 · AI 시스템 아키텍트가 매일 엄선
주력 분야: AI 코딩 기반 · 에이전트 인프라 · 물리 AI
【기술 코어 (Technical Core)】
Microsoft는 Build 2026(6월 2~3일, 샌프란시스코)에서 완전 자체 개발한 AI 코딩 모델인 「Project Polaris」를 발표했다. MoE (Mixture-of-Experts) 아키텍처를 채택하여 언어별로 특화된 서브 모듈을 탑재했다. 2026년 8월부터 GitHub Copilot의 모든 구독자에게 GPT-4 Turbo를 대체하는 기본 엔진으로 전개될 예정이다. Azure의 자체 Maia AI 가속기 위에서 동작하며, Pro 티어에서는 최대 10만 행의 멀티 파일 컨텍스트 (Multi-file Context)를 지원한다. HumanEval 및 MBPP 벤치마크에서 GPT-4 Turbo를 상회하며, 특히 Rust와 Haskell에서 가장 큰 개선을 보인 것으로 알려졌다.
【왜 주목해야 하는가】
Microsoft가 OpenAI에 대한 의존에서 가장 결정적인 한 걸음을 내디딘 순간이다. 모델, 추론 인프라, 개발자 경험을 엔드투엔드 (End-to-End)로 장악함으로써, OpenAI와 Copilot 사이의 상업적으로 미묘한 관계를 해소한다. MAI 패밀리에는 이미지 생성, 다국어 음성 합성, 전사 (Transcription) 모델도 포함되어 있으며, 이는 Microsoft 제품 전체에서 OpenAI 모델을 대체하려는 협조적인 움직임이다.
🔗 Microsoft Build 2026: MAI Keynote Transcript · GitHub Copilot Replaces GPT-4 (TechTimes)
【기술 코어 (Technical Core)】
NVIDIA는 5월 31일, 물리 AI를 위한 첫 번째 「옴니 모델 (Omni-model)」인 Cosmos 3를 출시했다. 20조 개의 멀티모달 토큰 (Multimodal Token)으로 학습된 MoT (Mixture-of-Transformers) 아키텍처를 채택하여, Reasoner와 Generator라는 두 개의 트랜스포머가 연계된다. 텍스트, 이미지, 영상, 환경음, 액션 시퀀스 (Action Sequence, 관절 각도, 그리퍼 위치, 궤도 웨이포인트)의 5가지 모달리티 (Modality)를 입력과 출력 모두에서 네이티브로 처리한다. Nano (16B), Super (64B), Edge (2B, 미정)의 3가지 변형이 OpenMDW 1.1 상용 라이선스로 제공된다. 동시에, Isaac GR00T 레퍼런스 휴머노이드 로봇 (75자유도, Jetson AGX Thor T5000, Sharpa Wave 촉각 핸드)이 오픈 하드웨어 플랫폼으로 발표되었으며, Unitree가 제조를 담당하여 2026년 하반기에 출하될 예정이다.
【왜 주목해야 하는가】
Cosmos 3는 지금까지 별개였던 언어 모델, 영상 생성, 로봇 정책 (Robot Policy)을 단일 아키텍처로 통합했다. 텍스트 프롬프트 → 5초 영상 → 관절 궤도로 이어지는 풀 체인 (Full-chain) 능력은 단일 모델에서의 추론, 시뮬레이션, 물리적 실행을 의미한다. Stanford, ETH Zurich, Ai2 등의 학술 파트너와 오픈 라이선스를 통해, NVIDIA는 "2027년 중반까지 로보틱스 스타트업이 GR00T 위에 구축하는 모습은, 오늘날의 AI 스타트업이 CUDA 위에 구축하는 모습과 같을 것"이라는 도박을 걸고 있다.
🔗 NVIDIA Cosmos 3 + Isaac GR00T: Full Review (BuildFastWithAI) · NVIDIA Isaac GR00T Developer Page
【기술 코어 (Technical Core)】
Anthropic은 5월 28일부터 6월 2일까지 6일 동안 Claude Code의 7개 버전을 출시했다. 핵심은 v2.1.154 (Opus 4.8 + Dynamic Workflows 출시)이다. Dynamic Workflows는 단일 프롬프트로부터 수십~수백 개의 병렬 백그라운드 에이전트 (Background Agent)를 생성하는 오케스트레이션 (Orchestration) 패턴을 정의할 수 있으며, /workflows 명령어로 실행 상황을 시각화할 수 있다. 기타 주목할 점: 자동 모드가 Bedrock / Vertex / Foundry에 대응 (v2.1.158), .claude/skills 디렉토리로부터의 플러그인 자동 로드 (v2.1.157), OTEL 리소스 속성을 통한 팀별 사용량 분석 (v2.1.160), 린 시스템 프롬프트 (Lean System Prompt)가 Haiku / Sonnet / Opus 4.7을 제외한 모든 모델에서 기본값으로 설정됨.
【왜 주목해야 하는가】
6일 동안 7개 버전 —— 이 속도 자체가 Anthropic의 지속적 인도 (Continuous Delivery)로의 전환을 보여준다. Dynamic Workflows는 멀티 에이전트 오케스트레이션 (Multi-agent Orchestration)의 공백을 직접적으로 메우는 것이다. Opus 4.8의 2.5배 빠른 모드와 크로스 클라우드 자동 모드의 결합을 통해, Claude Code는 단순한 도구에서 플랫폼 인프라로 진화하고 있다.
🔗 Claude Code Changelog (gradually.ai) · Claude Code Official Changelog
【기술 코어】
Build 2026에서 GitHub는 VS Code용 Copilot 멀티 에이전트 지원을 발표했다. 오케스트레이터 에이전트가 린팅 (Linting), 테스트 생성, 문서화, 보안 리뷰를 위한 병렬 서브 에이전트 (Sub-agent)를 실행한다. Copilot Workspace는 베타를 종료하고 일반 제공 (GA)을 시작했다. Fleet 모드 (확인이 필요 없는 자율 CLI 태스크), Autopilot 모드 (스케줄링된 무인 실행), Jira / Datadog / ServiceNow용 Copilot Extensions가 추가되었다. 2026년 7월에는 Enterprise용 자율 에이전트 모드 (기능 브랜치 전체의 생성·테스트·커밋)와 에이전트 샌드박스 (태스크별 임시 Linux 컨테이너)가 예정되어 있다.
【왜 주목해야 하는가】
AI 지원 코딩 (AI-assisted coding)과 AI 위임 코딩 (AI-delegated coding)의 경계가 사라지고 있다. 인간이 의도를 정의하고 에이전트가 실행하는 소프트웨어 엔지니어링의 예고편이다.
【기술 코어】
Microsoft는 Build 2026에서 Windows Agent Framework (WAF) v1.0을 MIT 라이선스로 오픈 소스화했다. 에이전트는 YAML로 정의되며, 동일한 매니페스트가 로컬 PC, Windows 365 Cloud PC, Azure 서비스에서 동작한다. Windows Agent Runtime (프리뷰, 2026년 6월)은 에이전트를 OS의 퍼스트 클래스 시민 (First-class citizen)으로 만드는 네이티브 API를 제공한다. Windows Agent Store는 개발자에게 85%의 수익 배분을 보장한다. Adobe (InDesign 템플릿 자동 준비 에이전트)와 Zoom (회의 참여 + 요약의 Microsoft Planner 연동 에이전트)이 디자인 파트너로 참여했다.
【왜 주목해야 하는가】
WAF의 MIT 라이선스는 Azure 외부에서의 포크 (Fork)와 전개를 가능하게 하는 전략적 포석이다. 3계층 아키텍처 (WAF → Runtime → Store)는 자율 소프트웨어를 위한 App Store와 같은 순간을 Microsoft에 가져다줄 것이다.
【기술 코어】
OpenAI는 6월 2일, Codex 앱 내에서 웹 프로젝트를 생성·저장·배포·검증할 수 있는 Sites를 출시했다. 웹사이트, 대시보드, 사내 도구, 웹 앱을 지원하며, 모두 OpenAI가 호스팅한다. v0.136.0 (6월 1일)에서는 세션 아카이브 (/archive), TUI 마크다운 링크 처리, Windows 샌드박스 프로비저닝 (codex sandbox setup --elevated), Python SDK 베타 (pip install openai-codex)가 추가되었다. ChatGPT Business/Enterprise 워크스페이스를 위한 RBAC (역할 기반 액세스 제어)도 지원한다.
【왜 주목해야 하는가】
Sites를 통해 Codex는 AI 코딩 에이전트에서 개발부터 배포까지의 풀 플랫폼 (Full platform)으로 확장되었다. 세션 아카이브와 Python SDK의 조합으로, OpenAI는 영구적인 에이전트 워크스페이스의 인프라를 구축하고 있으며, 이는 Replit, Vercel, GitHub Codespaces와의 직접적인 경쟁이다.
🔗 Codex Updates June 2026 (Releasebot) · OpenAI Codex Releases (GitHub)
【기술 코어】
Google은 Gemini 3.5 Pro의 2026년 6월 일반 제공(GA)을 확정했다 (Flash는 5월 20일 Google I/O에서 출시됨). 내부 벤치마크에서는 GPQA 90% 초과, SWE-bench Pro 65% 초과를 목표로 하고 있으며, 프론티어급 (Frontier-class) 에이전트 추론 모델로 자리매김하고 있다. Vertex AI에서는 초기 기업 도입자를 위한 화이트리스트 액세스 (Whitelist access)가 시작되었다.
【왜 주목해야 하는가】
2026년 6월의 AI 모델 경쟁은 세 가지 전선에서 격화되고 있다: Microsoft의 MAI 패밀리 (수직 통합 및 자체 개발), Anthropic의 Opus 4.8 (지속적 인도), Google의 Gemini 3.5 Pro (에코시스템 번들). 승자는 단일 모델로서 가장 강력한 모델이 아니라, 가장 강력한 에이전트 런타임 (Agent runtime)과 배포력을 가진 플레이어가 될 것이다.
🔗 Gemini 3.5 Complete Guide (Codersera) · Google Gemini 3.5 Official (The Keyword)
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기