
Google의 AI 최종 단계가 왔다… I/O 2026에서 놓친 모든 것
요약
Google I/O 2026을 통해 Gemini 중심의 에이전트 생태계와 인프라 확장 전략을 분석합니다. Gemini Omni 모델의 등장과 TPU 학습/추론 칩 분리, 그리고 폭발적인 토큰 처리량 증가를 통한 Google의 시장 지배력 강화 전략을 다룹니다.
핵심 포인트
- Gemini 기반의 에이전트 중심 제품 로드맵 발표
- 학습(TPU-T)과 추론(TPU-I)으로 분리된 차세대 TPU 인프라
- 텍스트, 비디오, 소리를 통합 처리하는 Gemini Omni 모델
- 월간 3.2경 개의 토큰을 처리하는 압도적인 확장 능력
영상: Google의 AI 최종 단계가 왔다… I/O 2026에서 놓친 모든 것
채널: Fireship
길이: 5분 43초
언어: 영어
전사:
어제 Google I/O가 막을 내렸고, 저는 Sundar와 Demis가 소프트웨어의 미래를 위한 야심 찬 비전을 제시하는 것을 직접 지켜볼 수 있었습니다. 그리고 보아하니, 그 미래는 마치 혈류 속의 미세 플라스틱처럼 모든 제품 내부에 Gemini가 숨어 있는 모습입니다. 로드맵은 기본적으로 Gemini를 가져다가 명사를 붙여서 출시하는 것입니다. Gemini Spark, Gemini Omni, Gemini Flow 등 목록은 계속됩니다. 그들은 이를 에이전트 중심의 Gemini (agentic Gemini) 시대라고 부르고 있습니다. 검색은 이제 AI 에이전트이고, Gmail은 AI 에이전트이며, Android는 AI 에이전트이고, 여러분의 안경도 AI 에이전트입니다. 키노트를 지켜보며 저는 한 가지를 깨달았습니다. Google은 더 이상 파란색 하이퍼링크로 세상의 정보를 정리하려고 노력하지 않습니다. 왜냐하면 검색 엔진은 이제 구식 기술이 되었기 때문입니다. 대신, Google은 Anthropic과 OpenAI가 더 나은 현실을 만들기 전에 현실 그 자체에 대한 인터페이스가 되려고 노력하고 있습니다. 하지만 다행히도 Google I/O가 AI에 관한 것만은 아니었습니다. Angular에 대한 업데이트는 보지 못했지만, 모든 웹 개발자가 알아야 할 멋진 새로운 웹 API를 발견했습니다. 오늘 영상에서는 Google I/O에서 놓친 모든 것을 분석해 보겠습니다. 오늘은 2026년 5월 22일이며, 여러분은 Code Report를 시청하고 계십니다. 여러분이 좋아하든 싫어하든, Google에 대해 부정할 수 없이 인상적인 한 가지는 바로 확장(scale) 능력입니다. 핵심 제품을 매일 수십억 명의 활성 사용자에게 제공할 뿐만 아니라, 지난 2년 동안 월간 9.7조 개의 토큰(tokens) 제공에서 무려 월간 3.2경(quadrillion) 개의 토큰 제공으로 급증했으며, 그 수치는 계속해서 가속화될 것입니다. 또한, 여러분이 Nano Banana로 만드는 이 모든 바보 같은 AI 이미지들을 지원하기 위한 새로운 인프라를 구축하면서 Alphabet의 자본 지출(capital expenditures)도 폭발적으로 증가했습니다. 회계사처럼 차려입은 퍼그를 본 적이 있나요? 아니죠. 보고 싶으신가요? 어... 이러한 거대한 규모를 가능하게 하는 한 가지는 Google의 TPU 칩, 즉 텐서 처리 장치(Tensor Processing Unit)입니다.
2018년 첫 Google I/O에서 TPU를 직접 보았을 때의 경이로움을 기억합니다. 하지만 이번 주, Google은 이 칩들을 TPU-T와 TPU-I라는 두 가지 별개의 작업, 즉 학습 (Training)과 추론 (Inference)으로 분리한다고 발표했습니다. 다시 말해, 이제 Google은 로봇에게 생각하는 법을 가르치도록 최적화된 칩 하나와, 전 세계적인 규모로 검색 결과를 환각 (Hallucinate)하도록 최적화된 또 다른 칩을 보유하게 된 것입니다. 하지만 Google I/O의 헤드라인 발표는 Gemini Omni였습니다. 이는 텍스트, 비디오, 소리와 같은 모든 입력을 받아 어떤 출력이라도 만들어내는 모델입니다. Google에서 가장 똑똑한 사람일지도 모르는 Demis Hassabis는 완전히 '월드 모델 (World-modeled)'에 몰입한 것으로 보이는데, 왜냐하면 이런 모델들은 더 이상 단순히 픽셀만을 생성하는 것이 아니기 때문입니다. 이들은 언어, 물리학, 움직임, 그리고 당신의 세상에 존재하는 그 외 모든 것들을 이해하며, 필요할 때 현실을 시뮬레이션할 수 있을 만큼 충분히 잘 파악하고 있습니다. 하지만 이 새로운 모델과 함께 Gemini 앱을 위한 'Neural Expressive'라는 완전히 새로운 디자인 시스템이 등장했습니다. 언뜻 보기에 UI는 새로운 아이콘과 더 나은 그라데이션이 적용된 단순한 업그레이드처럼 보이지만, 이 시스템의 독특한 점은 다이어그램, 타임라인, 심지어 프롬프트가 입력되기 전에는 존재하지 않았던 미니 앱과 같이 UI 요소를 필요에 따라 생성하도록 최적화되어 있다는 것입니다. 이제 Google의 핵심 거대 언어 모델 (LLM)에 대해 이야기하자면, 그들은 '거대한 두뇌' 모델은 아니지만 '빠른' 모델인 Gemini Flash 3.5를 출시했습니다. 'Trust Me Bro' 벤치마크에 따르면, 이 모델은 Opus 4.7 및 GPT 5.5와 거의 대등한 성능을 보이면서도 훨씬 빠른 속도로 실행됩니다. 이 'Trust Me Bro' 다이어그램을 보면, Flash는 속도와 지능 측면에서 완전히 독자적인 사분면에 위치하고 있음을 알 수 있습니다. 하지만 이것이 그들의 최상위 모델은 아니라는 점을 기억하는 것이 중요합니다. Gemini 3.5 Pro는 여전히 베일에 싸여 있으며 이번 여름 말까지는 출시되지 않을 것으로 예상되는데, 이는 인터넷상의 많은 사람들에게 매우 실망스러운 소식이었습니다. 실망에 대해 말하자면, Google의 anti-gravity IDE의 새로운 방향에 대해 모두가 만족했던 것은 아닙니다.
Anti-gravity는 이전에 Windsor로 알려져 있었으며, Cursor와 마찬가지로 AI 코딩을 위한 VS Code 포크 (fork)였습니다. 그리고 다시 한번 Cursor의 발자취를 따르듯, 최신 버전은 코드를 작성하는 것보다 에이전트 (agents)를 관리하는 데 더 집중하는 OpenAI Codex의 클론 (clone)처럼 보입니다. 전통적인 프로그래머들은 이러한 변화를 반기지 않을 수도 있지만, 라이브 데모는 정말 멋졌습니다. 그들은 이 도구를 사용하여 처음부터 완전한 운영체제 (operating system)를 구축했는데, 약 12시간과 수십억 개의 토큰 (tokens)이 소요되었습니다. 그 후 그들은 그 위에서 Doom을 실행하려고 시도했으나, 드라이버 (drivers)가 없어 실패했습니다. 하지만 무대 위 라이브 상황에서, 그들은 Gemini가 해당 드라이버를 코딩하게 했고, 불과 몇 초 만에 Doom이 실행되었습니다. 가장 인상적인 부분은 이 장치가 토큰을 뱉어내는 순수한 속도였지만, 증가하는 것은 속도만이 아닙니다. Gemini 3.5 Flash의 가격은 이전 버전보다 3배 더 비싸며, Gemini 1.5 Flash보다는 30배 더 비쌉니다. 여전히 Claude보다는 훨씬 저렴하지만, 예전만큼 저렴하지는 않습니다. I/O의 거의 모든 것은 어떤 방식으로든 AI를 포함하고 있었지만, 만약 여러분이 웹 개발자라면 Chrome에서 알아두어야 할 멋진 기능 중 하나는 HTML 및 Canvas API입니다. 이름에서 알 수 있듯이, 이제 캔버스 (canvas) 내에서 HTML 요소를 직접 사용할 수 있게 해줍니다. 이것들은 캔버스에 렌더링되는 네이티브 (native) HTML 요소들입니다. 와우! 이는 WebGL 및 WebGPU와 같은 도구를 사용하여 모든 픽셀을 제어하면서 동시에 더 기본적인 UI 요소에는 HTML을 사용하는, 매우 상호작용적인 UI를 구축할 수 있음을 의미합니다. 유일한 질문은 이 API를 작업하기 위해 어떤 AI 코딩 모델을 사용해야 하는가입니다? 글쎄요, 그것이 바로 오늘 영상의 스폰서인 Emergent에 대해 알아야 하는 이유입니다. 요즘 모두가 다섯 가지의 서로 다른 코딩 모델 사이를 전환하며 사용하고 있지만, 우리는 여전히 실제로 작동하는 풀스택 (full-stack) 애플리케이션을 출시하는 데 도움을 줄 무언가가 필요합니다. 그리고 바로 그 지점에서 Emergent가 도움을 줄 수 있습니다.
현재 저는 이를 사용하여 Pull Request (PR) 리뷰 대시보드를 구축하고 있습니다. GitHub 링크를 붙여넣기만 하면 각 저장소(repo)별 모든 변경 사항과 리스크에 대한 AI 요약을 받을 수 있습니다. 여전히 프롬프트(prompt)로 시작하지만, 하나의 LLM (Large Language Model)이 모든 구축 방법을 추측하는 대신, Emergent는 여러분의 앱 프론트엔드(front-end), 백엔드(back-end), 데이터베이스(database), 테스트(testing), 배포(deployment)를 위해 특화된 에이전트(agent)들을 모두 병렬로 실행합니다. 또한 Supabase 연결 설정이나 Express 보일러플레이트(boilerplate)를 직접 만질 필요도 없습니다. 단 하나의 프롬프트가 앱의 데이터베이스, 인증(auth), 그리고 API를 설정해주기 때문입니다. 만약 스스로 고통받는 것을 정말 좋아하신다면 계속해서 이런 것들을 수동으로 스캐폴딩(scaffolding)하셔도 좋지만, 아니면 그냥 원하는 도구를 설명하고 Emergent의 에이전트 스웜(agent swarm)이 모든 것을 구축하게 할 수도 있습니다. 아래 링크에서 무료로 체험해 보세요. 지금까지 The Code Report였습니다. 시청해 주셔서 감사하며, 다음 영상에서 뵙겠습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 YouTube Fireship (개발 트렌드)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기