
Google AI Studio Mobile + Gemini Managed Agents: 2026년 인프라 없이 AI 에이전트를 구축하고
요약
Google이 인프라 구축 없이 AI 에이전트를 개발할 수 있는 AI Studio Mobile과 Gemini Managed Agents를 출시했습니다. 모바일에서 아이디어를 즉시 프로토타이핑하고, 마크다운 기술 파일을 통해 서버 관리 없이 복잡한 추론 에이전트를 배포할 수 있습니다.
핵심 포인트
- AI Studio Mobile을 통한 모바일 기반 즉각적인 프로토타이핑
- Gemini Managed Agents의 서버리스 추론 에이전트 배포
- SKILL.md 파일을 활용한 코드 없는 에이전트 구성
- 코드 실행, 웹 브라우징, 파일 관리 등 내장 도구 지원
- 기기 간 연속적인 워크플로우 및 세션 상태 유지
Google AI Studio Mobile + Gemini Managed Agents: 2026년 인프라 없이 AI 에이전트를 구축하고 배포하는 방법
요약 (TL;DR Summary)
- Google AI Studio가 이제 iOS 및 Android에서 독립형 모바일 앱으로 제공됩니다. 아이디어를 말하기만 하면 백그라운드에서 작동하는 앱이 구축됩니다.
- Gemini Managed Agents는 단 한 번의 API 호출로 추론 에이전트 (reasoning agents)를 배포합니다. 코드 실행 (code execution), Google Search, URL 읽기, 파일 관리 및 웹 브라우징 기능이 포함되어 있습니다.
- 에이전트는 복잡한 오케스트레이션 (orchestration) 코드 대신 **마크다운 기술 파일 (markdown skill files, SKILL.md)**을 통해 구성됩니다. 서버 설정이나 샌드박스 (sandbox) 관리가 필요 없습니다.
- 세션 간 상태가 유지됩니다 (State persists). 파일과 컨텍스트 (context)가 유지되므로 다시 업로드할 필요가 없습니다.
- 모바일에서 프로토타입을 만들고, 데스크톱에서 다듬으며, URL을 통해 라이브 배포본을 공유합니다. 기기 간 연속적인 워크플로우를 제공합니다.
직접 답변 블록 (Direct Answer Block)
Google은 두 가지 새로운 에이전트 인터페이스를 출시했습니다: AI Studio Mobile (음성이나 텍스트로 프로토타입을 만들고 생성된 앱을 휴대폰에서 바로 확인할 수 있는 독립형 iOS/Android 앱)과 Gemini Managed Agents (단 한 번의 API 호출로 배포되는 서버리스 추론 에이전트로, 코드 실행 샌드박스, 웹 검색, 브라우징 및 파일 관리를 포함하며, 오케스트레이션 코드 대신 마크다운 기술 파일을 통해 구성됨)입니다.
서론 (Introduction)
"아이디어가 있다"와 "작동하는 AI 에이전트가 있다" 사이의 간극은 대부분 인프라 (infrastructure) 문제입니다. 서버, 샌드박스, 도구 통합, 상태 관리, 배포 파이프라인이 필요합니다. Google의 두 가지 새로운 출시물은 양쪽 끝에서 그 간극을 좁힙니다. AI Studio Mobile은 책상이 필요 없게 만들고, Gemini Managed Agents는 인프라가 필요 없게 만듭니다. 이 둘을 함께 사용하면 서버 설정에 손을 대지 않고도 음성 메모에서 배포된 에이전트까지 나아갈 수 있습니다.
Google AI Studio Mobile은 어떻게 휴대폰만으로 앱을 구축하고 미리 볼 수 있게 하나요?
- 아이디어를 말하거나 입력하기 — "5일 예보와 위치 검색 기능이 있는 날씨 대시보드를 만들어줘"
- 백그라운드에서 앱 구축 — AI Studio의 에이전트 인프라 (agent infrastructure)가 생성, 코드 실행 (code execution), 그리고 미리 보기 렌더링 (preview rendering)을 처리합니다.
- 모바일에서 미리 보기 — 생성된 앱이 휴대폰 화면에 나타나며, 상호작용 및 테스트가 가능합니다.
- URL을 통한 공유 — 라이브 배포 링크를 통해 팀원이나 사용자로부터 피드백을 수집할 수 있습니다.
- 데스크톱에서 더 깊이 작업하기 — AI Studio 웹 인터페이스가 모바일에서 중단된 지점부터 작업을 이어받아, 전체적인 편집 및 정교화 (refinement) 기능을 제공합니다.
핵심적인 아키텍처 결정 사항은 다음과 같습니다: 휴대폰은 개발 환경 (development environment)이 아니라 프로토타이핑 표면 (prototyping surface)입니다. 코드 생성 및 실행은 Google의 인프라에서 이루어집니다. 휴대폰은 그 결과물을 스트리밍할 뿐입니다. 이는 복잡한 앱(여러 도구를 사용하는 에이전트, 데이터베이스 기반 UI, API 통합 등)을 휴대폰으로 프로토타이핑할 수 있음을 의미합니다. 연산 (compute)은 클라우드에서 수행되고, 휴대폰은 결과만을 보여줍니다.
iOS와 Android 모두에서 사전 등록이 가능합니다. 모바일 앱은 "아이디어에서 미리 보기"를 위한 표면으로 포지셔닝되며, 웹 기반 AI Studio는 "정교화에서 프로덕션"을 위한 표면으로 포지셔닝됩니다. 워크플로우는 기기 간에 연속적으로 이어지며, 가져오기/내보내기(import/export)나 기기 전환에 따른 마찰이 없습니다.
Gemini Managed Agents는 어떻게 단 한 번의 API 호출로 코드 실행, 검색 및 브라우징 기능을 갖춘 추론 에이전트 (reasoning agents)를 배포하나요?
Gemini Managed Agents는 AI 에이전트를 위한 새로운 배포 모델입니다. 인프라를 프로비저닝 (provisioning)하고 오케스트레이션 코드 (orchestration code)를 작성하는 대신, 단 한 번의 API 호출만 하면 Google이 나머지 모든 것을 처리합니다.
기본적으로 포함되는 기능은 다음과 같습니다:
| 기능 (Capability) | 제공 내용 |
|---|---|
| 코드 실행 (Code execution) | 에이전트가 생성한 코드를 실행하기 위한 격리된 Linux 샌드박스 (Sandbox) |
| ... |
이 배포 모델의 의미는 다음과 같습니다: 사용자는 에이전트의 동작(마크다운 기술 파일(markdown skill files)을 통해)과 도구(내장된 기능 중에서)를 정의하고, API를 호출하기만 하면 됩니다. 그러면 Google이 샌드박스를 프로비저닝(provision)하고, 생명주기(lifecycle)를 관리하며, 상태 지속성(state persistence)을 처리하고, Interactions API 또는 AI Studio 인터페이스를 통해 에이전트를 노출합니다.
샌드박스 컴퓨팅은 프리뷰(preview) 기간 동안 무료입니다. 토큰 사용량은 표준 Gemini API 요율로 청구됩니다. 이 가격 모델은 프리뷰 기간 동안 인프라 비용(컴퓨팅, 스토리지, 샌드박스 관리)을 Google이 부담한다는 것을 의미합니다. 즉, 사용자는 소비된 모델 토큰에 대해서만 비용을 지불하면 됩니다.
마크다운 기반 기술 파일 (SKILL.md)은 에이전트 설정을 위한 복잡한 오케스트레이션 (orchestration) 코드를 어떻게 대체하는가?
이는 에이전트의 동작을 함수 호출(function calls), 상태 머신(state machines), 도구 라우팅 로직(tool routing logic)과 같은 코드를 통해 정의하던 기존의 에이전트 프레임워크(LangChain, AutoGPT, 커스텀 Python/TypeScript 오케스트레이터)에서 벗어난 방식입니다. Gemini Managed Agents를 사용하면 동작을 선언적(declaratively)으로 정의할 수 있습니다:
고객 지원 에이전트를 위한 SKILL.md 파일은 다음과 같은 모습일 수 있습니다:
# Customer Support Agent
## Instructions
...
Python 코드가 필요 없습니다. 상태 머신 정의도 필요 없습니다. 도구 라우팅 로직도 필요 없습니다. 마크다운 파일은 에이전트가 무엇을 해야 하는지, 어떤 도구를 사용해야 하는지를 설명합니다. Google의 런타임(runtime)이 이 기술 파일을 해석하고 오케스트레이션을 처리합니다.
이는 선언적 에이전트 구성(declarative agent configuration)을 향한 업계의 광범위한 트렌드를 반영합니다. Anthropic의 CLAUDE.md, OpenAI의 AGENTS.md, Cursor의 규칙 파일(rules files), 그리고 이제 Google의 SKILL.md가 그 예입니다. 공통된 핵심은 에이전트가 '무엇(what)'을 하는지를 평이한 언어로 정의하고, 플랫폼이 그것을 '어떻게(how)' 실행할지를 처리하도록 하는 것입니다.
개발자들에게 이는 다음과 같은 의미를 갖습니다:
- 엔지니어가 아닌 도메인 전문가(domain experts)도 에이전트를 생성할 수 있습니다.
- 에이전트의 동작(behavior)을 일반 텍스트처럼 버전 관리(version-controllable)할 수 있습니다.
- 에이전트의 동작을 변경하는 것은 오케스트레이션(orchestration) 코드를 리팩토링하는 것이 아니라, 마크다운(markdown) 파일을 편집하는 것입니다.
- 스킬 파일(Skill files)은 이식성(portable)을 가집니다. 동일한 SKILL.md 파일이 (플랫폼별 조정을 거쳐) 서로 다른 에이전트 플랫폼에서 작동할 수 있습니다.
샌드박스 상태 지속성(sandbox state persistence)을 통해 에이전트가 파일을 다시 업로드하지 않고도 세션 간에 파일과 컨텍스트를 유지하는 방법은 무엇인가요?
에이전트 개발의 마찰 지점 중 하나는 모든 세션이 새로 시작된다는 점입니다. 만약 에이전트가 데이터셋을 다운로드하고, 이를 처리한 뒤 보고서를 생성했는데 세션이 종료된다면, 다음 세션은 아무것도 없는 상태에서 시작됩니다. 사용자는 다시 업로드하고, 다시 다운로드하고, 다시 처리해야 합니다.
Gemini Managed Agents에는 상태 지속성(state persistence), 즉 "세션 간 파일 및 상태 유지" 기능이 포함되어 있습니다. 샌드박스(sandbox) 환경은 에이전트 세션 전반에 걸쳐 파일과 컨텍스트를 보존합니다. 만약 에이전트가 월요일에 사용자의 문서 인덱스를 구축했다면, 화요일에는 이를 다시 구축할 필요 없이 해당 인덱스를 쿼리(query)할 수 있습니다.
이는 샌드박스 스냅샷(sandbox snapshots)을 통해 구현됩니다(Vercel Sandbox 및 OpenAI의 샌드박스 에이전트가 지속성을 처리하는 방식과 유사합니다). 세션이 종료될 때 샌드박스 상태가 저장되고, 새로운 세션이 시작될 때 복원됩니다. 여러 세션에 걸쳐 진행되는 장기 실행 워크플로(long-running workflows)의 경우, 이를 통해 불필요한 반복 작업을 제거할 수 있습니다.
모바일-데스크톱 연속성 워크플로(mobile-to-desktop continuity workflow)는 프로토타이핑과 프로덕션 배포 사이의 간극을 어떻게 메우나요?
AI Studio Mobile과 웹 기반 AI Studio 사이의 연속성은 원활한 워크플로(seamless workflow)로 설계되었습니다:
-
Mobile (프로토타이핑 (prototyping)): 출퇴근 중이거나 회의 중, 혹은 책상을 떠나 있을 때 아이디어가 떠오릅니다. AI Studio Mobile을 열어 구축하려는 에이전트(agent)나 앱을 설명하면, 휴대폰에서 작동하는 미리보기(preview)를 확인할 수 있습니다. URL을 통해 팀원들과 공유할 수도 있습니다.
-
Web (고도화 (refinement)): 다시 책상으로 돌아오면, 웹 기반 AI Studio에 동일한 프로젝트가 열려 있습니다. 모바일에서 생성된 모든 코드, 에이전트 설정(agent configuration), 도구 정의(tool definitions)가 그대로 유지됩니다. 전체 IDE 경험을 활용하여 에이전트의 동작을 정교화하고, 더 복잡한 도구를 추가하며, 성능을 최적화하고, 엣지 케이스(edge cases)를 테스트할 수 있습니다.
-
Deployment (배포 (Deployment) - API): 고도화된 에이전트는 Gemini Managed Agent로 배포할 수 있습니다. 단 한 번의 API 호출로 샌드박스(sandbox)와 도구가 포함된 완전 호스팅(fully hosted) 환경을 제공합니다. 또는 커스텀 호스팅을 위해 표준 Gemini API 통합 방식으로 내보낼 수도 있습니다.
핵심 속성: 가져오기/내보내기(import/export) 없음, 기기 전환의 마찰 없음, "데스크톱으로 전송" 버튼 불필요. 프로젝트는 사용자의 Google AI Studio 계정에 저장되며 모든 인터페이스가 동기화됩니다. 모바일에서의 작업은 데스크톱에 나타나고, 데스크톱에서의 작업은 모바일에서 접근할 수 있습니다.
Gemini Managed Agents는 인프라 요구 사항 측면에서 Claude Code, Codex 또는 LangChain을 사용한 커스텀 에이전트 구축과 어떻게 비교되나요?
| Gemini Managed Agents | Claude Code Router | Codex Cloud | LangChain Custom | |
|---|---|---|---|---|
| 인프라 (Infrastructure) | 없음 (Google 호스팅) | Anthropic 클라우드 또는 자체 호스팅 (self-hosted) | OpenAI 클라우드 또는 로컬 (local) | 모든 것을 직접 프로비저닝 (provision) |
| ... |
Gemini Managed Agents의 핵심 차별점은 **인프라가 필요 없는 배포 모델 (infrastructure-free deployment model)**입니다. 서버를 프로비저닝하거나, 샌드박스를 관리하거나, 네트워킹을 구성하거나, 상태 지속성(state persistence)을 설정할 필요가 없습니다. Google이 모든 것을 호스팅합니다. 이는 인프라 엔지니어가 되지 않고도 에이전트를 배포하고자 하는 개발자들에게 마찰이 가장 적은(lowest-friction) 옵션이 됩니다.
트레이드오프(Tradeoff): 제어권의 감소. Claude Code의 셀프 호스팅 샌드박스(self-hosted sandboxes)를 사용하면 실행이 발생하는 위치를 정확하게 제어할 수 있습니다. Codex SDK를 사용하면 오케스트레이션(orchestration) 코드를 제어할 수 있습니다. LangChain을 사용하면 모든 것을 제어할 수 있습니다. Gemini Managed Agents는 제어권보다 속도에 최적화되어 있습니다. Google이 운영 복잡성을 처리하므로 몇 분 만에 에이전트를 실행할 수 있습니다.
프로토타이핑(prototyping), 내부 도구, 그리고 인프라 관리가 핵심 역량이 아닌 프로덕션(production) 에이전트의 경우, 관리형 모델(managed model)은 매우 매력적입니다. 엄격한 데이터 레지던시(data residency) 요구 사항이 있거나 복잡한 커스텀 오케스트레이션이 필요한 에이전트의 경우에는 셀프 호스팅(self-hosted) 또는 코드 우선(code-first) 방식이 여전히 필요합니다.
자주 묻는 질문 (Frequently Asked Questions)
Q: AI Studio Mobile을 지금 바로 사용할 수 있나요?
Q: Gemini Managed Agents에서 제가 가진 모델을 사용할 수 있나요?
Q: 샌드박스 상태 지속성(sandbox state persistence)은 Claude Code의 자동 메모리(auto memory)와 어떻게 비교되나요?
Claude Code의 자동 메모리는 세션 전반에 걸친 학습 내용(빌드 명령, 디버깅 통찰 등)을 저장합니다. Gemini Managed Agents는 샌드박스 파일과 상태를 지속시킵니다. Claude의 방식은 학습 중심(무엇이 효과적이었는지 기억함)이며, Gemini의 방식은 데이터 중심(파일과 컨텍스트를 유지함)입니다. 두 방식 모두 세션 연속성(session continuity) 문제를 해결하지만, 서로 다른 관점에서 접근합니다.
Q: Gemini Managed Agent를 제 인프라에 직접 배포할 수 있나요?
Managed Agents는 설계 단계부터 Google이 호스팅하도록 만들어졌으며, 그것이 바로 가치 제안(value proposition)입니다. 만약 셀프 호스팅 배포가 필요하다면, 자체 인프라에서 표준 Gemini API를 사용해야 합니다. 이 경우 동일한 모델을 제공하지만, 관리형 샌드박스와 도구 통합(tool integration) 기능은 제공되지 않습니다.
Q: AI Studio Mobile과 Gemini 모바일 앱의 차이점은 무엇인가요?
AI Studio Mobile은 개발 도구입니다. 에이전트와 앱을 구축하고 프로토타이핑하는 용도입니다. Gemini 모바일 앱은 소비자 대상의 AI 어시스턴트입니다. AI Studio Mobile은 '생성'을 위한 것이고, Gemini 앱은 '사용'을 위한 것입니다. 두 서비스는 목적이 다르지만, 기반 인프라는 공유할 수 있습니다.
Q: Gemini Managed Agents는 프로덕션 환경에 적합한가요?
용어 사전 (Glossary)
- AI Studio Mobile: 음성 또는 텍스트 입력을 통해 AI 에이전트 및 애플리케이션을 프로토타이핑하고, 휴대폰에서 직접 미리보기를 생성할 수 있는 독립형 iOS/Android 앱
- Gemini Managed Agent: Google이 인프라를 호스팅하는 서버리스 (Serverless) AI 에이전트 배포 모델 — 단 한 번의 API 호출로 샌드박스 (Sandbox), 도구 (Tools), 런타임 (Runtime)을 프로비저닝함
- SKILL.md: 에이전트의 동작, 도구 및 응답 형식을 선언적으로 정의하는 마크다운 (Markdown) 기반 설정 파일 — 오케스트레이션 (Orchestration) 코드를 대체함
- Sandbox state persistence: 에이전트의 작업 파일과 컨텍스트 (Context)가 세션 간에 유지되는 능력으로, 불필요한 재처리를 제거함
- Interactions API: Gemini Managed Agents에 프로그래밍 방식으로 접근하고 호출할 수 있는 API 인터페이스
저자
Ramsis Hammadi — 생성형 AI (GenAI), LLM 엔지니어링 및 자동화 전문 AI/ML 엔지니어. 전체 프로필 →
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기