Google AI Studio의 업그레이드된 개발 경험

요약

Google AI Studio가 Gemini 2.5 Pro를 활용한 네이티브 코드 에디터와 AI 기반 웹 앱 구축 기능을 도입했습니다. 개발자는 프롬프트만으로 앱을 생성하고 채팅을 통해 반복적으로 개선할 수 있으며, 멀티모달 모델을 활용한 미디어 생성 및 실시간 오디오 대화 기능도 강화되었습니다.

핵심 포인트

Gemini 2.5 Pro 기반 네이티브 코드 에디터 도입으로 앱 생성 및 배포 용이
채팅을 통한 웹 앱의 지속적인 반복 개선 및 체크포인트 기능 제공
API 키 노출 없이 사용자의 무료 할당량을 활용하는 앱 공유 방식 지원
Imagen, Veo, Lyria 등 생성형 미디어 모델 통합 및 실험 환경 제공
Gemini 2.5 Flash의 Live API를 통한 자연스러운 오디오 대화 기능 지원

Google AI Studio는 Gemini 2.5 preview 모델을 포함한 당사의 가장 강력한 모델들과 Imagen, Lyria RealTime, Veo와 같은 생성형 미디어 (generative media) 모델에 접근할 수 있는, Gemini API를 활용한 빌드 시작을 위한 가장 빠른 장소입니다. Google I/O에서 우리는 완전한 애플리케이션을 빌드하고 배포하는 데 도움이 되는 새로운 기능들, 새로운 모델 기능들, 그리고 Google Gen AI SDK의 새로운 기능들을 발표했습니다.

Gemini 2.5 Pro는 코딩 (coding) 능력이 매우 뛰어나기 때문에, 이를 Google AI Studio의 네이티브 코드 에디터 (native code editor)로 가져오게 되어 매우 기쁩니다. 이는 당사의 Gen AI SDK와 긴밀하게 최적화되어 있어, 간단한 텍스트, 이미지 또는 비디오 프롬프트 (prompt)만으로 앱을 더 쉽게 생성할 수 있습니다. 새로운 Build 탭은 이제 AI 기반 웹 앱을 빠르게 구축하고 배포할 수 있는 관문이 되었습니다. 또한 새로운 모델들을 실험해 볼 수 있는 새로운 쇼케이스 예시들도 출시했습니다.

단일 프롬프트로부터의 앱 생성 외에도, 채팅을 통해 웹 앱을 지속적으로 반복 개선 (iterate)할 수 있습니다. 이를 통해 변경 사항을 만들고, 차이점 (diffs)을 확인하며, 심지어 이전 체크포인트 (checkpoints)로 돌아가 편집 내용을 되돌릴 수도 있습니다.

Google AI Studio 앱과 생성된 코드는 고유한 플레이스홀더 (placeholder) API 키를 활용하여, Google AI Studio가 모든 Gemini API 호출을 프록시 (proxy)할 수 있도록 합니다. 결과적으로, Google AI Studio를 통해 앱을 공유하면 해당 사용자의 모든 API 사용량은 사용자의 Google AI Studio 무료 사용량으로 귀속되며, 귀하의 API 키와 할당량 (quota)을 완전히 우회합니다. 자세한 내용은 FAQ에서 확인하실 수 있습니다.

이 기능은 실험적 (experimental)이므로, 프로젝트를 외부에 공유하기 전에 항상 코드를 확인해야 합니다. 당사의 원샷 생성 (one-shot generation)은 주로 Gemini 및 Imagen 모델과 작동하도록 최적화되었으며, 더 많은 모델과 도구 호출 (tool calls) 지원이 곧 추가될 예정입니다.

우리는 Google DeepMind의 고급 멀티모달 (multimodal) 모델을 개발자들의 도구 상자에 더 빠르게 제공하기 위해 열심히 노력해 왔습니다. 새로운 Generate Media 페이지는 Imagen, Veo, 네이티브 이미지 생성 기능이 포함된 Gemini, 그리고 새로운 네이티브 음성 생성 모델의 발견을 중앙 집중화합니다. 또한, Google AI Studio에 내장된 PromptDJ 앱을 통해 Lyria RealTime과 함께 대화형 음악 생성 (interactive music generation)을 경험해 보세요.

Live API의 프리뷰 단계에서 Gemini 2.5 Flash의 네이티브 오디오 대화 (native audio dialog) 기능을 통해, 이제 모델은 30개 이상의 음성을 지원하며 훨씬 더 자연스러운 응답을 생성합니다. 또한, 모델이 화자와 배경 대화를 구분하여 언제 응답해야 할지를 알 수 있도록 선제적 오디오 (proactive audio) 기능을 추가했습니다. 이를 통해 여러분은 더욱 직관적이고 자연스럽게 느껴지는 대화형 AI 에이전트 (conversational AI agents) 및 경험을 구축할 수 있습니다.

Live API 외에도, 네이티브 오디오 출력 (native audio output)을 지원하는 텍스트 음성 변환 (TTS, text-to-speech)을 위한 Gemini 2.5 Pro 및 Flash 프리뷰를 발표했습니다. 이제 전달 스타일을 유연하게 제어하면서 단일 및 다중 화자 출력을 제작할 수 있습니다.

Stream 탭에서 Live API의 네이티브 오디오를 사용해 보고, Generate Speech를 통해 새로운 TTS 기능을 경험해 보세요.

또한, 점점 늘어나는 오픈 소스 도구들과의 더 쉬운 통합을 위해 Model Context Protocol (MCP) 정의가 Google Gen AI SDK에서 이제 네이티브로 지원됩니다. Google Maps와 Gemini API를 결합하여 Google AI Studio 내에서 MCP 서버를 어떻게 사용할 수 있는지 보여주는 데모 앱을 포함했습니다.

URL Context는 모델이 여러분이 제공한 링크에서 콘텐츠를 검색하고 참조할 수 있는 능력을 부여하는 새로운 실험적 도구입니다. 이는 사실 확인 (fact-checking), 비교, 요약 및 심층 연구에 유용합니다.

이 모든 업데이트를 Google AI Studio에 선보이게 되어 매우 기쁘며, 이를 통해 Google AI Studio가 개발자들이 Google이 제공하는 최신 모델을 탐색하고 구축할 수 있는 장이 되기를 바랍니다.

5월 22일부터 io.google에서 이 발표 내용과 모든 Google I/O 2025 업데이트를 확인해 보세요.

AI 자동 생성 콘텐츠

원문 바로가기

Google AI Studio의 업그레이드된 개발 경험

요약

핵심 포인트

댓글