Interactions API가 GA(General Availability)로 출시되었습니다.
요약
Interactions API가 GA(General Availability)로 출시되어 모델 추론과 자율 에이전트를 위한 표준 인터페이스를 제공합니다. 관리형 에이전트, 단순화된 스키마, 비동기 백그라운드 실행 및 확장된 도구 생태계를 지원합니다.
핵심 포인트
- 단일 API로 보안 샌드박스 내 코드 실행 및 브라우징 가능
- 단순화된 선형 스키마를 통한 작업 흐름 최적화
- 비동기 실행(background=True) 및 폴링 지원
- Computer Use, Google Maps 등 확장된 도구 생태계 제공
- 이미지, 음악 생성 및 다중 화자 TTS 미디어 생성 지원
Interactions API가 이제 GA(General Availability) 단계에 도달했습니다. 안정적인 스키마(schema)와 단일 /interactions 엔드포인트를 통한 새로운 기능을 특징으로 하며, 이제 모델 추론(model inference)과 자율 에이전트(autonomous agents) 모두를 위한 표준 인터페이스로 사용됩니다.
주요 업데이트 사항을 확인해 보세요:
— 관리형 에이전트 (Managed Agents): 단일 API 호출을 통해 코드 실행 및 브라우징을 위한 보안 원격 Linux 샌드박스(sandbox)를 실행할 수 있습니다. 기본 제공되는 antigravity-preview-05-2026 에이전트를 사용하거나 사용자 정의 지침(custom instructions)을 사용할 수 있습니다.
— 단순화된 스키마 (Simplified Schema): 모든 작업은 이제 단순화된 선형 흐름(linear flow) 내에서 각자의 단계(user_input에서 model_output까지 등)로 표현됩니다.
— 백그라운드 실행 (Background Execution): background=True로 설정하여 모델과 에이전트를 비동기(asynchronously)로 실행할 수 있으며, 준비가 되면 결과를 폴링(poll)할 수 있습니다.
— 확장된 도구 생태계 (Expanded Tool Ecosystem): Computer Use, File Search, Google Maps에 대한 네이티브 지원과 더불어 Gemini API Docs MCP 서버 및 gemini-interactions-api Skill과 같은 새로운 에이전트 구축 도구가 추가되었습니다.
— 미디어 생성 (Media Generation): Google Search 기반의 Nano Banana 2를 통한 이미지 생성, Lyria 3를 이용한 음악 생성, 그리고 표현력이 풍부한 다중 화자 TTS(Text-to-Speech)를 지원합니다.
더 자세한 내용은 블로그를 읽어보세요: https://t.co/ZzfpUGzAvm
AI 자동 생성 콘텐츠
본 콘텐츠는 X 토픽: MCP의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기