본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 26. 20:56

Google Interactions API: 단일 엔드포인트가 전체 에이전트 스택을 대체하다

요약

Google의 Interactions API가 GA(General Availability)에 도달하며 Gemini 모델 및 에이전트를 위한 통합 엔드포인트로 자리 잡았습니다. 이 API는 추론, 서버 측 상태 관리, 비동기 실행, 도구 조합 등을 단일 호출로 처리하여 복잡한 에이전트 오케스트레이션 코드를 대체합니다.

핵심 포인트

  • 단일 엔드포인트로 추론, 상태 관리, 도구 조합 통합
  • 관리형 에이전트를 위한 원격 Linux 샌드박스 제공
  • 에이전트 구축 및 오케스트레이션 비용과 작업량 대폭 절감
  • 비동기(background) 실행 및 서버 측 상태 관리 지원

원문은 twarx.com에서 처음 게시되었습니다 - 전체 인터랙티브 버전은 그곳에서 읽을 수 있습니다.

최종 업데이트: 2026년 6월 26일

대부분의 AI 기술 워크플로우는 완전히 잘못된 문제를 해결하고 있습니다. Google의 새로운 Interactions API는 약 4~6주 분량의 엔지니어 작업량(에이전트 배관 작업) — 즉, 총 비용 기준 약 $20K–$40K에 달하는 구축 비용 — 을 단 하나의 API 파라미터로 줄임으로써 이를 증명했습니다. 현대 AI 기술의 어려운 점은 모델 호출(model call) 그 자체가 아니었습니다. 모델, 에이전트(agents), 도구(tools), 그리고 상태(state) 사이의 조정(coordination)을 포함하여 모델을 둘러싼 모든 것이 문제였습니다.

2026년 6월 26일, Google은 Interactions API가 일반 가용성(General Availability, GA) 단계에 도달했으며, 이제 Gemini 모델 및 에이전트를 위한 기본 인터페이스가 되었다고 발표했습니다. 이제 단일 엔드포인트가 추론(inference), 에이전트, 서버 측 상태(server-side state), 백그라운드 실행(background execution), 도구 조합(tool combination), 그리고 멀티모달 생성(multimodal generation)을 모두 흡수합니다. 이는 프로덕션 AI 기술의 결정적인 순간이며, 모델 출시가 아닌 인터페이스 출시입니다.

빠른 답변

Google Interactions API는 Gemini 모델 및 에이전트와 통신하기 위한 Google의 현재 GA 단계의 기본 엔드포인트입니다. 단 한 번의 호출로 추론, 서버 측 상태, 백그라운드(비동기) 실행, 도구 조합, 그리고 단 한 번의 호출로 프로비저닝되는 원격 Linux 샌드박스를 포함한 관리형 에이전트(Managed Agents)를 처리합니다. 이는 Gemini 우선(Gemini-first) 팀들을 위한 대부분의 커스텀 에이전트 오케스트레이션(agent-orchestration) 코드를 대체합니다.

주요 사실

  • API 명칭: Google Interactions API (Gemini)

  • GA(General Availability) 날짜: 2026년 6월 26일 (퍼블릭 베타: 2025년 12월)

  • 주요 사용 사례: 통합 Gemini 에이전트 오케스트레이션 (agent orchestration) — 모델과 에이전트를 위한 단일 엔드포인트

  • 가격 체계: 모델 측면에서는 토큰당 Gemini API 과금 방식 적용; 관리형 에이전트 (Managed Agent) 샌드박스 컴퓨팅은 별도의 비용이 발생하며 현재는 미공개 상태

  • 3가지 핵심 기능: 관리형 에이전트 (Managed Agents, 1회 호출로 실행되는 Linux 샌드박스), background=True 비동기 (async) 실행, 서버 측 상태 (server-side state)

  • 출처: blog.google — Interactions API GA

이 글은 Google이 실제로 확인한 내용과 언급하지 않은 내용을 구분하며, 정확한 요청 흐름(request flow)을 살펴보고, 공개된 부분에 대해 정직하게 가격을 책정하며, 이 API를 LangGraph, Anthropic, OpenAI와 비교 벤치마킹합니다. 지어낸 숫자는 없습니다. 출처가 생략된 부분은 명시하겠습니다.

Google Interactions API general availability announcement graphic showing unified endpoint for Gemini models and agents

서버 측 상태 (server-side state), 백그라운드 실행 (background execution), 그리고 도구 결합 (tool combination) 기능을 갖춘 Gemini 모델 및 에이전트용 단일 통합 엔드포인트인 Interactions API의 일반 가용성 (General Availability)에 대한 Google의 공식 발표. 출처: Google

Google Interactions API란 무엇인가?

이것은 모델 출시가 아닙니다. 인터페이스 출시입니다 — 그리고 그 차이가 이 이야기의 핵심입니다. Google은 더 똑똑해진 Gemini를 발표한 것이 아닙니다. '모델을 호출하는 것'과 '에이전트를 실행하는 것' 사이의 경계가 단일 API 호출 뒤로 사라지는, Gemini와 대화하는 근본적으로 다른 방식을 발표한 것입니다.

Ali Çevik (Google DeepMind, 그룹 제품 매니저)와 Philipp Schmid (Google DeepMind, 개발자 관계 엔지니어)의 공식 발표에 따르면, Interactions API는 '일반적으로 사용 가능한 상태(General Availability, GA)에 도달했으며, 이제 Gemini 모델 및 에이전트와 상호작용하기 위한 우리의 기본 API가 되었습니다.' 공개 베타는 2025년 12월에 출시되었으며, Google에 따르면 이는 'Gemini를 사용하여 애플리케이션을 구축하는 개발자들에게 빠르게 가장 선호되는 방식이 되었습니다.'

이번 GA 출시는 구조적으로 중요한 세 가지 일을 수행합니다. 첫째, **안정적인 스키마 (stable schema)**를 확정합니다. 즉, 변경 사항으로 인해 시스템이 망가질 걱정 없이 그 위에 구축할 수 있습니다. 둘째, 개발자들이 명시적으로 요청했던 주요 신규 기능들을 제공합니다: 관리형 에이전트 (Managed Agents), 백그라운드 실행 (background execution), Gemini Omni (곧 출시 예정), 그리고 도구(tool) 개선 사항입니다. 셋째 — 그리고 가장 결과적으로 중요한 점은 — _Google의 모든 문서가 이제 Interactions API를 기본값으로 설정한다_는 것입니다. 또한 Google은 '제3자(3P) SDK 및 라이브러리 전반에서 이를 기본 인터페이스로 만들기 위해 생태계 파트너들과 협력하고 있다'고 밝혔습니다.

마지막 지점은 전략적인 지뢰밭입니다. 지배적인 모델 제공업체가 모든 문서를 새로 작성하고 제3자 SDK를 하나의 인터페이스로 밀어붙일 때, 그것은 단순히 기능을 출시하는 것이 아닙니다. 그것은 기본값(default)을 설정하는 것입니다. 기본값이 승리합니다. 그것으로 끝입니다.

Google은 이번 주에 더 똑똑한 모델을 출시한 것이 아닙니다. 더 똑똑한 _인터페이스 (interface)_를 출시했습니다. 그리고 실제 AI 기술의 락인(lock-in)이 발생하는 곳은 모델이 아니라 인터페이스입니다.

왜 시니어 엔지니어들이 지금 당장 이에 관심을 가져야 할까요? 프로덕션 AI (Production AI)에서 어려운 부분은 모델 호출 (model call)이 아니었기 때문입니다. 진짜 어려운 것은 그 모델을 둘러싼 모든 것이었습니다. 요청(request) 간에 대화 및 에이전트 상태 (agent state)를 유지하고, 차단 (blocking) 없이 긴 작업을 실행하며, 내장된 도구 (built-in tools)와 자체 도구를 결합하고, 에이전트가 실제로 무언가를 '수행'할 수 있는 샌드박스 (sandbox)를 프로비저닝하며, 멀티모달 생성 (multimodal generation)을 동일한 흐름에 결합하는 일들 말입니다. Interactions API는 이러한 오케스트레이션 (orchestration) 표면 전체를 API 자체로 흡수합니다. 저는 팀들이 정확히 이러한 배관 작업 (plumbing)을 처음부터 구축하느라 6주를 허비하는 것을 목격해 왔습니다. 이제 그 시간은 기본 요건 (table stakes)이 되었습니다.

새로운 프레임워크 (Coined Framework)

AI 조정 격차 (The AI Coordination Gap)

AI 조정 격차 (AI Coordination Gap)란 개별 모델이 얼마나 뛰어나졌는지와 그 주변 시스템이 상태 (state), 도구 (tools), 에이전트 (agents), 그리고 장기 실행 작업 (long-running tasks)을 얼마나 형편없이 조정하는지 사이의 벌어지는 간극을 의미합니다. 이는 팀들이 취약한 배관 (brittle plumbing) 안에 훌륭한 모델을 실어 보내고는, 정작 모델을 탓하게 되는 시스템적 실패를 지칭합니다.

Interactions API는 LangGraph, AutoGen, 또는 CrewAI와 같은 오케스트레이션 프레임워크 (orchestration frameworks)에 맡기는 대신, API 레이어에서 이 AI 조정 격차를 메우려는 Google의 시도입니다. 이것이 선물일지 함정일지는 전적으로 여러분의 아키텍처 (architecture)에 달려 있습니다. 우리는 두 가지 관점 모두를 살펴볼 것입니다.

2025년 12월
Interactions API 퍼블릭 베타 출시
[Google, 2026](https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/)
...

발표된 내용 — 정확한 사실 관계

누가 (Who): Google DeepMind의 Ali Çevik (Group Product Manager) 및 Philipp Schmid (Developer Relations Engineer)가 The Keyword (Google의 공식 블로그)를 통해 발표했습니다.

무엇을 (What): Google AI Studio Interactions API가 일반 가용성 (general availability) 단계에 도달했으며, Gemini 모델 및 에이전트를 위한 기본 인터페이스 (primary interface)가 되었습니다.

언제 (When): 2026년 6월 26일에 발표되었습니다. 퍼블릭 베타는 2025년 12월부터 시작되었습니다.

어디서 (Where): Gemini 개발자 접점 전반 — 이제 Interactions API를 기본값으로 사용하는 Google AI Studio 및 Gemini API 문서.

주요 기능 (The headline capabilities), Google의 발표문을 직접 인용:

  • 단일 통합 엔드포인트 (A single unified endpoint) — '서버 측 상태 (server-side state), 백그라운드 실행 (background execution), 도구 조합 (tool combination) 및 멀티모달 생성 (multimodal generation) 기능을 갖춘 Gemini 모델 및 에이전트용.'

  • GA (General Availability) 단계의 안정적인 스키마 (Stable schema) — 프로덕션 환경에서 안전하며, 중단적 변경 사항 (breaking changes) 없음.

  • 관리형 에이전트 (Managed Agents) — '단 한 번의 API 호출로 에이전트가 추론하고, 코드를 실행하며, 웹을 탐색하고, 파일을 관리할 수 있는 원격 Linux 샌드박스 (sandbox)를 프로비저닝합니다.'

  • Antigravity 에이전트가 기본값으로 제공됨 — '지침 (instructions), 기술 (skills) 및 데이터 소스 (data sources)'로 정의된 커스텀 에이전트 지원.

  • 백그라운드 실행 (Background execution) — '모든 호출에서 background=True로 설정하십시오. 서버가 상호작용을 비동기적으로 실행합니다.'

  • 도구 개선 (Tool improvements) — '내장 도구를 혼합 (mix built-in tools)'할 수 있는 능력 (원문이 문장 중간에서 끊겼으므로, 'mix built-in tools' 이후의 내용은 아직 확인되지 않은 것으로 간주함).

  • Gemini Omni (곧 출시 예정) — 향후 출시될 예정으로 발표되었으나, 아직 사용 가능하지 않음.

전체 발표 내용 중 가장 중요한 단 한 문장은 기술적인 내용이 아닌 관리적인 내용입니다: '우리의 모든 문서는 이제 Interactions API를 기본값으로 합니다.' 문서가 바뀌면 기본값이 바뀌고, 기본값이 바뀌면 생태계는 두 분기 이내에 그 변화를 따르게 됩니다.

확인된 사항 vs 확인되지 않은 사항: 확인됨 — GA 상태, 안정적인 스키마, 관리형 에이전트 (Managed Agents), Antigravity 기본 에이전트, 백그라운드 실행, 커스텀 에이전트 정의, 2025년 12월 베타 날짜. 확인되지 않았거나 원문에 누락됨 — 관리형 에이전트의 정확한 가격 계층 (pricing tiers), 샌드박스 런타임 제한 (sandbox runtime limits), 지역별 가용성 세부 사항, 그리고 전체 도구 목록 (원문이 잘림). 숫자를 임의로 만들어내는 대신, 이 부분들을 명확하게 표시하겠습니다.

Gemini 백그라운드 실행은 어떻게 작동하나요?

마케팅적인 수사를 걷어내고 보면, Interactions API는 Gemini를 위한 _상태 인식형(state-aware), 에이전트 인식형(agent-aware) 프런트 도어(front door)_입니다. 과거의 방식에서는 애플리케이션이 어려운 부분들을 직접 담당해야 했습니다. 대화 기록을 유지하고, 오래 걸리는 작업에 대한 재시도(retry)를 관리하며, 코드 실행을 위한 컨테이너를 띄우고, 도구들을 서로 연결(glue)해야 했습니다. Interactions API는 이러한 부담의 상당 부분을 서버 측(server-side)으로 옮깁니다. 이것이 실제적인 변화입니다.

세 가지 사고방식의 전환이 중요합니다. 첫 번째는 설명하기에는 가장 간단하지만, 결과적으로는 가장 큰 변화를 가져옵니다.

1. 모델과 에이전트가 하나의 엔드포인트를 공유합니다. Google에 따르면: '추론(inference)을 위해서는 모델 ID를, 자율 작업(autonomous tasks)을 위해서는 에이전트 ID를 전달하고, 오래 걸리는 모든 작업에는 background=True를 설정하십시오.' 이것이 전체적인 사고 모델입니다. 더 이상 '채팅 완료(chat completions)' API와 별도의 '어시스턴트(assistants)' 또는 '에이전트(agents)' 런타임 사이에서 고민할 필요가 없습니다. 단 하나의 인터페이스(surface) 내에서, 어떤 환경에 있을지를 결정하는 파라미터(parameter)만 바뀔 뿐입니다.

2. 상태(State)가 서버에 존재합니다. '서버 측 상태(Server-side state)'란 API가 상호작용을 기억한다는 의미입니다. 매 호출마다 전체 컨텍스트 윈도우(context window)를 다시 재생할 필요도 없고, Redis를 기반으로 한 맞춤형 세션 저장소(session store)를 구축할 필요도 없습니다. 이는 소규모 팀에게 인프라의 한 카테고리 전체를 제거해 주는 효과를 줍니다. Google이 이제 그냥... 처리해 주는 세션 레이어(session layer)를 구축하느라 2주를 허비했던 프로젝트가 있었다면, 저는 이것을 얻기 위해 무엇이든 했을 것입니다.

그리고 세 번째 — 어떤 종류의 제품을 만들 수 있는지조차 조용히 변화시키는 요소는 바로 비동기성(asynchrony)입니다. 긴 작업이 일급 객체(first-class)가 됩니다. background=True 플래그는 생각보다 훨씬 심오합니다. 에이전트 기반 작업(Agentic work)은 느립니다. 브라우징, 다단계 추론(multi-step reasoning), 코드 실행은 각각 몇 분씩 걸릴 수 있습니다. 동기식(Synchronous) HTTP는 이에 적합한 형태가 아닙니다. '작업 큐(job queue), 워커 풀(worker pool), 폴링 시스템(polling system)이 필요해'라는 말이 하나의 불리언(boolean) 값으로 변합니다. 결코 작은 변화가 아닙니다.

관리형 에이전트 요청이 Interactions API를 통해 흐르는 방식

  1

    **단일 엔드포인트로의 클라이언트 호출**

애플리케이션은 하나의 요청을 보냅니다. 모델 ID(추론) 또는 에이전트 ID(자율 작업)를 전달하며, 선택적으로 background=True를 포함합니다. 연결해야 할 별도의 에이전트 런타임은 없습니다.

↓

  2
...

Interactions API는 이전의 상호작용 상태(interaction state)를 서버 측에서 로드합니다. 전체 컨텍스트(context)를 다시 재생하거나 별도의 세션 저장소(session store)를 유지할 필요가 없습니다. 대화 및 에이전트 기록(agent history)은 호출 간에 지속됩니다.

↓

  3
...

에이전트 ID(agent ID)를 사용하면 단 한 번의 API 호출로 원격 Linux 샌드박스(sandbox)가 프로비저닝됩니다. Antigravity 기본 에이전트(또는 사용자 정의 에이전트)는 해당 샌드박스 내부에서 추론하고, 코드를 실행하며, 웹을 탐색하고, 파일을 관리할 수 있습니다.

↓

  4
...

내장 도구(built-in tools)는 사용자의 자체 도구와 결합됩니다. 멀티모달 생성(Multimodal generation)은 동일한 흐름 내에서 실행됩니다. 텍스트를 지원하며, 로드맵에 따라 Gemini Omni 기능이 곧 추가될 예정입니다.

↓

  5
...

background=True를 사용하면 서버가 상호작용을 비동기(asynchronously)로 실행합니다. 클라이언트는 나중에 결과를 폴링(poll)하거나 검색하면 됩니다. 몇 분 동안 HTTP 연결을 열어둔 채로 차단(blocking)할 필요가 없습니다.

이 시퀀스는 왜 이 API가 조정의 격차(coordination gap)를 해소하는지 보여줍니다. 상태(state), 샌드박스(sandbox), 도구(tools), 그리고 비동기 실행(async execution)이 애플리케이션 코드 내부가 아닌 단 하나의 엔드포인트(endpoint) 뒤에서 모두 작동하기 때문입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0