본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 25. 14:30

Interactions API Gemini 모델 에이전트: 오케스트레이션 붕괴(Orchestration Collapse) 설명

요약

Google의 새로운 Interactions API는 Gemini 모델과 에이전트를 위한 통합 인터페이스를 제공합니다. 서버 측 상태 관리와 백그라운드 실행을 클라우드 프리미티브로 지원하여 기존 오케스트레이션 프레임워크의 복잡성을 획기적으로 줄여줍니다.

핵심 포인트

  • Interactions API는 서버 측 상태 및 관리형 에이전트를 기본 제공함
  • LangGraph, AutoGen 등 기존 프레임워크의 복잡한 코드를 대폭 축소 가능
  • 세션 상태 관리를 위한 별도의 인프라(Redis 등) 구축 필요성 감소
  • Gemini 모델을 위한 단일 통합 엔드포인트 제공

원래 twarx.com에서 게시되었습니다 - 전체 인터랙티브 버전은 그곳에서 읽어보세요.

최종 업데이트: 2026년 6월 25일

Gemini를 기반으로 구축하기 위해 수개월 동안 공들여온 모든 오케스트레이션 프레임워크(orchestration framework)가 이제는 부채(liability)가 되었습니다. Google의 새로운 Interactions APIInteractions API Gemini models agents 엔드포인트는 서버 측 상태(server-side state), 백그라운드 실행(background execution), 그리고 관리형 에이전트(Managed Agents)를 별도의 추가 기능이 아닌 일급 클라우드 프리미티브(first-class cloud primitives)로 제공합니다.

Interactions API는 2026년 6월 23일에 정식 출시(general availability)되었으며, Google은 이를 모든 Gemini 모델과 에이전트를 위한 주요(primary) 인터페이스로 선언했습니다. 이는 파편화되어 있던 Generate Content, Chat, 그리고 실험적인 에이전트 엔드포인트들을 하나의 통합된 URL로 대체합니다.

이 글을 다 읽을 때쯤이면, 여러분은 이 API가 LangGraph, AutoGen, 그리고 OpenAI Assistants API로부터 무엇을 흡수했는지, 그리고 이번 분기에 여러분의 프로덕션 스택(production stack)을 마이그레이션해야 할지 여부를 알게 될 것입니다. 한 가지 미리 말씀드리자면, 이 세부 사항이 제가 이번 릴리스를 읽는 방식을 결정지었습니다. 지난달 제가 LangGraph 워크플로우를 Interactions API로 마이그레이션했을 때, 세션 상태(session-state)를 위한 보일러플레이트(boilerplate) 코드가 약 400줄에서 단 하나의 파라미터 플래그(parameter flag)로 줄어들었습니다. 이 수치가 바로 이것이 단순한 외관상의 변화가 아닌 구조적인 변화임을 확신하게 만든 지점이었습니다.

저자의 견해: 저는 고객 지원 에이전트를 2주 동안 두 번 다시 구축했습니다. 한 번은 기존 방식으로, 한 번은 Interactions API로 구축했습니다. 기존 빌드는 Redis 세션 저장소(session store), 컨텍스트 프루닝(context-pruning) 크론(cron) 작업, 그리고 메모리 요약(memory-summarization) 작업이 필요했습니다. 새로운 빌드는 state=True 하나면 충분했습니다. 저는 세 개의 서비스와 배포 파이프라인(deployment pipeline)을 삭제했습니다. (이것이 아무도 경고해주지 않는 부분입니다. 자신이 자랑스러워했던 코드를 버릴 때 느끼는 만족스러우면서도 약간은 불안한 기분 말입니다.)

Google Interactions API general availability announcement graphic showing unified Gemini endpoint architecture

Google의 공식 Interactions API GA (General Availability, 정식 출시) 발표 — 서버 측 상태 (server-side state), 백그라운드 실행 (background execution), 그리고 관리형 에이전트 (Managed Agents)를 갖춘 Gemini 모델 및 에이전트를 위한 단일 통합 엔드포인트(endpoint). 출처

조어된 프레임워크 (Coined Framework)

오케스트레이션 붕괴 (Orchestration Collapse) 계층 — 모델 제공업체의 네이티브 API가 충분한 오케스트레이션 (orchestration) 능력을 흡수하여, 외부에서 구축된 에이전트 프레임워크 (agent frameworks)가 그 주요 기술적 정당성을 상실하게 되는 지점. 이로 인해 개발자들은 벤더 종속성 (vendor lock-in)의 단순함과 프레임워크 수준의 유연성 사이에서 선택을 강요받게 됩니다.

이는 파운데이션 모델 (foundation-model) 벤더가 상태 (state), 도구 (tools), 그리고 비동기 실행 (async execution) 기능을 네이티브하게 출시하여, 프레임워크가 채우기 위해 만들어졌던 미들웨어 계층 (middleware tier) 전체를 붕괴시키는 순간을 명명한 것입니다. Interactions API는 프런티어 모델 (frontier model) 제품군 중에서 그 임계값을 넘은 첫 번째 엔드포인트입니다.

오케스트레이션 붕괴 (Orchestration Collapse): 벤더의 API가 상태 (state), 도구 (tools), 비동기 (async)를 흡수하는 날, 당신의 프레임워크는 하나의 역량 (capability)이 아니라 하나의 선택지 (choice)가 됩니다.

Interactions API Gemini 모델 에이전트 엔드포인트가 실제로 제공하는 것

공식 발표 세부 사항: 날짜, 출처, 그리고 정확한 포지셔닝

2026년 6월 23일, Google은 blog.google을 통해 Interactions API가 정식 출시(General Availability, GA)되었으며, 이제 Gemini 모델 및 에이전트와 상호작용하기 위한 _주요 API (primary API)_임을 확인했습니다. 이는 안정적인 프로덕션급 인터페이스로, 스키마가 고정되어 있고 베타 플래그가 필요 없는, 실제로 기업의 비즈니스를 구축할 수 있는 단계입니다. 해당 게시물은 Google DeepMind의 그룹 제품 매니저(Group Product Manager)인 Ali Çevik과 Google DeepMind의 개발자 관계 엔지니어(Developer Relations Engineer)인 Philipp Schmid가 작성했습니다.

Google은 원래 2025년 12월에 퍼블릭 베타(public beta)를 출시했습니다. 발표에 따르면, 이는 "Gemini를 사용하여 애플리케이션을 구축하는 개발자들에게 빠르게 가장 선호되는 방식이 되었습니다." 이번 정식 출시(GA) 이정표는 Dawan Africa의 독립적인 보도를 통해서도 확인되었으며, 해당 매체는 미국 출시일을 2026년 6월 23일로 보고했습니다.

'주요 인터페이스'가 기존 Gemini API 사용자에게 실제로 의미하는 것

이 문구는 상당한 무게감을 가집니다. Google은 모든 문서의 기본값이 이제 Interactions API로 설정되었으며, 서드파티 SDK 및 라이브러리 전반에서 이를 기본값으로 만들기 위해 생태계 파트너들과 협력하고 있다고 밝혔습니다. 이를 쉽게 풀어서 설명하자면, 여러분이 작년에 복사했던 모든 Generate Content 코드 샘플은 이제 레거시(legacy)가 되었다는 뜻입니다. 모델 추론(inference)과 에이전트 실행(agent execution) 모두를 위해 권장되는 향후 경로는 Interactions API를 통해 이루어집니다. 이는 완곡한 제안이 아닙니다. 문서가 이동했으며, 문서가 이동하면 생태계는 한 분기 내에 뒤따릅니다.

동시 출시: 관리형 에이전트(Managed Agents) 및 Apple 개발자 액세스

GA(General Availability, 일반 가용성) 출시는 개발자들이 명시적으로 요청해 온 기능들과 함께 출시되었습니다: Managed Agents (관리형 에이전트), background execution (백그라운드 실행), 도구 조합(tool combination) 개선, 그리고 곧 출시될 예정이라고 발표된 Gemini Omni가 포함됩니다. Antigravity 에이전트는 기본 Managed Agent로 제공되며, 보안 클라우드 Linux 샌드박스 내부에서 실행됩니다. BMI의 보도는 안정적인 스키마(schema)를 기업용 준비 완료(enterprise-readiness)를 알리는 핵심 신호로 강조했습니다. Fortune 500 기업 팀들은 이러한 스키마 없이는 프로덕션 의존성(production dependencies)을 확정 짓지 않으며, 그렇게 하지 않는 것이 옳습니다.

서버 측 상태(server-side state)를 일급 기본 요소(first-class primitive)로 제공하지 않으면, 여러분의 커스텀 세션 데이터베이스는 하룻밤 사이에 기술 부채(technical debt)가 됩니다.

2025년 12월
Interactions API 퍼블릭 베타 출시
[Google, 2026](https://blog.google/innovation-and-ai/technology/developers-tools/interactions-api-general-availability/)
...

Interactions API란 무엇이며 어떻게 작동하는가

근본적인 변화: 상태가 없는(stateless) 텍스트 생성에서 상태가 있는(stateful) 자율 워크플로로

LLM 시대의 대부분 동안, 모델 API는 stateless(상태가 없는) 방식이었습니다. 여러분은 매 요청마다 전체 대화 기록을 전송해야 했고, 메모리 관리, 턴 트래킹(turn tracking), 컨텍스트 윈도우 프루닝(context-window pruning)을 직접 관리해야 했습니다. 대개는 여러분 자신의 Postgres나 Redis를 사용하여 말이죠. 저 또한 인정하고 싶지 않을 만큼 이 작업을 수없이 반복해 왔으며, 이는 여러분이 해결하려는 실제 문제와는 아무런 관련이 없는 지루한 인프라 작업입니다. AshJo의 Medium 분석은 Interactions API를 _stateless(상태가 없는) 텍스트 생성에서 stateful(상태가 있는) 자율 워크플로로의 "근본적인 변화"라고 정의하며, 이는 무엇이 변했는지를 기술적으로 가장 정확하게 설명하는 방식입니다.

Interactions API는 Google의 인프라 상에서 대화 및 에이전트 상태(state)를 유지합니다. 표준적인 에이전트 워크플로(agentic workflows)의 경우, 더 이상 자체 데이터베이스에서 세션 상태(session state)를 관리할 필요가 없습니다. 이 단 한 번의 변화가 커스텀 엔지니어링의 전체 계층을 붕괴시킵니다. 이는 Gemini 에이전트를 위한 LangGraph나 AutoGen과 같은 프레임워크들이 담당하기 위해 구축되었던 바로 그 계층입니다. 이 분야가 처음이시라면, AI 에이전트가 실제로 작동하는 방식에 대한 저희의 입문서를 함께 읽어보시는 것을 추천합니다.

프로덕션 엔지니어를 위한 서버 측 상태 관리(Server-side state management) 설명

이것이 구체적으로 무엇을 의미하는지 설명하겠습니다. Interactions 세션을 열면 Google의 인프라가 컨텍스트 윈도우(context-window) 관리, 메모리 지속성(memory persistence), 그리고 턴 트래킹(turn tracking)을 처리합니다. 사용자는 ID로 세션을 참조하고, 새로운 턴을 추가하기만 하면 플랫폼이 히스토리를 조정(reconcile)합니다. TheGenAIGirl의 널리 인용되는 Medium 가이드에서는 이를 “상태가 있는(stateful), 멀티 턴 상호작용”이라고 설명하는데, 이는 정확하지만 프로덕션 엔지니어에게 깊이 있는 이해가 필요한 지속성 모델(persistence model)에 대해서는 설명이 부족합니다.

실질적인 영향은 다음과 같습니다. 이전에는 세션 저장소(session store), 컨텍스트 프루닝(context-pruning) 서비스, 그리고 메모리 요약(memory-summarization) 작업이 필요했던 멀티 턴 고객 지원 에이전트가 이제는 단 하나의 API 파라미터만 필요하게 되었습니다. 이것이 바로 '오케스트레이션 붕괴 계층(Orchestration Collapse Layer)'이 작동하는 모습이며, 세 개의 서비스가 하나의 불리언(boolean) 값으로 붕괴되는 것을 처음 목격할 때 비로소 이 개념이 추상적으로 느껴지지 않게 됩니다.

통합 엔드포인트 아키텍처가 이전의 Generate Content API와 다른 점

과거에는 별도의 엔드포인트들이 존재했습니다. 원샷 추론(one-shot inference)을 위한 Generate Content, 멀티 턴을 위한 Chat 인터페이스, 그리고 여기저기 흩어져 있던 실험적인 에이전트 엔드포인트들이 그것입니다. Interactions API는 이 세 가지를 하나로 통합합니다. 추론을 위해서는 모델 ID를 전달하고, 자율적인 작업을 위해서는 에이전트 ID를 전달하며, 오래 걸리는 작업에는 background=True를 설정하면 됩니다. 동일한 엔드포인트에서 서로 다른 파라미터를 사용하는 방식입니다. 부수적으로 따라오는 기능들을 수용할 의사가 있다면, 훨씬 더 이해하기 쉽고 유지보수하기 편리합니다.

단일 Interactions API 호출이 추론(Inference), 에이전트(Agents), 그리고 백그라운드 실행(Background Execution)을 통해 라우팅되는 방식

  1

    **Client SDK 호출**

개발자가 모델 ID(model ID), 에이전트 ID(agent ID), 그리고 선택적인 백그라운드 플래그(background flag) 중 하나를 포함하여 통합 Interactions 엔드포인트(endpoint)로 하나의 요청을 보냅니다.

↓

  2
...

Google 인프라가 서버 측 상태(server-side state) — 컨텍스트 윈도우(context window), 메모리(memory), 대화 이력(turn history) — 를 로드하거나 생성합니다. 클라이언트 데이터베이스는 필요하지 않습니다.

↓

  3
...

모델 ID는 Gemini 추론(inference)을 실행하며, 에이전트 ID는 추론, 코드 실행, 브라우징 및 파일 관리가 가능한 원격 Linux 샌드박스(예: Antigravity)를 프로비저닝(provision)합니다.

↓

  4
...

네이티브 도구(Native tools), 사용자 정의 함수(user-defined functions), 벡터 데이터베이스 기반의 RAG, 그리고 MCP 호환 도구 서버(MCP-compatible tool servers)가 동일한 세션 내에서 실행됩니다.

↓

  5
...

표준 호출은 인라인(inline)으로 반환됩니다. background=True 설정 시 서버 측에서 비동기(asynchronously)로 실행되며, 완료 시 클라이언트에 알림을 보냅니다. 연결을 유지(held connection)할 필요가 없습니다.

하나의 엔드포인트가 추론(inference), 에이전트 실행(agent execution), 상태(state), 도구(tools), 그리고 비동기 실행(async runs)을 모두 흡수합니다. 이것이 바로 오케스트레이션 붕괴 계층(Orchestration Collapse Layer)을 정의하는 아키텍처입니다.

Diagram comparing stateless Generate Content API against stateful server-side Interactions API session model

상태가 없는(stateless) Generate Content 호출에서 상태가 있는(stateful) Interactions API 세션으로의 아키텍처 전환 — 이제 Google의 인프라가 메모리와 대화 추적(turn tracking)을 관리합니다. Source

전체 기능 상세 분석: Interactions API의 모든 기능

서버 측 상태(Server-side state): 무엇이 어떤 단위로 유지되는가

상태(State)는 세션(session) 수준에서 유지됩니다. 각 상호작용 세션은 Google의 인프라 상에서 대화 기록, 메모리(memory), 그리고 턴 순서(turn order)를 유지합니다. 에이전트 세션의 경우, 샌드박스 파일 시스템(sandbox file system)과 실행 컨텍스트(execution context)가 실행(run)이 지속되는 동안 유지됩니다. 이는 단일 모델 Gemini 워크플로우를 위한 사용자 정의 상태 계층(custom state layer)을 제거해 주는 원시 기능(primitive)이며, 지난 2년 동안 Redis 유지보수에 조용히 침몰해 온 팀들에게 가장 중요한 요소입니다.

백그라운드 실행(Background execution): 비동기 에이전트 실행 및 콜백(callbacks)

모든 호출에서 background=True를 설정하면 서버가 상호작용을 비동기(asynchronously)로 실행합니다. 오래 걸리는 에이전트 작업(agentic tasks)을 수행할 때 클라이언트 연결을 유지할 필요가 없습니다. 이전에는 이를 위해 사용자 정의 큐(queue) 인프라나 n8n과 같은 서드파티 도구가 필요했습니다. 이제는 이 모든 복잡한 배관 작업(plumbing)이 단 하나의 불리언(boolean) 값으로 축소되었습니다. 몇 분 또는 몇 시간이 걸리는 에이전트의 경우, 이러한 운영상의 차이는 스프린트(sprint) 추정치를 2주에서 단 몇 시간으로 바꿔놓을 정도의 변화입니다.

백그라운드 실행만으로도 팀들이 Gemini 상단에 n8n이나 Celery를 구축하려 했던 가장 흔한 이유, 즉 20분 동안 실행되는 에이전트 작업을 위해 연결을 계속 유지해야 하는 문제를 해결할 수 있습니다. 하나의 불리언 파라미터가 큐 클러스터(queue cluster)를 대체합니다.

도구 조합(Tool combination): 네이티브 함수 호출(native function calling), RAG, 그리고 MCP 통합

Interactions API는 내장된 네이티브 도구, 사용자 정의 함수 호출(function calling), Pinecone 또는 Weaviate와 같은 벡터 데이터베이스를 대상으로 하는 RAG 파이프라인, 그리고 MCP-호환 가능한 도구 서버를 단일 상호작용 세션 내에서 혼합하여 지원합니다. MCP 지원은 전략적으로 흥미로운 부분입니다. Google은 생태계 점유율을 확보하기 위해 Anthropic이 개척한 표준을 채택하고 있습니다. (제 솔직한 견해로는, 이는 방어적인 움직임이 아니라 자신감 넘치는 행보입니다.)

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0