Google Interactions API: 조정 격차(Coordination Gap)를 해소하는 AI 기술

원문은 twarx.com에서 처음 게시되었습니다 - 전체 인터랙티브 버전은 그곳에서 읽어보세요.

최종 업데이트: 2026년 6월 25일

각 단계의 신뢰도가 97%인 6단계 AI 파이프라인은 엔드 투 엔드(end-to-end)로 보았을 때 신뢰도가 약 83%에 불과합니다. 그리고 대부분의 프로덕션 환경에서 AI 기술을 망가뜨리는 것은 모델의 품질이 아니라, 바로 이러한 복리적 실패(compounding failure)입니다. 팀들은 모델의 정확도를 계속해서 튜닝하지만, 실제 피해는 모델, 도구(tools), 상태(state), 그리고 장기 실행 작업(long-running tasks) 사이를 연결하는 접착제 부분에서 발생합니다. 2026년에 실제로 중요한 AI 기술의 변화는 더 똑똑한 모델이 아닙니다. 그것은 모델 주변의 배관(plumbing)을 더 똑똑하게 조정(coordinate)하는 방법입니다.

Google은 바로 그 문제를 정면으로 겨냥했습니다. 2026년 6월 25일, Google DeepMind는 Interactions API가 일반 가용성(general availability)에 도달했으며, 이제 Gemini 모델 및 에이전트와 통신하기 위한 주요(primary) API가 되었다고 발표했습니다. 이는 서버 측 상태(server-side state), 백그라운드 실행(background execution), 도구 조합(tool combination), 그리고 관리형 에이전트(Managed Agents)를 갖춘 단일 통합 엔드포인트(unified endpoint)입니다.

제가 여러분에게 평가를 요청하는 베팅은 다음과 같습니다: 조정(coordination)이 모델의 정확도를 이기며, 조정 레이어(coordination layer)를 소유하는 기업이 개발자를 소유하게 될 것입니다. 아래에서 명명된 프레임워크인 — AI 조정 격차 (The AI Coordination Gap) — 가 이번 출시가 다른 벤치마크 성능 향상보다 더 중요한 이유입니다. 우리는 무엇이 출시되었는지, 아키텍처가 어떻게 작동하는지, 비용은 얼마인지, 그리고 언제 LangGraph나 AutoGen 대신 이것을 사용해야 하는지를 다룰 것입니다.

Google Interactions API general availability announcement graphic showing unified Gemini endpoint architecture

Gemini 모델 및 에이전트를 위한 새로운 주요 인터페이스인 Interactions API의 일반 가용성에 대한 Google의 공식 발표 그래픽. 출처: Google

명명된 프레임워크

AI 조정 격차 (The AI Coordination Gap)

AI 조정 격차 (AI Coordination Gap)는 개별 모델이 얼마나 뛰어난 성능을 갖추게 되었는지와, 이를 둘러싼 주변 인프라(plumbing) — 상태 (state), 도구 라우팅 (tool routing), 비동기 실행 (async execution), 에이전트 오케스트레이션 (agent orchestration) — 가 실제 운영 환경 (production)에서 얼마나 형편없이 작동하는지 사이의 벌어지는 간극을 의미합니다. 이는 대부분의 팀이 모델의 문제로 오진하지만, 실제로는 조정 (coordination)의 문제인 시스템적 결함을 지칭합니다.

프레임워크 정의

AI 조정 격차 (The AI Coordination Gap) — 정의 블록

용어: AI 조정 격차 (The AI Coordination Gap)
정의: AI 조정 격차 (The AI Coordination Gap)는 개별 AI 모델이 얼마나 신뢰할 수 있게 되었는지와, 이를 둘러싼 조정 레이어 (coordination layer) — 상태 (state), 도구 라우팅 (tool routing), 비동기 실행 (asynchronous execution), 에이전트 오케스트레이션 (agent orchestration) — 가 운영 시스템 (production systems)에서 여전히 얼마나 신뢰할 수 없는지 사이의 간극입니다.
개발자에게 중요한 이유: 다단계 파이프라인(multi-step pipeline)에서는 실패가 승수적으로 누적되기 때문에 (예: 각 단계가 97%의 신뢰도를 가진 6단계 체인은 약 83%의 신뢰도만 가짐), 2026년 가장 영향력 있는 신뢰성 확보 작업은 더 똑똑한 모델을 쫓는 것이 아니라 조정 단계 (coordination steps)를 축소하는 것입니다.

Google의 Interactions API는 무엇이며, GA(General Availability)를 통해 실제로 무엇을 출시했는가?

다음은 Google의 공식 발표에 전적으로 근거한 확인된 사실들입니다:

Who (누가): Google DeepMind; Ali Çevik (Google DeepMind 그룹 제품 매니저) 및 Philipp Schmid (Google DeepMind 개발자 관계 엔지니어)가 작성.
What (무엇을): Interactions API가 **일반적으로 사용 가능(General Availability, GA)**해졌으며, 이제 Gemini 모델 및 에이전트와 상호작용하기 위한 Google의 기본 API가 되었습니다.
When (언제): 2026년 6월 25일 발표. 퍼블릭 베타는 2025년 12월에 출시되었습니다.
Where (어디서): Google AI Studio 내부에서 제공되며, 이제 문서의 기본값이 Interactions API로 설정됩니다.
Core promise (핵심 약속): '서버 측 상태(server-side state), 백그라운드 실행(background execution), 도구 조합(tool combination) 및 멀티모달 생성(multimodal generation) 기능을 갖춘 Gemini 모델 및 에이전트를 위한 단일 통합 엔드포인트(single unified endpoint).'

Google에 따르면, 이 API는 'Gemini를 활용해 애플리케이션을 구축하려는 개발자들이 가장 선호하는 방식이 되었습니다.' GA(일반 사용 가능) 단계에 접어들면서, 이 API는 이제 **안정적인 스키마(stable schema)**와 함께 관리형 에이전트(Managed Agents), 백그라운드 실행(background execution), Gemini Omni (출시 예정), 그리고 도구 개선 사항과 같은 주요 새로운 기능들을 제공합니다. Google은 '제3자(3P) SDK 및 라이브러리 전반에서 기본 인터페이스가 될 수 있도록 생태계 파트너들과 협력하고 있다'고 밝혔습니다.

이번 헤드라인의 핵심은 새로운 모델이 아닙니다. Google이 *전체 개발자 접점(developer surface)*을 하나의 엔드포인트를 중심으로 재편했다는 점입니다. 이제 모든 문서의 기본값은 Interactions API로 설정됩니다. 하이퍼스케일러(hyperscaler)가 자신의 기반 인프라(plumbing)를 표준화한다는 것은 벤치마크 결과보다 더 큰 신호입니다.

Interactions API는 무엇을 하나요? AI 기술에 대한 쉬운 설명

상상해 보세요. 당신은 글쓰기, 코딩, 분석, 웹 브라우징 등 거의 모든 일을 할 수 있는 아주 유능한 직원 한 명을 고용했습니다. 문제는 그 직원의 능력이 아닙니다. 당신이 무언가를 필요로 할 때마다 대화 전체 내용을 처음부터 다시 상기시켜줘야 하고, 도구를 하나씩 직접 건네줘야 하며, 당신이 다른 일을 하는 동안 직원이 백그라운드에서 작업을 수행할 수 없기 때문에 긴 작업을 수행하는 동안 옆에서 지켜보고만 있어야 한다는 점입니다.

그 어색한 중간 단계들 — 상기시키기, 도구 건네주기, 기다리기 — 이 바로 Interactions API가 제거하는 요소들입니다. 단 하나의 웹 주소만 있으면 됩니다. 귀하의 소프트웨어가 이를 호출하면, 그 이면에서 Google은 진정으로 어려운 세 가지 작업을 자동으로 처리합니다:

메모리 (Memory, 서버 측 상태 (server-side state)): Google이 서버에서 대화와 문맥 (context)을 기억하므로, 매 호출마다 전체 이력을 주고받으며 전송할 필요가 없습니다.
도구 (Tools): 코드 실행 (code execution), 웹 브라우징 (web browsing), 파일 관리 (file management)와 같은 내장 도구들을 단 한 번의 호출로 혼합하여 사용할 수 있습니다. 수동적인 체이닝 (chaining)이 필요 없습니다.
백그라운드 작업 (Background work): background=True로 설정하면 긴 작업이 Google 서버에서 비동기적 (asynchronously)으로 실행됩니다. 귀하의 앱이 이를 계속 지켜보고 있을 필요가 없습니다.

Google의 설명에 따르면 다음과 같습니다: '모델을 호출하든 에이전트 (agent)를 실행하든, Interactions API를 사용하면 단 몇 줄의 코드로 이를 구현할 수 있습니다. 추론 (inference)을 위해서는 모델 ID를, 자율적인 작업을 위해서는 에이전트 ID를 전달하고, 오래 걸리는 작업에는 background=True를 설정하십시오.'

대략 6단계의 에이전트 파이프라인 (agent pipeline) 중 83%가 단계별 신뢰도 97%로 엔드 투 엔드 (end-to-end) 생존에 성공합니다. 이는 대부분의 프로덕션 AI 실패가 모델의 실패가 아니라 조정 (coordination)의 실패임을 의미합니다.

Interactions API 아키텍처에서 AI 조정 계층 (Coordination Layer)은 어떻게 작동하는가?

대규모 언어 모델 (large language models)을 사용하여 구축하던 기존 방식은 너무 많은 바통 터치가 발생하는 계주 경기와 같았습니다. 모델 엔드포인트 (endpoint)를 호출하고, 응답을 받고, 이를 파싱 (parse)하고, 어떤 도구를 호출할지 결정하고, 해당 도구를 호출하고, 결과를 다시 입력하고, 별도의 데이터베이스에서 대화 메모리를 직접 관리하며, 만약 작업이 오래 걸린다면 연결을 열어두거나 직접 큐 (queue)를 구축해야 했습니다. 저는 엔지니어들이 그 큐를 구축하는 데만 3주를 소비하는 것을 보았습니다. 모든 바통 터치 지점은 바통을 떨어뜨릴 수 있는 위험 요소였습니다.

Interactions API는 이러한 바통 터치 과정들을 하나의 상태 유지형 (stateful)이며 서버가 관리하는 상호작용으로 통합합니다. 흐름은 다음과 같습니다.

단일 Interactions API 호출이 다중 엔드포인트 파이프라인을 대체하는 방식

  1

    **클라이언트 호출 → 통합 엔드포인트 (unified endpoint)**

귀하의 앱은 단 하나의 요청을 보냅니다. 단순 추론 (inference)을 위해 모델 ID를 전달하거나, 자율적인 작업을 위해 에이전트 ID (agent ID)를 전달합니다. 선택적으로 background=True를 설정할 수 있습니다.

↓

  2
...

Google이 서버 측에서 대화/컨텍스트 (conversation/context)를 검색하고 유지합니다. 전체 히스토리를 다시 보낼 필요가 없으므로 — 페이로드 (payload)가 줄어들고 상태 버그 (state bugs)가 감소합니다.

↓

  3
...

에이전트 ID가 전달되면, 에이전트가 추론하고, 코드를 실행하며, 웹을 탐색하고, 파일을 관리할 수 있는 원격 Linux 샌드박스 (sandbox)가 프로비저닝됩니다. Antigravity 에이전트가 기본값으로 제공됩니다.

↓

  4
...

내장된 도구들 (코드 실행, 브라우징, 파일 작업)이 동일한 상호작용 내에 혼합되어 있습니다 — 수동적인 도구 체이닝 (tool-chaining) 글루 코드 (glue code)가 필요하지 않습니다.

↓

  5
...

장시간 실행되는 작업의 경우, 서버가 비동기적으로 실행됩니다. 귀하의 클라이언트는 나중에 결과를 폴링 (poll)하거나 수신합니다 — 연결을 유지할 필요도, 커스텀 큐 (custom queue)를 만들 필요도 없습니다.

↓

  6
...

텍스트, 코드 출력, 파일, 그리고 (곧 지원될) Gemini Omni 멀티모달 생성 (multimodal generation)을 위한 단일 응답 접점 (response surface)을 제공합니다.

모든 제거된 핸드오프 (handoff)는 제거된 실패 지점(failure point)을 의미하기 때문에 이 시퀀스는 중요합니다 — 이것이 인프라 계층에서 AI 조정 격차 (AI Coordination Gap)를 해소하는 방식입니다.

Diagram comparing old multi-endpoint LLM pipeline versus unified Interactions API stateful endpoint architecture

개발자 접점(developer surface)의 전후 비교: 취약한 멀티 엔드포인트 릴레이 (multi-endpoint relay) 대 단일 상태 유지 엔드포인트 (stateful endpoint). 이것이 AI 조정 격차 프레임워크의 이면에 있는 구조적 변화입니다.

명명된 프레임워크

AI 조정 격차 (The AI Coordination Gap)

이는 신뢰성의 절벽 (reliability cliff)으로 나타납니다: 각 단계가 97% 신뢰할 수 있는 6단계 파이프라인은 엔드 투 엔드 (end-to-end)로 보았을 때 약 83%의 신뢰도만을 가집니다. Interactions API는 단계들을 서버 관리형 상호작용 하나로 통합함으로써 이 문제에 대응합니다 — 단계가 줄어들면, 승수적 실패 (multiplicative failures)도 줄어듭니다.

83.3%
각 단계가 97%인 6단계 파이프라인의 정확한 엔드 투 엔드 신뢰도 (0.97^6 = 0.8330)
[LLM 에이전트 체인에서의 복합 오류, arXiv 2024](https://arxiv.org/abs/2308.04026)
...

Interactions API는 무엇을 할 수 있는가? AI 에이전트 기술 기능 전체 목록

발표 내용을 엄격히 근거로 할 때, 이 AI 기술의 GA(General Availability) 출시가 실제로 제공하는 기능은 다음과 같습니다:

통합 추론 + 에이전트 (Unified inference + agents): 단일 엔드포인트(Endpoint). 추론을 위해서는 모델 ID를, 자율적인 작업을 위해서는 에이전트 ID를 전달합니다.
서버 측 상태 (Server-side state): 대화와 컨텍스트가 Google 서버에서 유지되어, 클라이언트 측의 히스토리 관리 부담을 제거합니다.
관리형 에이전트 (Managed Agents): "단 한 번의 API 호출로 에이전트가 추론(Reasoning), 코드 실행, 웹 브라우징 및 파일 관리를 수행할 수 있는 원격 Linux 샌드박스(Sandbox)를 프로비저닝합니다." Antigravity 에이전트가 기본값으로 제공됩니다.
커스텀 에이전트 (Custom agents): 지침(Instructions), 기술(Skills), 데이터 소스를 사용하여 자신만의 에이전트를 정의할 수 있습니다. 다만, 커스텀 에이전트의 제한 사항에 대한 문서가 제가 프로덕션 로드맵을 확정하기에 원하는 수준보다는 다소 부족합니다.
백그라운드 실행 (Background execution): 모든 호출에서 background=True를 설정할 수 있으며, 서버는 상호작용을 비동기(Asynchronously)로 실행합니다.
도구 조합 (Tool combination): 단일 상호작용 내에서 내장된 도구들을 혼합하여 사용할 수 있습니다.
멀티모달 생성 (Multimodal generation): 멀티모달 출력을 위한 단일 인터페이스를 제공합니다.
Gemini Omni (곧 출시 예정): 향후 출시될 예정으로 발표되었습니다. 문장 속의 '곧(soon)'이라는 단어는 매우 중요한 의미를 담고 있으므로, 아직 이를 출시 의존성(Launch dependency)으로 삼아 구축하지는 마십시오.
안정적인 스키마 (Stable schema): GA는 스키마의 안정성을 가져옵니다. 이는 기업들이 로드맵을 확정하기 전에 기다리는 핵심 신호입니다.
생태계 기본값 (Ecosystem default): Google은 이것이 제3자 SDK 및 라이브러리 전반에서 기본값이 되도록 작업하고 있습니다.

주목해야 할 문구는 '단 한 번의 API 호출로 원격 Linux 샌드박스를 프로비저닝한다'는 점입니다. 이는 Google이 에이전트 워크로드(Agentic workloads)를 위해 구축할 때 보통 별도의 벤더에게 비용을 지불하거나 몇 주간의 DevOps 시간이 소요되는 '샌드박스 컴퓨팅'을 API 호출 자체에 조용히 묶어 제공하고 있음을 의미합니다.

Interactions API를 단계별로 액세스하고 사용하는 방법은?

Interactions API는 Google AI Studio와 Gemini Developer API 내에 존재합니다. 이제 모든 문서가 이 인터페이스를 기본으로 제공하므로, 공식 문서가 가장 정확한 정보원(source of truth)입니다. 실질적인 사용 경로는 다음과 같습니다:

Google AI Studio에서 API 키를 발급받으세요.
호출 유형을 결정하세요: 추론 (inference)을 위한 모델 ID (model ID) 또는 자율적인 작업을 위한 에이전트 ID (agent ID) 중 선택합니다.
장시간 실행되는 작업의 경우, background=True로 설정하고 결과를 폴링 (poll) 하세요. 연결을 계속 열어두지 마세요. 연결을 유지하려고 하면 타임아웃 (timeout)이 발생하거나 상태가 손상될 수 있습니다.
에이전트 중심의 워크로드 (agentic workloads)의 경우, 커스텀 에이전트 정의를 작성하기 전에 기본 제공되는 Antigravity 에이전트로 시작하세요. 커스터마이징하기 전에 해당 인터페이스의 범위를 먼저 이해해야 합니다.

Google Interactions API: 조정 격차(Coordination Gap)를 해소하는 AI 기술

요약

핵심 포인트

AI 조정 격차 (The AI Coordination Gap)

AI 조정 격차 (The AI Coordination Gap) — 정의 블록

Google의 Interactions API는 무엇이며, GA(General Availability)를 통해 실제로 무엇을 출시했는가?

Interactions API는 무엇을 하나요? AI 기술에 대한 쉬운 설명

Interactions API 아키텍처에서 AI 조정 계층 (Coordination Layer)은 어떻게 작동하는가?

AI 조정 격차 (The AI Coordination Gap)

Interactions API는 무엇을 할 수 있는가? AI 에이전트 기술 기능 전체 목록

Interactions API를 단계별로 액세스하고 사용하는 방법은?

댓글