Gemini 3.5 Pro와 Google에 손실을 입히는 발표와 출시 사이의 격차

요약 (TL;DR)

2026년 5월 19일 Google I/O에서 발표된 Gemini 3.5 Pro는 6월 23일에 일반 가용성 (GA, General Availability) 기간에 진입했으나, 최신 보고에 따르면 공개적인 Gemini 앱이나 AI Studio가 아닌 Vertex AI 기업 고객에게만 제한적 프리뷰 (Limited Preview) 상태로 남아 있습니다.
주요 사양: **200만 토큰 컨텍스트 윈도우 (Context Window)**를 보유하고 있으며, 이는 현재 생산 단계의 프런티어 모델 중 가장 큰 규모로, 보고된 바에 따르면 GPT-5의 약 10배, Claude의 현재 제한치의 약 16배에 달합니다.
확장 추론 (Extended-reasoning) 모드인 Deep Think는 시장에서 가장 비싼 소비자용 AI 구독 서비스인 Google의 월 $250 Ultra 티어에 한정되어 있습니다.
가격(백만 토큰당 약 $15/$60) 및 벤치마크 성능 향상은 Google의 주장일 뿐 검증되지 않았습니다. 예측 시장(Prediction markets)은 6월 30일까지 공개 출시될 확률을 약 50-55%로 보고 있습니다.

Google의 차세대 플래그십이 기술적으로 이번 주에 "출시"되는데, 바로 그 점이 문제입니다. Gemini 3.5 Pro는 경쟁자가 따라올 수 없는 200만 토큰 컨텍스트 윈도우와 같이 진정으로 인상적인 발표 사양을 갖추고 있지만, I/O 이후 계속해서 출시가 지연되고 있습니다. 진짜 문제는 모델 자체가 아닙니다. Google이 _발표하는 것_과 Google이 출시하는 것 사이의 벌어지는 격차입니다.

실제로 출시되는 것 (그리고 출시되지 않는 것)

Sundar Pichai는 5월 19일 I/O 청중들에게 "다음 달까지 기다려 달라"고 말했습니다. 이제 6월 말이지만, Gemini 3.5 Pro는 여전히 선택된 Vertex AI 기업 고객을 위한 제한적 프리뷰 상태에 머물러 있습니다. 공개 Gemini 앱, AI Studio 또는 소비자 구독 서비스에는 도달하지 못했습니다. 그 전까지는 Gemini 3.1 Pro가 Google의 GA 플래그십으로 남아 있습니다. 아래의 사양들은 Google의 포지셔닝(Positioning)으로 간주하십시오. 검증된 수치는 모델 카드(Model card)가 실제 GA와 함께 제공될 때에만 확인할 수 있습니다.

유일한 실질적 차별점인 200만 토큰 컨텍스트 윈도우

설명된 대로 출시된다면, 가장 눈에 띄는 점은 컨텍스트 윈도우 (Context window)입니다. 200만 토큰에 달하는 이 규모는 Gemini 3.5 Flash의 두 배이며, 현재 배포된 그 어떤 프론티어 모델 (Frontier model) 중에서도 가장 큽니다. 보고에 따르면 이는 GPT-5 컨텍스트 윈도우의 약 10배, Claude의 현재 프로덕션 제한의 약 16배에 해당합니다. 이것은 단순히 벤치마크를 자랑하기 위한 숫자가 아니라, 새로운 역량을 해방하는 수치입니다. 200만 토큰의 윈도우는 오늘날 롱 컨텍스트 (Long-context) 워크플로우가 요구하는 '검색 및 이어붙이기 (Retrieval-and-stitching)' 식의 복잡한 과정 없이도, 단 한 번의 요청만으로 전체 코드베이스, 전체 데이터 룸 (Data room), 또는 수개월간의 대화 기록을 바탕으로 추론할 수 있음을 의미합니다. 기업용 문서 및 코드 사용 사례에서 실제로 중요한 기능은 바로 이것입니다.

Deep Think, 그리고 월 250달러의 의문

Deep Think는 Google의 "답변하기 전에 생각하기" 모드로, OpenAI의 o-시리즈와 유사한 숨겨진 메모장 방식의 추론 (Reasoning) 접근법입니다. 주목할 점은 패키징 방식입니다. Deep Think는 월 250달러의 Ultra 티어에만 독점적으로 제한되어 있어, 소비자 대상 AI 구독 서비스 중 압도적으로 가장 비싼 가격이 되었습니다. Google은 일부 사용자들이 프론티어 추론 능력을 위해 플래그십 소프트웨어 수준의 비용을 지불할 것이라는 데 도박을 걸고 있습니다. 해당 티어가 관객을 찾을 수 있을지는 여전히 미지수입니다.

진짜 이야기: 발표와 출시 사이의 간극은 Google이 반복하는 세금이다

Google은 프론티어 역량을 미리 발표해 두고 정작 제때 출시하는 데 어려움을 겪는 일을 반복하고 있으며, 경쟁사들은 그 간극을 계속해서 메우고 있습니다. 3.5 Pro가 프리뷰 (Preview) 상태에 머물러 있는 동안, OpenAI와 Anthropic은 일반 사용 가능 (General availability) 상태로 제품을 출시합니다. 그 대가는 단순히 출시일이 미뤄지는 것만이 아닙니다. "Gemini 3.5 Pro"가 공개된 모델 없이 한 달 넘게 화두로만 존재했다는 점은, 개발자들이 기다리기보다는 실제로 사용 가능한 것(3.1 Pro 또는 경쟁사 모델)을 기반으로 구축하도록 학습시킵니다. 전환 비용이 저렴한 시장에서, 발표와 가용성 사이의 간극은 Google의 모멘텀 (Momentum)이 유출되는 지점이며, 이번 출시는 Google이 이 간극을 메울 수 있을지를 시험하는 무대로 읽히고 있습니다.

이것이 당신에게 의미하는 바

미출시 사양을 기반으로 아키텍처를 설계하지 마세요. 2M(200만) 토큰 컨텍스트 윈도우(Context Window)와 가격 책정은 GA(General Availability, 일반 사용 가능) 모델 카드(Model Card)가 나오기 전까지는 Google의 주장일 뿐입니다. 현재 바로 사용할 수 있는 것을 기반으로 구축하십시오. 3.5 Pro는 AI Studio 또는 Vertex AI에서 실제로 GA 상태가 된 후에만 파일럿 테스트를 진행하십시오.
긴 컨텍스트(Long Context)가 병목 구간인 경우: 3.5 Pro가 출시되는 당일에 즉시 평가해 보아야 합니다. 전체 코드베이스(Codebase) 및 전체 코퍼스(Corpus) 추론은 실제 워크로드(Workload)에서 테스트할 가치가 있는 진정한 단계적 변화(Step change)입니다.
추론 티어(Reasoning Tier)의 가격을 신중하게 책정하세요. 월 250달러의 Deep Think는 프리미엄 서비스입니다. 계정(Seat)을 할당하기 전에, 품질의 차이(Quality delta)가 귀하의 사용 사례(Use case)에서 그 비용을 정당화할 수 있는지 검증하십시오.
공급업체를 분산하십시오(Hedge providers). Gemini의 GA 출시 주기(Cadence)가 신뢰할 수 있게 될 때까지, 단일 벤더(Single-vendor)에 의존하는 것은 일정상의 리스크를 수반합니다.

자주 묻는 질문 (Frequently asked questions)

Gemini 3.5 Pro를 지금 사용할 수 있나요?

광범위하게는 불가능합니다. 2026년 6월 말 기준으로, 일부 Vertex AI 엔터프라이즈 고객을 대상으로 제한된 프리뷰(Limited Preview) 상태이며, 공개 Gemini 앱, AI Studio 또는 소비자 구독 서비스에는 아직 도달하지 않았습니다. Gemini 3.1 Pro가 여전히 GA 플래그십(Flagship) 모델로 남아 있습니다.

200만 토큰 컨텍스트 윈도우(Context Window)는 어디에 유용합니까?

단일 요청 내에서 매우 큰 입력값, 전체 코드베이스, 대규모 문서 세트, 긴 히스토리(History)를 처리하는 데 유용합니다. 보고에 따르면 이는 GPT-5의 약 10배, 현재 Claude의 프로덕션 제한치의 약 16배에 달하며, 현존하는 모든 프로덕션 프런티어 모델(Frontier model) 중 가장 큽니다.

Deep Think의 비용은 얼마인가요?

현재 시장에서 가장 비싼 소비자용 AI 구독 서비스인 Google의 Ultra 티어(월 250달러)로 제한되어 있습니다.

벤치마크와 가격 책정이 확정되었나요?

아니요. 가격(백만 토큰당 약 15달러/60달러)과 벤치마크 성능 향상은 보고된 예상치일 뿐, 검증된 사실이 아닙니다. 공식 수치는 GA 모델 카드와 함께 발표됩니다.