OpenAI와 Cerebras의 100억 달러 인퍼런스 계약 분석
요약
본 기사는 OpenAI가 Cerebras Systems와 체결한 100억 달러 규모의 대규모 추론(Inference) 클라우드 서비스 계약을 분석합니다. 이 계약은 단순한 거래를 넘어, 미래 AI 인프라 시장의 방향성을 제시합니다. 특히, 고성능 컴퓨팅 요구사항이 폭증하는 현 시점에서, OpenAI가 Cerebras와 협력하여 자체적인 웨어스케일(Waferscale) 시스템을 구축하려는 전략적 의도가 핵심입니다. 이 계약은 GPU 중심의 일반 목적 시스템보다 추론에 최적화된 전용 아키텍처의 가치를 입증하며, 향후 AI 모델 배포 및
핵심 포인트
- OpenAI는 Cerebras로부터 직접 하드웨어를 구매하는 대신 클라우드 서비스 형태로 100억 달러 규모의 추론 컴퓨팅 용량을 임대합니다.
- 이 계약은 GPU 기반 시스템보다 추론에 특화된 전용 아키텍처(Cerebras CS-3)가 높은 효율성과 성능을 제공함을 보여줍니다.
- OpenAI는 미래 웨어스케일-4 (Waferscale-4) 및 CS-4 시스템에 대한 독점적인 정보를 바탕으로 장기적 우위를 확보하려 합니다.
- 계약 규모(750MW 용량)를 추정하면 약 32,768대의 CS-3 머신과 16,384개의 랙에 달하는 초대형 인프라가 구축될 것으로 예상됩니다.
최근 AI 시장의 핵심 화두는 '추론(Inference)' 비용 절감 및 속도 향상입니다. 생성형 AI (GenAI)가 주류로 자리 잡기 위해서는 토큰 생성 과정이 획기적으로 빨라지고 저렴해져야 합니다. 특히, 단순 질의응답을 넘어 기계들이 서로 상호작용하는 에이전트(Agentic AI) 단계로 진화함에 따라 고성능 추론 컴퓨팅 자원의 확보가 필수적입니다.
최근 Nvidia가 Groq을 인수하며 시장의 주목을 받았지만, 여전히 성능과 효율성 면에서 Cerebras Systems와 같은 웨어스케일 (Waferscale) 시스템이 강점을 보이고 있습니다. 일반 목적의 GPU 기반 시스템(훈련 및 추론 모두 지원)과 달리, Cerebras나 Groq처럼 처음부터 '추론'에 초점을 맞춘 전용 아키텍처는 결정론적 스케줄링을 통해 더 높은 속도를 제공합니다.
OpenAI와 Cerebras는 2015년부터 협력해 왔으며, GPT-3 모델의 오픈 소스 버전을 Cerebras 시스템에서 구동하며 기술력을 쌓았습니다. 특히, 지난 여름에는 OpenAI가 공개한 첫 번째 오픈 가중치(open weight) 모델인 GPT-OSS-120B를 CS-3 시스템에서 테스트했습니다. 이 모델은 초당 약 2,700 토큰의 응답 속도와 280밀리초(ms)의 최초 토큰 시간(time to first token)을 기록하며 높은 성능을 입증했습니다.
흥미로운 점은 비용 효율성입니다. Groq 클라우드 서비스가 입력/출력 메가토큰당 각각 15센트와 75센트를 청구하는 데 비해, Cerebras는 같은 용량에 대해 25센트(입력)/69센트(출력)를 부과합니다. 그럼에도 불구하고 OpenAI가 Cerebras와 100억 달러 규모의 클라우드 서비스 계약을 체결한 이유는 무엇일까요?
전문가들은 이 결정이 단순한 비용 분석을 넘어선 전략적 포석이라고 분석합니다. OpenAI는 다가올 하반기 출시 예정인 웨어스케일-4 (Waferscale-4) 및 CS-4 시스템에 대한 정보를 보유하고 있으며, 이는 시장의 다른 플레이어들이 접근하기 어려운 핵심 우위입니다. 또한, Nvidia가 Groq 팀을 흡수한 이후, GroqCloud 서비스가 새로운 LPU 컴퓨팅 엔진으로 업그레이드되기 어려워졌다는 점도 작용한 것으로 보입니다.
이 계약은 OpenAI가 직접 데이터센터나 하드웨어를 소유하는 대신, 필요할 때마다 클라우드 서비스를 임대하여 유연성을 극대화하려는 전략을 반영합니다. Andrew Feldman(Cerebras 공동 창립자 및 CEO)에 따르면, 이 컴퓨팅 용량은 주로 미국 내 데이터센터에 설치될 예정이며, 2026년 1분기부터 단계적으로 확장되어 2028년까지 지속될 것입니다.
결론적으로, OpenAI의 이번 계약은 AI 인프라 시장이 '범용성'을 넘어 '특정 목적 최적화(Specialized Optimization)'와 '미래 기술 선점'에 초점을 맞추고 있음을 보여주는 중요한 사례입니다. 이는 추론 속도와 효율성이 곧 기업 경쟁력이 되는 시대가 도래했음을 의미합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 The Next Platform의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기