
xAI는 프론티어 랩(Frontier Lab)보다 데이터센터 REIT에 더 가까워지고 있다
요약
xAI가 Anthropic 및 Google과 컴퓨팅 용량 파트너십을 맺으며 데이터센터 임대 모델로 수익을 창출하고 있습니다. 이는 xAI가 단순한 AI 연구소를 넘어 막대한 자본 지출을 빠르게 회수할 수 있는 고수익 인프라 기업으로서의 면모를 보여줍니다.
핵심 포인트
- xAI는 Anthropic과 Google에 GPU 컴퓨팅 용량을 제공하며 수익 창출
- Anthropic은 컴퓨팅 부족 문제를 해결하기 위해 xAI의 인프라 활용
- xAI의 인프라 임대 수익은 약 18개월 내에 구축 비용을 회수할 수준
- AI 산업 내 컴퓨팅 자원의 가치와 데이터센터 기반 비즈니스 모델 부상
지난 몇 주 동안 나타난 예상치 못한 전개는 xAI가 Anthropic 및 Google과 새로운 파트너십을 맺으며 그들에게 막대한 양의 용량(Capacity)을 제공하게 된 것입니다. xAI가 지난 2월 두 회사가 합병한 이후 SpaceX의 일부가 되었다는 점을 기억할 가치가 있습니다. 따라서 이러한 거래를 통한 수익은 상장을 앞둔 법인으로 곧장 흘러 들어갑니다. SpaceX의 다가오는 IPO(기업공개)를 고려할 때 잠재적인 재무 공학(Financial engineering)에 대한 이야기가 많이 나오고 있지만, 저는 이것이 단순한 회계적 기교 그 이상이라고 생각합니다.
Anthropic은 심각한 곤경에 처해 있었다
만약 당신이 Claude 제품을 많이 사용한다면, Anthropic이 심각한 용량 문제를 겪고 있다는 사실을 (아마도 매우) 잘 알고 있을 것입니다. 특히 유럽의 이른 오후 시간대와 미국의 오전 시간대가 그러합니다 (이 시기는 유럽 사용자들과 미주 지역 사용자들이 모두 업무 중이라 용량을 차지하기 위해 경쟁하므로 수요가 가장 높게 보이는 때입니다). 저는 이 컴퓨팅 부족(Compute crunch) 현상에 대해—다가올 부족 현상, 그것이 이미 도래했는지 여부, 그리고 다음에 올 것은 무엇인지에 대해—이전에 몇 차례 글을 쓴 적이 있습니다.
이로 인해 Anthropic은 구독 서비스에 새로운 피크 시간(Peak hour) 제한을 도입해야 했습니다. 수요를 용량이 더 여유로운 피크 시간 외 시간대(Off peak hours)로 분산시키는 것을 목표로, 태평양 표준시(PT) 기준 오전 5시오전 11시 / 그리니치 표준시(GMT) 기준 오후 1시오후 7시 사이의 사용량이 사용 한도를 더 많이 소모하도록 설정했습니다.
하지만 Anthropic의 수요가 지금처럼 빠르게 성장하는 상황에서는 수요 전환(Demand shifting)을 할 수 있는 데에도 한계가 있습니다. 어느 시점에 이르면 사용자들에게 더 엄격한 배급(Ration)을 해야만 하며, 이는 Google과 OpenAI가 고객을 두고 바로 뒤에서 압박해 오는 상황에서 결코 이상적이지 않습니다.
xAI가 구원투수로?
5월 초, xAI는 멤피스(Memphis)에 있는 자신들의 (구형) Colossus 1 데이터센터에 대한 접근 권한을 제공하기 위해 Anthropic과 파트너십을 맺었다고 발표했습니다. 이를 통해 Anthropic은 구독 서비스의 사용 제한 조치를 철회할 수 있었으며, 전반적으로 Anthropic 서비스의 안정성은 여전히 매우 개선의 여지가 많지만, 피크 시간대의 부족 현상은 (적어도 지금은) 완화되었습니다.
관련 비용은 엄청나며, 300MW 용량(약 22만 개의 GPU)을 기준으로 월 12억 5천만 달러까지 치솟습니다.
지난주 Google은 이와 유사한 파트너십을 발표했습니다 - 11만 개의 GPU에 대해 월 9억 2천만 달러[1]. 두 계약 모두 해지 조항(cancellation clauses)을 포함하고 있다는 점에 주목해야 합니다. 이는 초기 락인 기간(lock-in period) 이후 90일 전 통지로 양측 모두 계약을 해지할 수 있음을 의미합니다.
이를 액면 그대로 받아들인다면, 이는 xAI에게 터무니없이 수익성이 높은 거래입니다:

비록 여기에는 운영 비용(opex)[2]과 감가상각(depreciation)이 포함되지 않았지만, 만약 이 계약이 18개월 동안 지속된다면, xAI는 지출한 모든 자본 지출(capex)을 회수하고도 여전히 수백 MW 규모의 GPU를 사용할 수 있게 됩니다. 거대한 컴퓨팅 부족 현상이 중기적으로 지속될 가능성이 높기 때문에, 심지어 구형 H100이라 할지라도 18개월 후에도 매우 유용할 가능성이 큽니다.
반대 논거
이 거래에는 분명히 몇 가지 위험 신호(red flags)가 있다는 점을 유의해야 합니다. 첫째, Elon Musk와 OpenAI는 격렬한 법적 공방을 벌여왔거나 현재 진행 중이며, Anthropic과의 거래는 상업적 현실보다는 OpenAI에 압박을 가하려는 동기에서 비롯되었을 수 있습니다.
또한 Google은 SpaceX의 주요 주주이므로, 기업공개(IPO)의 기업 가치(valuation)를 높이려는 유인이 분명히 존재합니다.
이러한 관점들에 어느 정도(어쩌면 아주 많이!) 진실이 담겨 있을 것이라 확신하지만, 엄청난 양의 GPU가 극도로 부족한 상태라는 점 또한 중요하게 짚고 넘어가야 합니다.
데이터센터의 이러한 자본 지출(capex) 붐에서 알려지지 않은 이야기 중 하나는 모든 데이터센터가 얼마나 뒤처져 있는가 하는 점입니다. 심지어 OpenAI의 플래그십인 Stargate UAE 데이터센터조차 - 건축 규제에 대해 자유방임주의(laissez-faire) 태도로 유명한 관할 구역에 건설되고 있음에도 불구하고 - 현재 이란 분쟁으로부터 직접적인 위협을 받고 있습니다. 이미 이란의 드론이 다른 UAE 데이터센터들을 타격한 바 있습니다.
그에 반해, SpaceX/xAI는 데이터센터를 제시간에 구축하는 데 있어 놀라운 능력을 보여주고 있습니다. 최초의 Colossus 1 데이터센터는 122일 만에 건설되었습니다. 머스크(Musk)의 제국은 거대한 인프라 프로젝트를 신속하게 계획, 건설 및 실행하는 방법을 진정으로 이해하는 데 있어 엄청난 이점을 가지고 있습니다. 하이퍼스케일러(Hyperscalers)들이 의심할 여지 없이 이러한 작업을 수행할 경험을 갖추고 있긴 하지만, 그들은 훨씬 덜 긴박하게 구축되었습니다. 전형적인 프로젝트 실행에는 수년이 걸립니다. 자본 지출(Capex)이 지난 몇 년 사이에 본격적으로 급증하기 시작했다는 점을 고려하면, 이러한 프로젝트 중 상당수는 여전히 몇 년의 시간이 더 필요합니다.
이는 제 생각에 단순히 가볍게 넘겨버려서는 안 될 xAI만의 강력한 경쟁 우위를 제공합니다.
하지만 Grok은 어떻게 되는가?
Grok의 학습 및 추론(Inference)에 할당될 예정이었던 많은 데이터센터 용량이 이제 직접적인 경쟁사에게 임대되면서, Grok이 기묘한 상황에 처하게 되었다는 점은 의심의 여지가 없습니다.
어떤 모델 제공업체라도 완전히 무시하는 것은 어리석은 일이지만, Grok이 프론티어급 랩(Frontier class lab)이 되기 위해 경쟁하던 모습에서 확실히 심각한 후퇴를 한 것처럼 보입니다. 하지만 어쩌면, 그들이 데이터센터 용량을 과도하게 지정했을 수도 있습니다. Grok 모델에 대한 추론(Inference) 수요가 예상치보다 크게 뒤처질 가능성이 높으며, 이로 인해 발생하는 유휴 용량을 학습 로또(Training lottery)가 계속되는 동안 수익화하는 것이 나을 수도 있기 때문입니다. 이를 단정 짓기는 어려우며, xAI와 Cursor 간의 거래는 상황을 더욱 모호하게 만듭니다.
따라서 저는 이 세 가지 사항이 어느 정도 모두 사실이라고 생각합니다. 어느 정도의 금융 공학(Financial engineering)이 진행되고 있다는 점은 의심의 여지가 없습니다. 또한 엄청난 컴퓨팅 자원 부족 현상도 존재합니다. 그리고 SpaceX/xAI가 데이터센터 구축에 있어 실질적인 경쟁 우위를 가지고 있다는 점 또한 제 눈에는 분명해 보입니다.
단지 이 각각의 요소들이 얼마나 사실인지에 대한 규모가 북미 역사상 최대 규모의 IPO의 성공과 실패를 결정짓게 될 것입니다.
어느 쪽이든, 조사하면 할수록 xAI는 프론티어 랩이 부속된 데이터센터 REIT(부동산 투자 신탁)에 점점 더 가까워지고 있으며, 그 반대의 경우(프론티어 랩이 데이터센터를 보유한 형태)와는 거리가 멀어지고 있습니다.
Anthropic이 주로 H100/H200을 사용하는 것과 대조적으로, 가격을 고려할 때 이들은 GB200일 가능성이 높다고 추측하지만, 이는 저의 개인적인 추측입니다. ↩︎
전력은 명백하고 큰 운영 비용 (OPEX) 항목이지만, 이 정도 규모에서는 거의 반올림 오차 수준에 불과합니다. 300MW를 풀 가동할 경우 대략 300,000 kW × 8,760시간, 즉 연간 약 26억 kWh가 됩니다. 테네시(Tennessee) 주는 미국에서 가장 저렴한 산업용 전기 요금인 kWh당 약 6센트를 유지하고 있으므로, 그리드(Grid)에서 전력을 구매할 경우 연간 약 1억 6,000만 달러가 소요될 것입니다. Colossus는 실제로 대부분 자체 현장 가스 터빈(Gas turbines)으로 가동되는데, 이는 훨씬 더 저렴합니다. 단순 사이클 열효율(Simple-cycle heat rate)이 ~10,000 Btu/kWh이고 Henry Hub 가스 가격이 ~$3.50/MMBtu일 때, 연료비는 연간 약 9,000만 달러에 불과합니다. 어느 쪽이든, Anthropic이 해당 300MW를 위해 지불하는 연간 약 150억 달러와 비교하면, 전력 비용은 매출의 약 1%에 불과합니다. 계약 가치가 운영 비용을 완전히 압도합니다. ↩︎
AI 자동 생성 콘텐츠
본 콘텐츠는 HN AI Posts의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기