
저렴한 AI의 등장, OpenAI와 Anthropic의 IPO를 위협할 수도
요약
최근 기업들의 AI 추론 비용이 급증하면서 수익성에 부담을 주고 있는 가운데, OpenAI와 Anthropic의 높은 기업 가치를 위협하는 저렴한 AI 모델들이 등장하고 있습니다. 중국 연구소들의 모델은 미국 모델 대비 압도적으로 낮은 비용을 제공하며, Google 또한 비용 절감을 위해 더 저렴한 Flash 모델을 대안으로 제시하고 있습니다. 성능 격차가 줄어들면서 기업들이 고가의 프론티어 모델 대신 효율적인 대안을 선택하는 추세가 가속화되고 있습니다.
핵심 포인트
- 기업들의 AI 및 추론(Inference) 비용 증가가 수익성 저해 요소로 부상
- DeepSeek, Kimi 등 중국 모델이 OpenAI, Anthropic 대비 현저히 낮은 비용 경쟁력 보유
- 성능 격차 감소로 인해 고가의 프론티어 모델 대신 저렴하고 효율적인 모델로의 전환 가속화
- Google 등 주요 빅테크 기업들도 비용 절감을 위한 경량화 모델(Flash 등)을 전략적으로 제시
이번 실적 발표 시즌에는 AI 비용이 수치로 나타나기 시작했습니다. Meta, Shopify, Spotify, Pinterest 모두 상승하는 AI 및 추론 (Inference) 비용이 수익성 (Margins)을 저해하는 요소라고 지적했습니다. Shopify는 규모의 경제가 "LLM (대규모 언어 모델) 비용 증가로 인해 부분적으로 상쇄되었다"고 밝혔습니다.
이는 OpenAI와 Anthropic의 예상 IPO (기업공개) 기업 가치—두 기업 모두 8,000억 달러 이상으로 전망됨—를 뒷받침하는 가격 모델에 대해 청구되는 청구서와 같습니다. 이러한 수치는 OpenAI와 Anthropic이 시장 점유율과 가격 결정력을 유지할 것이라는 점, 즉 경쟁자들이 쉽게 따라잡을 수 없으며 기업 고객들이 실질적인 대안이 없기 때문에 계속해서 프리미엄을 지불할 것이라는 가정을 전제로 합니다.
하지만 데이터는 점점 더 반대 방향을 가리키고 있습니다. 최첨단 AI가 풍부해지고 저렴해지고 있습니다. 중국 연구소들은 유사한 작업에 대해 미국 연구소들이 부과하는 비용의 아주 일부만을 청구하고 있는 반면, Nvidia, Cohere, Reflection, Mistral과 같은 서구의 도전자들은 중국 모델을 사용하지 않으려는 기업들을 위해 더 저렴하고, 더 작으며, 더 효율적인 대안을 구축하고 있습니다. OpenAI가 이르면 이번 주에 기밀 공시를 제출하는 등 OpenAI와 Anthropic이 투자 설명서를 제출할 때쯤이면, 그들의 기업 가치를 결정짓는 핵심 전제가 이미 사라져 있을지도 모릅니다.
비용 격차는 크며 점점 더 벌어지고 있습니다. 기업의 AI 예산은 급증했습니다. 클라우드 비용 전문 기업인 CloudZero가 조사한 기업 중 약 45%가 2025년에 AI에 월 10만 달러 이상을 지출했다고 답했는데, 이는 전년도의 20%에서 증가한 수치입니다. 그 돈이 어디로 흘러가는지가 점점 더 중요해지고 있습니다. AI 벤치마킹 기업인 Artificial Analysis는 모든 주요 모델을 동일한 10가지 평가 항목으로 실행하여 총비용을 추적합니다. 각 연구소의 가장 유능한 모델을 기준으로 보면 다음과 같습니다: Anthropic의 Claude는 4,811달러, OpenAI의 ChatGPT는 3,357달러, DeepSeek는 1,071달러, Kimi는 948달러, Zhipu의 GLM은 544달러였습니다. Claude는 동일한 작업 부하(Workload)에 대해 가장 저렴한 중국산 대안보다 거의 9배 더 비쌉니다.
Google조차도 이 점을 강조하고 있습니다. 이번 주 열린 I/O 개발자 컨퍼런스에서 Sundar Pichai CEO는 "많은 기업이 이미 연간 토큰 예산을 초과하여 소진하고 있으며, 이제 겨우 5월일 뿐입니다"라고 말하며, 자사의 더 저렴한 Flash 모델을 그 해답으로 제시했습니다. Pichai는 만약 Google Cloud의 가장 큰 고객들이 워크로드(Workload)의 80%를 프론티어 모델(Frontier models)에서 Gemini 1.5 Flash로 전환한다면, 연간 10억 달러 이상의 비용을 절감할 수 있을 것이라고 말했습니다. 이 회사는 기업들에게 더 저렴한 옵션이 필요하다는 점을 인정하고 있습니다.
그리고 저렴한 대안들은 더 이상 뒤처져 있지 않습니다. 작년 미국 기술주 매도세를 촉발했던 중국 AI 연구소 DeepSeek는 지난달 차세대 모델의 프리뷰를 공개했는데, 이 모델은 코딩, 에이전트(Agentic), 지식 벤치마크(Benchmarks)에서 OpenAI, Anthropic, Google의 최신 모델과 대등하거나 거의 근접한 성능을 보여주었습니다. Moonshot, Xiaomi, Zhipu를 포함한 다른 중국 연구소들의 모델들도 지난 4개월 동안 유사한 역량 수준으로 출시되었습니다.
Databricks의 CEO Ali Ghodsi는 이러한 변화를 실시간으로 목격하고 있습니다. 이 회사의 AI 게이트웨이(AI gateway)는 수천 명의 기업 고객과 그들이 사용하는 모델들 사이에 위치하며, Ghodsi는 해당 제품의 매출이 급격히 상승하고 있다고 말했습니다.
그는 기업들이 도입하고 있는 기술을 "어드바이저 모델(Advisor model)"이라고 불렀습니다. 저렴한 오픈 소스(Open-source) 모델이 기본값으로서 업무의 대부분을 처리합니다. 그러다 해결할 수 없는 작업에 부딪히면, OpenAI나 Anthropic의 프론티어 모델을 호출하여 도움을 받을 수 있는 도구가 주어집니다.
"이런 방식으로 비용을 매우 효과적으로 억제할 수 있습니다"라고 Ghodsi는 말했습니다.
변화의 속도는 놀랍습니다. 개발자들이 단일 인터페이스를 통해 수백 개의 AI 모델에 접근할 수 있게 해주는 마켓플레이스인 OpenRouter에서, 중국 모델의 사용량은 2024년 약 1%에서 5월에는 60% 이상으로 급증했습니다.
그리고 공급업체들은 비용 절감을 하나의 제품으로 판매하기 시작했습니다. Figma의 CEO Dylan Field는 기업들이 AI 도입의 세 가지 단계를 거치고 있다고 말했습니다. 첫 번째는 아무도 사용하지 않는 단계, 두 번째는 모두가 사용해야만 하는 단계로, 어떤 경우에는 "말 그대로 누가 토큰(token)을 가장 많이 쓰는지 경쟁을 벌이기도" 합니다. 그리고 세 번째는 "모두가 너무 많은 돈을 쓰고 있다"는 사실을 깨닫고 비용을 줄여야 하는 단계입니다. 그는 많은 기업이 현재 이 세 번째 단계에 진입하고 있다고 말했습니다. Figma는 고객의 토큰 소비량을 20~30%까지 줄여주는 기능들을 판매하고 있습니다.
이러한 비용 격차는 양측이 구축된 방식의 차이를 반영합니다. 미국의 프런티어 연구소(frontier labs)들은 수천억 달러 규모의 자본 지출(capex)을 바탕으로, 용량을 충분히 빠르게 늘릴 수 없는 미국 전력망 안에서 Nvidia가 판매하는 가장 비싼 칩을 사용하여 점점 더 거대한 모델을 학습시키고 있습니다. 이러한 비용은 고객에게 전가됩니다. 반면 중국 연구소들에게는 제약이 곧 전략이 되었습니다. 칩 수출 제한 하에서 일하게 된 그들은 더 적은 컴퓨팅 자원(compute)으로 경쟁력 있는 모델을 학습시키고 이를 더 효율적으로 실행하는 등 공격적인 최적화를 강요받아 왔습니다.
미국 연구소들의 가장 강력한 방어 수단은 신뢰입니다. 은행, 국방 기관 및 기타 규제 산업에 특화된 AI 모델을 판매하는 Cohere의 CEO Aidan Gomez는 이러한 구매자들이 가격에 상관없이 중국 모델은 건드리지 않을 것이라고 말합니다. Cohere는 정확히 해당 부문에 판매를 진행하며 작년에 매출이 6배 성장했습니다. 하지만 이는 더 넓은 기업 시장에서 보면 상대적으로 좁은 영역입니다. 보안 및 컴플라이언스(compliance) 규칙이 더 느슨한 규제 산업 외의 영역에서는 프리미엄 비용을 지불해야 할 명분을 찾기가 더 어려워집니다.
미국의 대응이 구체화되고 있습니다. AI 붐에서 가장 큰 이익을 얻은 기업인 Nvidia는 이제 다른 모델을 공개적으로 밀어붙이고 있습니다. Nvidia는 중국의 옵션들과 OpenAI 및 Anthropic의 폐쇄형(locked-down) 모델 모두에 대한 대안으로서, 어떤 기업이든 무료로 다운로드하여 자체 서버에서 실행할 수 있는 자체 AI 시스템을 출시하고 있습니다. Reflection AI는 미국 내 대안을 원하는 기업들을 위한 미국산 오픈 소스(open-source) 모델을 구축하기 위해 수십억 달러의 기업 가치로 자금을 조달했습니다. 두 기업 모두 자본력이 충분하며, 미국 기업들이 이미 신뢰하고 있는 인프라에 배포되면서 프런티어(frontier) 모델보다 저렴하고 성능이 뛰어난 모델을 제공한다는 동일한 틈새시장을 명확히 겨냥하고 있습니다.
이러한 변화에 반대하는 논거는 국가 안보에 기반해 왔습니다. 하지만 실질적인 측면에서 그 반대 의견은 소멸하고 있습니다. DeepSeek 모델이 보안과 성능 면에서 미국 모델에 뒤처진다고 지적했던 미국 정부의 AI 안전 연구소(AI Safety Institute)조차, 2025년 1월 R1 출시 이후 다운로드 수가 거의 1,000% 증가했다고 기록했습니다.
Anthropic 스스로도 이러한 압박을 인정하고 있습니다. 지난 5월 발표된 정책 보고서에서 이 회사는 미국 모델이 중국 모델보다 단지 "몇 달 앞서 있을 뿐"이라고 밝혔으며, 베이징이 "비용 측면에서 글로벌 채택(global adoption) 경쟁을 주도하고 있다"고 경고했습니다.
OpenAI는 이를 다르게 보고 있습니다. 회사의 내부 생각을 잘 아는 한 관계자는 지난달 GPT-5.5를 포함하여 새로운 프런티어 모델이 출시될 때마다 API 및 제품 사용량이 급증했으며, 기업 수요가 그들이 묘사한 대로 "수직 벽(vertical wall)"처럼 성장하고 있다고 말했습니다. 이 관계자는 오픈 소스가 낮은 위험도의 작업(low-stakes tasks)에서는 역할을 수행하지만, 회사의 핵심 비즈니스를 잠식하고 있지는 않다고 덧붙였습니다. 가격 압박은 회사의 10대 주요 관심사 목록에 포함되지도 않습니다.
하지만 고객 관계 보호를 위해 익명을 요구한 한 기업용 AI CEO는 다른 해석을 내놓았습니다. 성장은 실재하지만, "만약 이 기술(저렴한 모델 기술)이 사용되지 않았다면 프런티어 모델의 성장은 훨씬 더 빨랐을 것"이라고 말했습니다.
이것이 바로 OpenAI와 Anthropic이 공모 투자자들에게 가치를 평가해 달라고 요청할 것으로 예상되는 시장입니다. 각각 거의 1조 달러에 달하는 기업 가치(Valuation)를 인정받기 위해서는, S-1(상장 신고서)을 통해 해당 배수(Multiple)를 정당화할 수 있는 기업용 매출 성장과 집중도를 보여주어야 합니다. 하지만 그 가치를 정당화하는 프리미엄은, 바로 이 연구소(Labs)들이 지배해야만 하는 핵심 세그먼트에서 가장 빠르게 침식되고 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 CNBC Technology의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기