마이그레이션 비용 (The Migration Cost)
요약
AI 스택에서 모델과 칩은 범용화 및 다양화되는 반면, 데이터 인프라는 높은 마이그레이션 비용을 통해 강력한 고착성을 확보합니다. Snowflake와 Databricks의 사례를 통해 데이터 플랫폼이 어떻게 구조적 전환 비용을 바탕으로 시장 지배력을 유지하는지 분석합니다.
핵심 포인트
- 모델과 칩은 범용화되지만 데이터 계층은 통합되는 추세임
- 데이터 마이그레이션은 막대한 비용과 리스크를 동반함
- 데이터 플랫폼은 높은 전환 비용을 통해 가격 결정력을 확보함
- Snowflake와 Databricks는 데이터 인프라의 강력한 시장성을 증명함
데이터 플랫폼은 구조적인 전환 비용 (switching costs)을 통해 AI의 가장 지속적인 마진을 확보합니다. 모델은 범용화 (commoditize)됩니다. 칩은 다양화됩니다. 데이터 인프라는 통합됩니다 — 왜냐하면 페타바이트 단위의 데이터를 마이그레이션하는 비용이 이를 구축하는 비용보다 더 많이 들기 때문입니다.
Snowflake는 분기 매출 13억 9천만 달러를 기록한 후 5월 28일에 37% 급등했습니다. 이는 33% 증가한 수치로 시장 예상치를 5% 상회한 결과입니다. 이 회사는 연간 가이던스를 58억 4천만 달러로 상향 조정했으며, Amazon과 60억 달러 규모의 인프라 계약을 체결했습니다. 같은 날, Databricks는 연간 매출 54억 달러를 바탕으로 1,340억 달러의 비상장 기업 가치를 기록하며, 역사상 최대 규모의 엔터프라이즈 소프트웨어 IPO가 될 수도 있는 준비를 하고 있습니다.
두 개의 데이터 플랫폼 기업. 유사한 매출. 하나는 상장사, 하나는 비상장사. 둘 다 승리하고 있습니다. 우리가 살펴볼 가치가 있는 신호는 어느 회사가 더 나은가가 아니라, 범용화 (commoditization)로 정의되는 시대에 왜 이 계층 (layer) 자체가 지속적인 가격 결정력 (pricing power)을 갖느냐는 것입니다.
통합되는 계층 (The Layer That Consolidates)
AI 스택에는 세 가지 주요 계층이 있으며, 그중 두 계층은 파편화되고 있습니다. 모델은 범용화되고 있습니다 — Claude, GPT, 그리고 Gemini는 주요 벤치마크에서 서로 몇 점 차이 이내의 점수를 기록하며, Snowflake 자체도 이제 여러 모델 제공업체와 이중 계약을 체결합니다. 칩은 다양화되고 있습니다 — Google의 TPU, Amazon의 Trainium, 그리고 Meta의 MTIA는 모두 NVIDIA 실리콘에 대한 의존도를 낮추고 있습니다. 하지만 데이터 인프라는 반대 방향으로 움직입니다. 모든 AI 애플리케이션은 어떤 모델이나 칩에서 실행되느냐에 관계없이 데이터 준비 (data preparation), 학습 파이프라인 (training pipelines), 그리고 피처 스토어 (feature stores)를 필요로 합니다. 데이터 계층은 기질에 구애받지 않으며 (substrate-agnostic), 따라서 기질에 대해 지속성 (substrate-durable)을 갖습니다.
이는 새로운 패턴이 아닙니다. AWS는 최고의 가상 머신 (Virtual Machines)을 구축함으로써가 아니라, 자사의 생태계로부터 벗어나는 마이그레이션 (Migration) 비용을 터무니없이 높게 만듦으로써 클라우드 가치를 확보했습니다. 데이터 플랫폼 계층은 한 단계 더 높은 수준에서 동일한 전략을 실행하고 있으며, 훨씬 더 강력한 고착화 (Stickiness) 메커니즘을 사용하고 있습니다. 고객을 묶어두는 것은 단지 컴퓨팅 (Compute)과 스토리지 (Storage)뿐만이 아니라, 쿼리 (Queries), 파이프라인 (Pipelines), 그리고 팀의 전문 지식에 내재된 축적된 조직적 지식입니다.
전환 비용은 구조적이다
데이터 플랫폼 전환의 경제학은 가혹하며 이미 잘 문서화되어 있습니다. GetYourGuide가 Snowflake에서 Databricks로 마이그레이션했을 때, 이 프로젝트는 2만 개 이상의 쿼리를 검증하고, 750개의 테이블을 마이그레이션하며, 두 명의 전임 엔지니어와 외부 파트너를 투입해야 했습니다. 엔터프라이즈 데이터 플랫폼 마이그레이션은 복잡성에 따라 8주에서 50주가 소요됩니다. 데이터 마이그레이션 프로젝트의 83%는 예산을 초과하거나 완전히 실패합니다. 대부분의 클라우드 마이그레이션 비용 추정치는 40%에서 60% 정도 과소평가되어 있습니다. 기업들은 모델링 단계에서 전혀 고려되지 않았던 데이터 송출 (Egress) 비용, 재교육 비용, 그리고 병행 운영 (Parallel-run) 비용을 뒤늦게 발견하게 됩니다.
총 전환 비용은 원래 구현 비용의 1배에서 2배에 달합니다. 구현 서비스 비용만으로도 첫해 라이선스 수수료의 20%에서 100%를 소비합니다. 데이터 마이그레이션은 전체 프로젝트 비용의 15%에서 30%를 추가합니다. 여기에 팀 재교육 비용이 더해집니다. 그 결과 기업들은 단순한 계산에 직면하게 됩니다: 플랫폼을 전환하는 비용이 처음부터 해당 플랫폼 위에서 구축했을 때의 비용에 근접하거나 이를 초과하게 됩니다.
이것은 계약상의 락인 (lock-in)이 아닙니다. 어떤 벤더도 5년의 약정을 요구하지 않습니다. 락인은 구조적입니다. 즉, 페타바이트(petabytes) 단위의 데이터, 수천 개의 검증된 쿼리(queries), 그리고 해당 플랫폼이 어떻게 작동하는지에 대한 조직적 지식(institutional knowledge) 속에 내재되어 있습니다. 기업의 89%가 멀티 클라우드 (multi-cloud) 전략을 취하고 있다고 주장합니다. 45%는 벤더 락인 (vendor lock-in)이 대안 도입을 적극적으로 저해했다고 말합니다. IT 리더의 94%가 락인에 대한 우려를 표명합니다. 데이터는 기업들이 멀티 클라우드를 원하지만, 이를 실행하지 못하고 있음을 보여줍니다.
순 유지율 (Net Retention)이 말해주는 사실
순 매출 유지율 (Net revenue retention) — 기존 고객이 올해 지출하는 금액이 작년 매출에서 차지하는 비율 — 은 전환 비용 (switching cost)의 깊이를 측정하는 가장 명확한 지표입니다. Databricks는 140% 이상의 순 유지율을 보고합니다. Snowflake는 126%를 보고합니다. 두 수치 모두 고착도가 높은 기업용 소프트웨어의 기준점인 약 110%를 훨씬 상회합니다.
높은 유지율은 두 가지를 동시에 의미합니다. 첫째, 고객이 떠나지 않는다는 것입니다. 둘째, 고객이 이미 사용 중인 플랫폼에 매년 더 많은 비용을 지출한다는 것입니다. 두 효과 모두 동일한 메커니즘에 의해 발생합니다. 조직이 특정 플랫폼 위에 더 많은 데이터와 파이프라인 (pipelines)을 구축할수록, 플랫폼을 떠나는 비용은 더 비싸지며, 인프라를 다른 곳에 복제하기보다는 사용량을 확장하는 것이 더 자연스러워집니다. 데이터 중력 (Data gravity) — 데이터를 이동시키는 것이 컴퓨팅 (compute)을 이동시키는 것보다 비용이 더 많이 들기 때문에 애플리케이션과 서비스가 대규모 데이터 저장소 주변으로 모이는 경향 — 은 조달 팀이 선택권 (optionality)을 위해 협상할 때조차 워크로드 (workloads)를 통합된 상태로 유지하게 만듭니다.
경쟁 환경이 레이어 가설 (Layer Thesis)을 확인시켜 준다
이번 실적 사이클(earnings cycle)에서 가장 시사하는 바가 큰 발견은 Databricks나 Snowflake 중 어느 한 쪽이 승리했다는 것이 아닙니다. 바로 두 기업 모두 승리했다는 점입니다. Snowflake의 33% 매출 성장은 2024년 주가가 반토막 났던 성장 둔화 공포 이후, 회사 역사상 가장 강력한 전분기 대비 달러 성장(sequential dollar growth)을 나타냅니다. Databricks는 유사한 규모에서 65% 성장했습니다. SQL 및 비즈니스 인텔리전스 (BI) 워크로드 (workloads)에서 Snowflake는 1530% 더 빠르게 작동합니다. ETL 및 머신러닝 (machine learning) 워크로드에서 Databricks는 2040% 더 저렴하게 운영됩니다.
그들은 기능(features) 면에서 치열하게 경쟁합니다. 하지만 기업에 데이터 플랫폼이 필요한지 여부를 두고 경쟁하지는 않습니다. 레이어 (layer) 자체는 논쟁의 대상이 아니며, 오직 그 안에서의 시장 점유율만이 경쟁 대상입니다. 이것이 지속 가능한 인프라 레이어 (infrastructure layer)의 결정적인 특징입니다. 즉, 경쟁은 개별 참여자를 위협하기보다는 해당 카테고리를 검증합니다. 클라우드 컴퓨팅 (cloud computing)과의 평행 이론은 직접적입니다. AWS, Azure, Google Cloud는 치열하게 경쟁하면서도, 집합적으로 시장을 0에 가까운 수준에서 5,000억 달러 이상으로 성장시켰습니다.
S-1이 촉매제 역할을 한다
Databricks는 아직 S-1 등록 서류를 제출하지 않았습니다. CEO Ali Ghodsi는 회사가 긍정적인 잉여현금흐름 (free cash flow)과 공개 시장 기준을 충족하는 운영 지표를 갖추고 있어 IPO (기업공개) 준비가 되었다고 시사했습니다. 대부분의 분석가들은 2026년 3분기에 S-1을 제출하고, 2026년 말 또는 2027년 초에 상장할 것으로 예상합니다. 1,340억 달러의 비상장 가치는 IPO 시 시가총액 목표가 1,500억 달러에서 1,800억 달러 사이임을 암시합니다.
S-1 서류는 AI 시대 데이터 플랫폼 경제학의 대규모 규모를 보여주는 첫 번째 공개 공시가 될 것입니다. 이 서류는 고객 집중도, AI 특화 매출 내역 — 현재 AI 제품으로부터 발생하는 연간 매출은 약 14억 달러로 추정되며, 이는 전체의 약 26%에 해당함 — 그리고 추론 (Inference) 및 학습 (Training) 워크로드를 서비스하는 데 드는 단위 경제성 (Unit economics)을 드러낼 것입니다. 약 50억 달러의 유사한 연간 매출을 기준으로 할 때, Databricks는 Snowflake 가치 배수 (Valuation multiple)의 약 두 배에 달하는 평가를 받고 있습니다. 이러한 프리미엄은 성장률과 AI 포지셔닝 덕분으로 분석됩니다. S-1 서류는 해당 프리미엄이 경제적 논리에 의해 정당화되는지, 아니면 내러티브 (Narrative)에 의해 유지되는지를 시험하게 될 것입니다.
하락장 시나리오 (Bear case) 또한 실재합니다. Snowflake의 성장 재가속은 성장 격차를 좁히고 있습니다. Google BigQuery와 Amazon Redshift는 기존 클라우드 사용자들을 대상으로 더 낮은 가격대에 경쟁하고 있습니다. 60억 달러 규모의 Snowflake-AWS 계약은 클라우드 제공업체가 데이터 플랫폼을 대체하는 대신 파트너가 될 수 있음을 보여주지만, 동시에 클라우드 계층이 그 상위의 데이터 계층으로부터 인프라 임대료 (Infrastructure rent)를 추출하고 있음을 보여주기도 합니다.
반증 가능한 주장 (Falsifiable claim): 만약 Databricks의 성장률이 S-1 제출 시점까지 전년 대비 40% 미만으로 둔화된다면, 밸류에이션 프리미엄은 증발할 것입니다. 만약 AI 특화 매출이 15억 달러 근처에서 정체된다면, 데이터 플랫폼이 불균형적으로 높은 AI 가치를 포착한다는 가설은 약화될 것입니다. 만약 하이퍼스케일러 (Hyperscaler)가 출시한 경쟁 데이터 플랫폼이 18개월 이내에 120% 이상의 순 유지율 (Net retention)을 달성한다면, 구조적 전환 비용 (Switching cost) 가설은 주장된 것보다 약한 것이 됩니다.
하지만 기본 시나리오 (Base case)는 명확합니다. 모델이 범용화 (Commoditize)되고 칩이 다양화되는 AI 스택 내에서 데이터 플랫폼 계층은 공고해집니다. 왜냐하면 2만 개의 쿼리를 마이그레이션하고, 데이터 팀을 재교육하며, 2년 치의 파이프라인 로직을 재검증하는 비용은 무어의 법칙 (Moore's Law)에 따라 감소하는 전환 비용이 아니기 때문입니다. 이는 계산적 (Computational)인 문제가 아니라 조직적인 (Organizational) 문제입니다. 그리고 조직적 전환 비용은 시간이 흐름에 따라 감소하는 것이 아니라 사용량과 함께 복리로 증가합니다.
The Synthesis에서 처음 게시됨 — 지능의 전환을 내부에서 관찰하며.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기