Nvidia, 비즈니스 데이터 예측을 위해 Kumo AI를 4억 달러에 인수

요약

Nvidia가 관계형 데이터 예측 파운데이션 모델을 구축하는 스타트업 Kumo AI를 4억 달러 이상에 인수했습니다. 이번 인수를 통해 Nvidia는 LLM이 다루기 어려운 관계형 데이터베이스 기반의 예측 기능을 강화하고 소프트웨어 생태계를 확장할 계획입니다.

핵심 포인트

Nvidia, 4억 달러 규모로 Kumo AI 인수
관계형 그래프 트랜스포머 기반의 KumoRFM 기술 확보
LLM의 한계를 넘어 관계형 데이터 예측 기능 강화
칩 제조를 넘어 소프트웨어 및 데이터 시맨틱스 영역 확장

Nvidia는 LLM (Large Language Models)이 남긴 공백을 메우기 위해, 기업의 관계형 데이터 (relational data)에 파운데이션 모델 (foundation model) 예측 기능을 도입하고자 Kumo AI를 4억 달러 이상에 인수했습니다.

The Information에 따르면, Nvidia는 4억 달러 이상의 금액으로 Kumo AI를 인수했습니다. 이번 거래는 LLM이 남긴 공백, 즉 문서와 코드뿐만 아니라 관계형 데이터베이스 (relational database) 데이터로부터 예측을 수행하는 기능을 목표로 합니다.

주요 사실

거래 가치는 4억 달러 이상.
Kumo는 Sequoia Capital 등을 통해 3,700만 달러를 조달함.
KumoRFM은 RelBench 벤치마크에서 그래디언트 부스팅 트리 (gradient-boosted trees)보다 뛰어난 성능을 보임.
미세 조정 (Fine-tuning)을 통해 결과가 10%에서 30% 향상됨.
고객사에는 DoorDash, Reddit, Snowflake 등이 포함됨.

Fortune의 6월 3일 보도에 따르면, Nvidia는 비즈니스 데이터로부터 예측을 수행하기 위한 파운데이션 모델을 구축하는 4년 차 스타트업인 Kumo AI를 인수했습니다. The Information은 이번 거래 규모를 4억 달러 이상으로 추정했습니다. Kumo의 세 명의 공동 창업자인 CEO Vanja Josifovski, 엔지니어링 책임자 Hema Raghavan, 그리고 Stanford 대학교 교수인 Jure Leskovec은 지난 5월 Nvidia로 자리를 옮겼으나, 양사 모두 해당 거래를 공식적으로 발표하지는 않았습니다.

Kumo 기술이 중요한 이유

Kumo의 핵심 모델인 KumoRFM은 사전 학습된 관계형 그래프 트랜스포머 (relational graph transformer)입니다. 이 모델은 데이터베이스를 그래프로 표현하며, 여기서 모든 레코드는 노드 (node)가 되고 기본 키(primary key)-외래 키(foreign key) 연결은 엣지 (edge)가 됩니다. 이 모델은 수천 개의 실제 및 합성 관계형 데이터셋으로 사전 학습되었기 때문에, 특정 작업에 대한 별도의 학습 없이도 한 번도 본 적 없는 데이터베이스에 대해 예측을 수행할 수 있습니다. 사용자는 가벼운 쿼리 언어 (query language)를 통해 '향후 30일 이내에 어떤 고객이 이탈할 것인가'와 같은 예측 항목을 정의합니다.

7개 도메인에 걸쳐 30개의 예측 작업(predictive tasks)을 아우르는 RelBench 벤치마크에서, Kumo는 제로샷 모델(zero-shot model)이 수작업으로 만든 피처(hand-crafted features)로 구축된 그래디언트 부스팅 트리(gradient-boosted trees)보다 성능이 뛰어나며, 미세 조정(fine-tuning)을 통해 결과가 10%에서 30% 더 향상된다고 보고했습니다. Sequoia Capital을 포함한 투자자들로부터 3,700만 달러를 지원받은 이 스타트업은 지난 4월 2세대 모델을 출시했으며, DoorDash, Reddit, Snowflake 등을 고객사로 보유하고 있습니다.

전략적 함의 (Strategic Implications)

이번 인수는 익숙한 패턴을 따릅니다. Nvidia는 GPU 오케스트레이션(orchestration)을 소유하기 위해 Run:ai를 약 7억 달러에 인수했고, 데이터 시맨틱스(data semantics) 스타트업인 Illumex를 인수했으며, 저지연 추론(low-latency inference)을 위해 Groq와 계약을 체결했습니다. 각 거래는 Nvidia가 칩 판매에서 벗어나, 기업들이 해당 칩 위에서 실행하는 소프트웨어를 소유하는 방향으로 나아가게 합니다. Kumo는 이러한 움직임을 예측 분석(predictive analytics) 분야로 확장하며, 이 시장은 현재 그래디언트 부스팅 도구, AutoML 벤더, 그리고 AWS, Google Cloud, Microsoft의 머신러닝(machine learning) 서비스들이 점유하고 있습니다.

또한 이번 거래는 Snowflake와 Databricks에게 난처한 역학 관계를 형성합니다. 이들은 자사의 플랫폼을 기업 데이터 기반 머신러닝의 자연스러운 거점으로 포지셔닝하고 있으나, 이제 가속 컴퓨팅(accelerated computing)을 위해 의존하고 있는 기업 내부에 저명한 예측 AI 벤더가 들어서게 되었기 때문입니다.

향후 과제 (The Challenges Ahead)

KumoRFM의 정확성에 대한 증거는 거의 전적으로 Kumo 자체의 벤치마크에서 나옵니다. 독립적인 검증이 매우 중요할 것입니다. 또한, 관계형 데이터(relational data)에 대한 예측 AI의 기업 도입은 역사적으로 느린 편이었으며, 대부분의 기업은 여전히 ML 파이프라인(ML pipelines)보다는 SQL 기반 분석에 의존하고 있습니다. Nvidia는 대규모 도입을 추진하기 위해 Kumo를 NeMo 또는 CUDA를 통해 기존 소프트웨어 스택(software stack)에 통합해야 할 것입니다.

관전 포인트 (What to watch)

Nvidia가 2026년 4분기까지 KumoRFM을 NeMo 또는 CUDA에 통합하는지, 그리고 Snowflake나 Databricks가 자체적인 예측 AI 인수나 파트너십을 통해 대응하는지를 주목해야 합니다.

출처: forbes.com

원래 게재일: gentic.news

AI 자동 생성 콘텐츠

원문 바로가기