본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 27. 03:10

Nvidia가 창립자와 핵심 IP를 가져간 후, Groq는 추론(Inference)을 위해 6억 5천만 달러를 조달했다

요약

Groq가 AI 추론 클라우드 확장을 위해 6억 5천만 달러 규모의 자금을 조달했습니다. 이는 Nvidia와의 대규모 거래 이후 이루어진 행보로, AI 산업의 중심이 모델 학습에서 추론 인프라로 이동하고 있음을 보여줍니다.

핵심 포인트

  • Groq, 6억 5천만 달러 규모의 신규 투자 유치 성공
  • AI 산업의 핵심 동력이 학습(Training)에서 추론(Inference)으로 전환
  • LPU 기술 기반의 전문 추론 클라우드 '네오클라우드' 전략 추진
  • 추론 인프라 시장의 핵심 경쟁력은 지연 시간과 토큰당 비용

요약 (TL;DR)

  • Groq는 AI 추론 (Inference) 클라우드를 확장하기 위해 2026년 6월 22일, Disruptive과 헤지펀드 Infinitum의 주도로 기존 투자자들의 재투자를 포함하여 6억 5,000만 달러를 조달했습니다 (Groq newsroom).
  • 이는 Nvidia가 Groq의 LPU 기술 라이선스를 확보하고 창립자이자 CEO인 Jonathan Ross를 포함한 고위직 인력을 영입한 2025년 12월의 200억 달러 규모 거래가 있은 지 약 6개월 만에 이루어진 것입니다 (TechCrunch).
  • Groq는 현재 4개 지역에 걸쳐 13개의 데이터 센터를 운영하고 있으며, 500만 명 이상의 개발자와 주간

이번 발표에서는 새로운 기업 가치(Valuation)를 명시하지 않았습니다. 참고로, 이전 보도에 따르면 Groq는 2025년 9월 7억 5천만 달러를 조달하며 69억 달러의 기업 가치를 인정받았는데, 이는 2024년 8월의 28억 달러 가치보다 약 두 배 높은 수치입니다. 따라서 이번 헤드라인 수치(6억 5천만 달러)는 사실 이전 라운드보다 작으며, 이는 이번 자금 조달이 과열된 열풍(Hype)이 아닌 운영(Operations)을 위한 것이라는 첫 번째 암시입니다.

진짜 이야기: 이제 보상은 추론(Inference)에 있다

지난 3년 동안 AI 인프라의 서사는 모델을 구축하는 거대 클러스터인 _학습(Training)_에 집중되어 있었습니다. Groq의 이번 자금 조달은 지속 가능한 자금이 모델이 존재하게 된 후 하루에 수십억 번씩 모델을 실행하는 비용인 _추론(Inference)_으로 이동하고 있다는 또 하나의 데이터 포인트입니다. Infinitum의 John Yetimoglu는 이 논지를 직설적으로 표현했습니다: "우리는 추론이 기술 분야에서 가장 큰 인프라 시장이 될 것이라고 믿습니다" (Groq 뉴스룸).

이것이 중요한 이유는 추론의 경제학이 학습의 경제학과 정반대이기 때문입니다. 학습은 자본 투입 이벤트(Capital event)인 반면, 추론은 결코 멈추지 않는 공공요금(Utility bill)과 같습니다. 모든 챗봇의 답변, 모든 에이전트의 단계, 모든 검색 호출(Retrieval call)은 추론 비용이며, 제품이 데모 단계에서 프로덕션(Production) 단계로 넘어감에 따라 이 항목이 AI 기능의 수익성을 결정짓는 요소가 됩니다. 우리는 OpenAI의 손실이 거의 8배 증가함에서 이 잔혹한 버전을 다룬 바 있습니다. 모델을 서비스하는 데 드는 비용이 현재 업계의 핵심 이야기입니다.

실체: "네오클라우드(Neocloud)"가 실제로 판매하는 것

Groq는 모든 분야에서 AWS와 경쟁하기보다는 한 가지 일(빠르고 저렴한 토큰 생성)에 특화된 전문 클라우드인 추론 "네오클라우드(Neocloud)"로 포지셔닝하고 있습니다. 이들의 제안은 학습의 병렬 연산(Parallel math)이 아닌 추론의 순차 연산(Sequential math)을 위해 특별히 설계된 칩인 LPU에 기반합니다. 주장하는 장점은 가공되지 않은 모델의 품질이 아니라, 지연 시간(Latency)과 토큰당 비용입니다.

Groq가 규모의 증거로 제시하는 수치는 다음과 같습니다: 플랫폼 내 500만 명 이상의 개발자, 그리고 매주 처리되는 "수조 개의 토큰"입니다 (Groq newsroom). 이는 사용량 수치일 뿐 매출은 아니며, 회의적인 시각으로 읽을 가치가 있습니다. 어떤 무료 추론 (Inference) 티어에서든 개발자 가입자의 상당수는 유료 사용량으로 전환되지 않기 때문입니다. 하지만 2027년 말까지 200메가와트(MW)를 달성하겠다는 목표는 실제로 의도를 나타내는 수치입니다. 대규모 추론 (Inference)의 제약 조건은 칩이 아니라 전력이며, 200MW를 약속하는 것은 실제 물리적인 구축에 대한 약속입니다.

승자와 패자

  • 승자, 추론 (Inference) 구매자. 자금을 확보한 독립적인 추론 (Inference) 클라우드는 제공업체를 선택하는 모든 팀에게 좋은 소식입니다. 하이퍼스케일러(Hyperscalers) 상의 Nvidia에 대한 더 신뢰할 수 있는 경쟁자가 나타난다는 것은 토큰 가격에 대한 압박을 의미합니다.
  • 승자, 묘하게도 Nvidia. Nvidia는 지난 12월 200억 달러에 Groq의 IP와 인재를 확보했으며, GTC에서 Groq의 추론 (Inference) 기술을 통합한 LPX 플랫폼을 발표했습니다 (보도에 따르면). 이제 독립적인 Groq는 그 계보를 대규모로 전개할 것입니다. 당신이 Nvidia에서 구매하든 Groq에서 구매하든 Nvidia는 이득을 봅니다.
  • 패자, 순수 학습용 칩 (Training-chip) 내러티브. 자본이 추론 (Inference)에 투표한다는 것은 다음 학습 클러스터 (Training-cluster) 스타트업에는 투표하지 않는다는 것을 의미합니다.
  • 불확실, Groq 자체의 마진. 네오클라우드 (Neocloud)를 운영하는 것은 소프트웨어보다는 유틸리티에 가까운, 저마진의 자본 집약적인 인프라 비즈니스입니다. 200MW를 지원하기 위해 6억 5천만 달러를 조달하는 것은 이 경로가 얼마나 비용이 많이 드는지를 보여주는 신호입니다.

대부분의 보도가 놓친 명확하지 않은 관점

여기가 자금 조달 헤드라인이 건너뛰는 부분입니다. Groq는 적어도 부분적으로는 Nvidia에 라이선스를 부여했던 것과 동일한 기술을 바탕으로 추론 (Inference) 클라우드로 재편하고 있으며, Groq의 추론 (Inference) IP가 통합된 Nvidia의 새로운 LPX 시스템을 자체 데이터 센터 내에 배치하고 있습니다 (보도에 따르면). 다시 말해, 이 회사는 자신의 핵심 자산(Crown jewels)을 최대 경쟁사에 판매한 다음, 그 동일한 자산의 제품화된 버전을 기반으로 운영되는 클라우드를 운영하기 위해 자금을 조달한 것입니다.

이는 영리하면서도 동시에 취약한 전략입니다. 영리한 이유는 Groq가 Nvidia와의 칩 설계 군비 경쟁에서 계속 승리할 필요 없이, 200억 달러 규모의 일회성 라이선스 수익을 운영 비즈니스로 전환했기 때문입니다. 취약한 이유는 하드웨어 로드맵의 일부를 최대 경쟁사에 의존하게 된 네오클라우드(neocloud)가 자신을 특별하게 만들었던 유일한 요소인 독자적인 실리콘(proprietary silicon)을 포기했기 때문입니다. 새로운 투자자들이 거는 베팅은 "Groq가 최고의 칩을 만든다"가 아닙니다. 그들의 베팅은 "추론 (inference) 수요가 너무 커서, 창립자가 없고 Nvidia에 부분적으로 의존하는 Groq라 할지라도 충분히 괜찮은 비즈니스다"라는 것입니다. 이는 회사가 아닌 _시장(market)_에 대한 베팅이며, 추론 시장이 얼마나 거대해졌는지를 정확히 보여줍니다.

이것이 당신에게 의미하는 바

  • AI 기능을 출시하는 경우: 추론을 기본 설정이 아닌 소싱 (sourcing) 결정으로 취급하십시오. Groq와 같이 자본을 확보한 독립 기업은 기존 업체들과의 가격 협상에서 레버리지 (leverage)가 될 수 있습니다. 확정하기 전에 실제 워크로드에서 토큰당 비용 (cost-per-token)과 지연 시간 (latency)을 벤치마크 (benchmark) 하십시오.
  • AI 예산을 계획하는 경우: 추론을 고정된 구축 비용이 아니라 사용량에 따라 증가하는 반복적인 유틸리티 (utility)로 모델링하십시오. AI 마진 (margin) 측에서 승리하는 기업들은 토큰 지출을 초기부터 주요 항목으로 취급한 기업들입니다.
  • 이 분야를 지켜보는 투자자 또는 운영자인 경우: 추적해야 할 지표는 칩이 아니라 전력입니다. 누가 실제로 메가와트 (MW) 단위의 전력을 확보하는지(Groq의 경우 2027년까지 200 MW)를 지켜보십시오. 벤치마크 슬라이드가 아니라 바로 그것이 실제 추론 공급을 제한하는 요소이기 때문입니다.

자주 묻는 질문 (FAQ)

Groq는 얼마를 조달했으며 누가 라운드를 주도했나요?

Groq의 뉴스룸에 따르면, Groq는 2026년 6월 22일에 6억 5천만 달러를 조달했다고 발표했으며, Disruptive와 헤지펀드인 Infinitum이 주도하였고 기존 투자자들이 재투자했습니다.

Groq의 기업 가치는 얼마였나요?

이번 라운드의 기업 가치는 공개되지 않았습니다. 이전 보도에 따르면, Groq는 2024년 8월 28억 달러에서 상승하여 2025년 9월 7억 5천만 달러 규모의 라운드에서 69억 달러의 기업 가치를 기록한 바 있습니다.

Nvidia가 이미 Groq를 인수하지 않았나요?

인수 형태는 아니었습니다. 보도에 따르면, 2025년 12월 Nvidia는 Groq의 LPU 기술을 라이선스하고 창립자인 Jonathan Ross를 포함한 시니어 인력을 채용하기 위해 약 200억 달러 규모의 계약을 체결했습니다. Nvidia는 Groq를 인수하지 않았다고 밝혔습니다. Groq는 독립적인 기업으로 남아 있으며, 이후 새로운 리더십을 영입했습니다.

추론(Inference) "네오클라우드(neocloud)"란 무엇인가요?

AI 모델의 학습(Training)이 아닌 실행(Running)에 특화된 클라우드로, 저지연(Low-latency) 및 저비용 토큰 생성에 최적화되어 있습니다. Groq는 범용 클라우드로서 경쟁하기보다는 자사의 LPU 기반 추론(Inference)에 대한 접근 권한을 판매합니다.

출처

관련 읽을거리

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0