본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 17. 13:36

CoreWeave, DeepSeek-V3를 2분 만에 학습시키며 MLPerf v6.0 기록 경신

요약

CoreWeave가 11,000개 이상의 NVIDIA H100 GPU를 활용해 DeepSeek-V3를 MLPerf v6.0 기준 약 2분 만에 학습시키며 AWS의 기록을 경신했습니다. 이는 대규모 GPU 클러스터의 효율적인 오케스트레이션 능력을 입증한 사례입니다.

핵심 포인트

  • DeepSeek-V3 학습 시간 약 2분 달성 (AWS 대비 43% 단축)
  • 11,000개 이상의 NVIDIA H100 GPU 및 4개 데이터 센터 활용
  • Nvidia Vera Rubin NVL72를 검증한 최초의 클라우드 제공업체
  • 독자적인 오케스트레이션 레이어를 통한 컴퓨팅 자원 동적 할당

CoreWeave는 4개의 데이터 센터에서 11,000개 이상의 H100 GPU를 사용하여 MLPerf v6.0에서 DeepSeek-V3를 약 2분 만에 학습시켰으며, 이는 AWS의 기록을 43% 앞지른 것입니다.

CoreWeave는 4개의 데이터 센터에서 11,000개 이상의 NVIDIA H100 GPU를 사용하여 MLPerf Training v6.0에서 DeepSeek-V3를 약 2분 만에 학습시켰습니다. Business Wire에 따르면, 이 결과는 MLPerf v5.1에서 AWS가 세운 기존 기록인 3.5분을 경신했습니다.

주요 사실 (Key facts)

  • DeepSeek-V3가 MLPerf v6.0에서 약 2분 만에 학습됨.
  • 4개의 데이터 센터에서 11,000개 이상의 NVIDIA H100 GPU가 사용됨.
  • 이전 기록인 3.5분(AWS, MLPerf v5.1)을 경신함.
  • Nvidia Vera Rubin NVL72를 검증한 최초의 클라우드 제공업체.
  • CoreWeave는 텍사스에 1.2 GW 규모의 데이터 센터 캠퍼스를 구축 중임.

CoreWeave는 4개의 데이터 센터에서 11,000개 이상의 NVIDIA H100 GPU를 사용하여 MLPerf Training v6.0에서 DeepSeek-V3를 약 2분 만에 학습시켰습니다. Business Wire에 따르면, 이 결과는 MLPerf v5.1에서 AWS가 세운 기존 기록인 3.5분을 경신했습니다. CoreWeave는 이번 달 초 발표된 이정표로서, 랙 규모(rack scale)에서 Nvidia Vera Rubin NVL72를 검증하고 배포한 최초의 클라우드 제공업체입니다.

해당 기업은 MLPerf 실행을 위한 정확한 GPU 수량이나 총 학습 비용을 공개하지 않았습니다. MLPerf Training v6.0에는 대규모 언어 모델 (LLM) 및 멀티모달 (multimodal) 시스템을 위한 새로운 벤치마크가 포함되어 있습니다. CoreWeave의 제출물은 네트워크 전반에 걸쳐 컴퓨팅 자원을 동적으로 할당하는 독자적인 오케스트레이션 (orchestration) 레이어를 사용했습니다.

이것이 보도자료가 시사하는 것보다 더 중요한 이유

CoreWeave의 2분 기록은 단순한 속도 기록이 아닙니다. 이는 AI 학습 경제학의 구조적 변화를 의미합니다. 대규모 환경에서는 여러 사이트에 걸쳐 수천 개의 GPU를 포화(saturate)시킬 수 있을 때 학습 실행당 한계 비용이 급격히 감소합니다. 이는 AWS, Google Cloud, Azure와 같은 하이퍼스케일러 (hyperscalers)들이 지연 시간(latency)과 비용 효율성 모두를 맞춰야 한다는 압박을 가합니다. CoreWeave의 강점은 범용 클라우드 서비스가 아닌, GPU 워크로드에 특화되어 설계된 인프라에서 나옵니다. 또한 해당 기업은 공개된 서류에 따라 최근 텍사스에 1.2 GW 규모의 데이터 센터 캠퍼스를 구축하기로 약속했습니다.

DeepSeek-V3 모델 자체도 주목할 만합니다. 원본 논문에 따르면, 이 모델은 GPT-4 학습 비용의 약 1/10 수준으로 프런티어 (frontier) 성능을 달성했습니다. CoreWeave의 결과는 이 모델이 상당한 오버헤드(overhead) 없이 분산된 멀티 데이터 센터 설정에서 학습될 수 있음을 입증하며, 이는 프로덕션 환경에서 오픈 웨이트 (open-weight) 모델의 유효성을 증명하는 지점입니다.

주목해야 할 사항

CoreWeave의 2026년 3분기 매출 공개와 MLPerf 실행의 실제 GPU 시간당 비용을 공개할지 여부를 지켜보십시오. 올해 말 예정된 기업의 IPO(기업공개) 신청 서류를 통해 단위 경제성(unit economics)이 드러날 것입니다. 또한 AWS나 Google Cloud가 MLPerf v6.1에서 2분 미만의 기록으로 대응하는지도 추적해야 합니다.

출처: news.google.com

원문은 gentic.news에서 처음 게시되었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0