Training Cluster as a Service - NVIDIA 와의 새로운 협력
요약
Hugging Face와 NVIDIA가 'Training Cluster as a Service'라는 새로운 협력을 통해 전 세계 연구자 및 기업들에게 대규모 GPU 클러스터 접근성을 제공합니다. 이 서비스는 사용자가 필요한 훈련 실행 기간에만 비용을 지불할 수 있는 유연성을 제공하며, NVIDIA DGX Cloud의 최신 아속 컴퓨팅 용량과 Hugging Face의 방대한 개발 리소스를 결합한 완전한 솔루션입니다. 이를 통해 연구자들은 희귀 질환 연구부터 화학 모델링까지 다양한 분야에서 최고 수준의 AI 모델을 구축할 수 있게 되어, 고성능 컴퓨팅 자원에 대한 접근 장벽이 크게 낮아집니다.
핵심 포인트
- Hugging Face와 NVIDIA가 'Training Cluster as a Service'를 출시하여 대규모 GPU 클러스터 접근성을 제공합니다.
- 사용자는 필요한 훈련 실행 기간에만 비용을 지불하는 유연한 모델을 활용할 수 있습니다.
- 서비스는 NVIDIA DGX Cloud의 최신 아속 컴퓨팅(Hopper, GB200 등)과 Hugging Face의 개발 생태계를 통합합니다.
- 연구자들은 이 서비스를 통해 희귀 질환 연구, 화학/재료 과학 모델링 등 다양한 전문 분야에서 AI 훈련을 수행할 수 있습니다.
다음 세대 AI 모델을 훈련하기 위한 기가와트급 GPU 슈퍼클러스터 프로젝트들이 건설되고 있습니다. 이는 "GPU 가난한"과 "GPU 부유한" 사이의 컴퓨팅 격차가 빠르게 벌어지고 있다는 것처럼 보일 수 있습니다. 하지만 하이퍼스케일러, 지역 및 AI 네이티브 클라우드 제공자는 모두 용량을 빠르게 확장하고 있으므로 GPU 는 여전히 존재합니다.
그렇다면 우리는 어떻게 AI 컴퓨팅 용량에 필요한 연구자들과 연결할까요? 전 세계의 대학, 국가 연구소 및 기업들이 자신들의 모델을 구축할 수 있도록 어떻게 할까요?
Hugging Face 와 NVIDIA 는 Training Cluster as a Service 를 통해 GPU 클러스터 접근성을 제공하며, 훈련 실행 기간에만 비용을 지불할 유연성을 제공합니다.
시작하려면 Hugging Face 의 250,000 개 조직 중 어느 것이나 필요할 때 필요한 GPU 클러스터 크기를 요청할 수 있습니다.
시작하려면 hf.co/training-cluster 에서 조직을 위해 GPU 클러스터를 요청할 수 있습니다.
Training Cluster as a Service 는 NVIDIA 와 Hugging Face 의 핵심 구성 요소를 통합하여 완전한 솔루션을 제공합니다:
- NVIDIA Cloud Partners 는 NVIDIA DGX Cloud 에 중앙 집중화 된 지역 데이터센터에서 최신 NVIDIA 가속 컴퓨팅 (예: NVIDIA Hopper, NVIDIA GB200) 용량을 제공합니다.
- NVIDIA DGX Cloud Lepton - Paris GTC 에서 오늘 발표됨 - 연구자에게 제공된 인프라에 대한 쉬운 접근을 제공하고 훈련 실행 스케줄링 및 모니터링을 가능하게 합니다.
- Hugging Face 개발자 리소스와 오픈 소스 라이브러리는 훈련 실행 시작을 쉽게 만듭니다.
GPU 클러스터 요청이 승인되면, Hugging Face 와 NVIDIA 는 조직의 크기, 지역 및 기간 요구 사항에 따라 GPU 클러스터를 소싱하고 가격 책정하며 provision 하고 설정합니다.
Telethon Institute of Genomics and Medicine - TIGEM (약칭) 은 희귀 유전 질환의 분자 기작을 이해하고 새로운 치료법을 개발하는 데 헌신한 연구 센터입니다. 새로운 AI 모델을 훈련하는 것은 병변 변이의 효과를 예측하고 약물 재포지셔닝을 위한 새로운 경로입니다.
AI 는 희귀 유전 질환의 원인을 연구하고 치료법을 개발하는 새로운 방법을 제공하지만, 우리 분야는 새로운 모델을 훈련해야 합니다. Training Cluster as a Service 는 필요한 GPU 용량을 올바른 시간에 구매할 수 있도록 쉽게 만들었습니다.
-- Diego di Bernardo, TIGEM 의 Genomic Medicine 프로그램 조정자
Numina 는 수학 추론을 위한 오픈 소스, 오픈 데이터셋 AI 를 구축하는 비영리 조직이며 2024 년 AIMO 진보 상을 수상했습니다.
우리는 Deepmind 의 AlphaProof 와 같은 최고의 폐쇄형 모델에 대한 오픈 대안을 구축하는 목표에서 잘 진행되고 있습니다. 컴퓨팅 리소스가 우리의 현재 병목 현상입니다 - Training Cluster as a Service 를 통해 우리는 목표를 달성할 수 있을 것입니다!
-- Yann Fleureau, Project Numina 공동 창립자
Mirror Physics 는 화학 및 재료 과학을 위한 프론티어 AI 시스템을 구축하는 스타트업입니다.
MACE 팀과 함께 우리는 화학을 위한 AI 의 한계를 극복하기 위해 노력하고 있습니다. Training Cluster as a Service 를 통해 우리는 전례 없는 규모로 고도화된 화학 모델을 생산하고 있습니다. 이는 이 분야를 위한 중요한 진전일 것입니다.
-- Sam Walton Norwood, Mirror 의 CEO 및 창립자
Training Cluster as a Service 는 Hugging Face 와 NVIDIA 의 새로운 협력으로 전 세계 AI 연구자에게 더 쉽게 AI 컴퓨팅을 제공합니다.
대규모 고성능 컴퓨팅에 대한 접근성은 모든 도메인과 언어에서 차세대 AI 모델을 구축하는 데 필수적입니다. Training Cluster as a Service 는 연구원과 기업들에게 장벽을 제거하여 가장 고급 모델의 훈련 능력을 해제하고 AI 의 가능성의 한계를 확장할 수 있는 힘을 발휘하게 합니다.
-- Clément Delangue, Hugging Face 공동 창업자 및 CEO
NVIDIA DGX Cloud Lepton 을 Hugging Face 의 Training Cluster as a Service 와 통합하면 개발자와 연구원은 광범위한 클라우드 제공업체 네트워크에 걸쳐 고성능 NVIDIA GPU 에 원활하게 접근할 수 있는 방법을 제공합니다. 이 협력은 AI 연구원과 조직이 Hugging Face 에서 익숙한 도구를 사용하여 AI 훈련 작업 부하를 확장하는 것을 더 쉽게 만듭니다.
-- Alexis Bjorlin, NVIDIA DGX Cloud 부사장
우리는 NVIDIA 와 협력하여 Hugging Face 조직에 Training Cluster as a Service 를 제공하는 데 매우 기쁩니다. 오늘 바로 hf.co/training-cluster 에서 시작할 수 있습니다.
오늘 GTC Paris 에서 NVIDIA 는 에이전트부터 로봇까지의 Hugging Face 사용자들을 위한 많은 새로운 기여를 발표했습니다!
- NVIDIA DGX Cloud Lepton 은 유럽의 개발자들을 전 세계 NVIDIA 컴퓨팅 생태계와 연결합니다.
- NVIDIA AI 고객은 이제 NIM 과 함께 10 만 개 이상의 Hugging Face 모델을 배포할 수 있습니다.
- Hugging Face 사용자들은 NVIDIA Cosmos Predict-2 를 사용하여 커스텀 Physical AI 모델을 구축할 수 있습니다.
- NVIDIA Isaac GR00T N1.5 는 Hugging Face 에 착륙하여 인간형 로봇을 구동합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Hugging Face Blog의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기