SemiAnalysis 인터뷰: Radiant의 AI 인프라 책임자 Patrick Wohlschlegel
요약
Radiant의 인프라 책임자 Patrick Wohlschlegel이 Brookfield와의 합병을 통해 AI 데이터 센터 구축의 핵심 병목인 토지, 전력, 자본 문제를 해결한 전략을 공유합니다. 특히 400kW급 초고전력 GPU 랙 도입에 대비한 인프라 설계와 신속한 데이터 센터 배포 로드맵을 다룹니다.
핵심 포인트
- Brookfield 합병을 통해 토지·전력·자본 확보 문제 해결
- 12개월 이내에 데이터 센터를 완공하는 초고속 배포 역량 확보
- 2027년까지 단일 랙 전력 400kW 시대에 대비한 인프라 설계 필요성
- NVIDIA Rubin 아키텍처 기반의 글로벌 컴퓨팅 파워 확장 계획
https://www.youtube.com/watch?v=SQtavfviwrs&t=1s
SemiAnalysis가 공개한 이 GTC 2026 인터뷰 영상에서, 진행자 Jordan Nanos는 Radiant사의 인프라 책임자(Head of Infrastructure)인 Patrick Wohlschlegel을 대상으로 심도 있는 인터뷰를 진행했습니다. 두 사람은 Radiant사의 전략적 포지셔닝, 기가와트(Gigawatt)급 AI 컴퓨팅 파워 센터의 설계, 그리고 최대 400kW에 달하는 GPU 집약적 랙(Rack)이 가져올 인프라 과제에 대응하는 방법을 주제로 상세한 논의를 펼쳤습니다.
다음은 인터뷰 내용의 완전하고 상세한 정리입니다:
1. Radiant사 배경 및 개인 소개
- Patrick과 Radiant에 대하여: Patrick은 약 15년의 슈퍼 컴퓨팅 (Hyper Computing) 경험을 보유하고 있으며, 2년 전 Radiant에 합류했습니다. Radiant는 인터뷰 약 2주 전 공식 발표된 새로운 유형의 "네오클라우드 (Neocloud)" 벤처 기업입니다. 그는 회사에서 인프라 책임자를 맡아 인프라 로드맵, 조달, 컴퓨팅 파워 배포 및 운영 관리를 주로 담당하고 있습니다.
[00:00:09]
2. Radiant의 글로벌 로드맵 및 핵심 축
- 4대 핵심 축: Radiant의 비즈니스는 주로 네 가지 핵심 요소로 구축됩니다: **소프트웨어 플랫폼, 컴퓨팅 파워 인프라, 토지 자원, 그리고 실행 자본 (Execution Capital)**입니다.
[00:01:11] - 글로벌 확장 계획: Radiant는 최신 NVIDIA 아키텍처(미래의 Rubin 아키텍처 포함)를 통해 전 세계 여러 사이트에 컴퓨팅 파워 센터를 채울 계획이며, 이 사이트들은 총 **수백 메가와트 (several hundreds of megawatts)**의 잠재적 전력 용량을 나타냅니다. GTC 현장에서 그들은 이러한 클러스터를 조합하여 배포하기 위해 다양한 부대 설비(예: CDU 냉각 분배 유닛 등)의 산업 발전을 면밀히 주시하고 있습니다.
[00:01:11]
3. 업계 핵심 병목 현상 돌파: Brookfield와의 합병
- 전통적 컴퓨팅 파워의 제약: 과거 업계의 가장 핵심적인 제한 사항은 토지 확보, 전력 확보, 그리고 충분한 자본 지원이었습니다.
[00:02:21] - 12개월 내 신속한 인도: Brookfield AI 펀드에 합류하고 Brookfield와 합병함으로써, Radiant는 위의 문제들을 완전히 해결했습니다. 그들은 이미 계획 허가를 받은 "그린필드 (Greenfield)" 사이트를 직접 확보할 수 있으며, Brookfield가 소유한 발전소를 직접 활용하여 전력 공급을 보장할 수 있습니다. 이를 통해 그들은 기록적인 12개월 이내에 "황무지 (dirt)"에서 "완전 가동되는 AI 데이터 센터 환경"으로의 초고속 배포를 실현할 수 있습니다.
[00:02:51] - 초고전력 랙의 도전 과제: Brookfield 산하의 데이터 센터 및 관련 기업들과의 심도 있는 협력을 통해, 그들은 향후 24~36개월 동안의 용량을 준비하고 있습니다. Patrick은 특히 이르면 2027년 1월에 업계가 단일 랙 전력이 최대 400kW에 달하는 GPU 랙을 맞이하게 될 것이라고 언급하며, 데이터 센터가 이러한 초고밀도 인프라를 수용할 수 있도록 지금부터 협력하여 설계해야 한다고 강조했습니다.
[00:03:54]
4. 전력 전략: "비하인드 더 미터 (Behind-the-meter)" 발전 및 그리드 연결
- 발전 선호도: "그리드 연결 (Grid Connected)"과 "비하인드 더 미터 발전 (Behind-the-meter Power Generation)"의 차이점을 논의할 때, Patrick은 전통적인 그리드에 직접 연결하는 프로세스는 대개 느리다고 지적했습니다. 반면 Brookfield가 가져다주는 핵심 이점은 바로 비하인드 더 미터 직접 발전 능력을 제공할 수 있다는 점이며, 이는 그들의 인프라 구축 속도를 크게 가속화합니다.
[00:05:00]
5. 풀스택 소프트웨어 및 멀티 테넌트 유연성
- 팀과 Radiant Cloud OS: Radiant는 방대한 소프트웨어 엔지니어링 팀을 보유하고 있습니다. 이들의 하위 계층 플랫폼은 Radiant Cloud OS로 불리며, 베어메탈 (Bare Metal) 인프라를 사용 가능한 컴퓨팅 자원으로 변환하여 베어메탈 서비스, 가상 머신 (VM), 또는 Kubernetes 환경을 지원하는 역할을 담당합니다. 상위 계층 팀은 데이터 과학, 모델 레지스트리 (Model Registry), 추론 (Inference) 서비스와 같은 애플리케이션을 담당합니다.
[00:05:50] - 극한의 탄력적 재사용: 수많은 팀을 보유한 대형 단일 고객을 서비스하든, 여러 퍼블릭 클라우드 모델을 사용하는 소규모 기업 고객을 서비스하든, Radiant의 소프트웨어 스택은 매우 높은 스케줄링 유연성을 갖추고 있습니다. 예를 들어, 한 기업 고객이 특정 기간 동안 대규모 **분산 학습 (Distributed Training)**을 실행해야 할 경우, 소프트웨어는 이를 대규모 클러스터의 배치 노드(Slurm 베어메탈 환경)로 원클릭 구성합니다. 몇 주 또는 몇 달 후 고객이 추론 (Inference) 비즈니스로 전환해야 할 경우, 시스템은 이를 빠르게 해체하고 재구성하여 다양한 탄력적 컴퓨팅 수요를 매우 높은 효율로 충족할 수 있습니다.
[00:07:04]
6. 수직적 통합을 통한 고가용성 및 SLA
- 수직적 통합 관측: 대규모 AI 시스템은 구축 비용이 매우 비싸며, 다운타임으로 인한 손실은 가늠하기 어렵습니다. Radiant는 소프트웨어와 하드웨어, 전력, 그리고 데이터 센터를 모두 '한 지붕 아래'로 수직 통합했기 때문에, Radiant Cloud OS 소프트웨어에는 강력한 관측성 (Observability), 로그 분석 및 경고 플러그인이 내장되어 있습니다.
[00:08:31] - 높은 SLA 약속 실현: 이 시스템은 서버, 스위치, 랙, 나아가 데이터 센터 환경 전체의 모든 하위 데이터를 통합적으로 포착하여 실행 가능한 경고로 변환할 수 있습니다. 이를 통해 기업용 고객에게 매우 높은 수준의 유지보수성 및 가용성 서비스 수준 협약 (SLA)을 제공할 수 있습니다. `[00:09:10]"}
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기