AMD의 Helios MI455X AI 플랫폼 공개, 초기 시스템은 UALink-over-Ethernet 상호 연결 방식 사용 — AMD의

요약

AMD가 Computex 2026에서 차세대 Helios 랙 스케일 AI 플랫폼을 공개했습니다. Instinct MI455X 가속기와 EPYC Venice CPU를 탑재하며, 초기 모델은 배포 가속을 위해 UALink-over-Ethernet 방식을 채택합니다.

핵심 포인트

Instinct MI455X 탑재로 대규모 HBM4 메모리 용량 확보
Nvidia NVL72 VR200과 경쟁하는 랙 스케일 솔루션
초기 버전은 기존 생태계 활용을 위해 Ethernet 기반 UALink 사용
메모리 집약적 LLM 워크로드에서 강점 기대

타이완 타이베이에서 열리는 Computex 2026에서 여러 AMD 파트너들이 AMD의 EPYC 'Venice' 프로세서와 Instinct MI455X AI 가속기를 탑재한 회사의 차세대 Helios 랙 스케일 (rack-scale) 솔루션을 선보이고 있습니다. 이 장치들은 올해 말 출시될 예정입니다. 하지만 한 가지 주요한 주의 사항이 있습니다. 이들은 모두 UALink-over-Ethernet 스케일업 (scale-up) 연결 방식을 사용하며, 이는 연결 성능에 의존하는 특정 워크로드에서 성능을 제한할 수 있습니다. 그럼에도 불구하고, '진정한' UALink 상호 연결을 갖춘 Helios 시스템도 출시될 예정입니다.

AMD의 Helios는 회사의 첫 번째 랙 스케일 (rack-scale) AI 시스템이며, 차세대 Vera Rubin 플랫폼을 기반으로 하는 Nvidia의 NVL72 VR200 머신과 경쟁할 예정입니다. Helios는 최대 256코어를 갖춘 AMD의 6세대 EPYC Venice CPU에 의존하며, 총 31TB의 HBM4 메모리와 1400TB/s의 대역폭을 갖춘 72개의 Instinct MI455X 가속기를 탑재합니다. AMD는 성능이 약 2900 FP4 dense PFLOPS 정도가 될 것으로 추정하고 있는데, 이는 연산 성능 측면에서는 Nvidia의 VR200 NVL72 시스템보다 뒤처지지만, HBM4 메모리 용량 측면에서는 앞서는 수치입니다. 이는 대규모 LLM을 실행할 때와 같이 메모리 집약적인 워크로드에서 Helios 기반 시스템에 이점을 제공할 것을 약속합니다.

AI 가속기들은 서로 상호 연결되어 있으며 UALink-over-Ethernet 연결을 사용하여, 최대 260TB/s의 집계된 스케일업 (scale-up) 대역폭을 제공합니다 (Nvidia의 NVL72 VR200과 유사한 수준). Helios는 또한 Pensando Vulcano 네트워크 인터페이스 카드 (NIC)를 특징으로 하며, 이는 Ultra Ethernet 사양을 준수하고 최대 43TB/s의 스케일아웃 (scale-out) 대역폭을 제공하는 업계 최초의 800 GbE 네트워크 카드 중 하나입니다.

하지만 이러한 Helios 시스템에 사용되는 상호 연결 방식은 다양할 것입니다. 이 머신은 UALink와 UALink-over-Ethernet을 모두 지원하지만, 초기 버전은 전자가 아닌 후자를 사용할 것입니다. 이는 아마도 UALink 스위치가 아직 확정되지 않았으며, AMD의 AI 고객들에 의한 검증 및 자격 인증(validation and qualification)을 기다리고 있기 때문일 가능성이 높습니다.

Ethernet 기반의 UALink를 사용하는 가장 큰 장점은 AMD가 이미 검증되고 자격 인증(validation and qualification)을 마친, 널리 지원되는 기존 생태계의 부품들을 사용하여 Helios를 구축할 수 있다는 점입니다. Ethernet 스위칭 ASIC, 케이블 및 기타 구성 요소들은 이미 전 세계의 하이퍼스케일러(hyperscalers)와 클라우드 제공업체들이 사용하고 있으며, 이는 배포를 가속화합니다.

하지만 UALink 프로토콜을 상위에 얹더라도 Ethernet을 사용하는 데에는 주요한 단점이 있습니다. Ethernet은 원래 범용 네트워킹 기술로 설계되었으며, AI 가속기를 스케일 업(scale up)하도록 설계된 적이 없습니다.

그 결과, 통신 과정에서 전용 스케일 업 패브릭(scale-up fabric)보다 더 높은 지연 시간(latency), 더 많은 프로토콜 오버헤드(protocol overhead), 그리고 덜 결정론적인 성능(less deterministic performance)이 발생할 수 있습니다. 72개의 Instinct MI455X 가속기가 모두 협력하여 작동해야 하는 대규모 AI 학습 작업의 경우, 통신 효율성은 연산 성능만큼이나 중요합니다. 만약 Ethernet 기반의 UALink 상호 연결 방식이 GPU에 데이터를 효율적으로 공급하지 못한다면, 서류상으로는 UALink-over-Ethernet 기반의 Helios가 스케일 업 대역폭 측면에서 Nvidia의 NVL72 VR200만큼 우수할지라도, 실제 배포 환경에서는 하드웨어의 이론적 성능 중 일부가 손실될 수 있습니다.

이는 UALink가 Helios와 함께 널리 사용될 것인지, 그리고 UALink가 구리(copper)를 사용하여 널리 배포될 것인지에 대한 의문을 제기합니다. 하이엔드 AI 하드웨어를 대규모로 배포하는 하이퍼스케일러 및 기타 기업들은 하드웨어를 업그레이드하는 경우가 드뭅니다.

Instinct MI455X가 올해 최고의 하드웨어 가속기 중 하나가 될 것임을 분명히 약속하지만, Helios는 Nvidia의 NVL72 VR200하고만 경쟁하게 될 가능성이 높습니다. AMD가 Instinct MI500 시리즈 제품을 출시하는 내년이 되면 Helios는 구식이 될 것입니다. 이 유닛들은 더 많은 AI GPU를 탑재할 것으로 약속되는 AMD의 차세대 랙 스케일(rack-scale) 제품군에 사용될 것이며, 잠재적으로 UALink를 상위에 얹은 광학 상호 연결(optical interconnects)을 필요로 할 것입니다. 결과적으로, 구리 기반의 진정한 UALink 상호 연결을 갖춘 Helios 시스템은 차세대 랙 스케일 솔루션이 시장에 출시되기 전까지 1년도 채 되지 않는 기간 동안만 시장에 머물게 될 것입니다.

물론 AMD가 Instinct MI500 시리즈 가속기(accelerators)와 구리(copper) 기반의 UALink 상호 연결(interconnects)을 탑재한 Helios를 제공하는 것을 막을 수 있는 것은 없습니다. 하지만 회사는 그러한 시스템의 존재 여부를 확인하지 않았습니다.

Anton Shilov는 Tom’s Hardware의 기고가입니다. 지난 수십 년 동안 그는 CPU와 GPU부터 슈퍼컴퓨터, 그리고 현대적인 공정 기술(process technologies)과 최신 팹 도구(fab tools)에서 첨단 기술 산업 트렌드에 이르기까지 모든 분야을 다뤄왔습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AMD의 Helios MI455X AI 플랫폼 공개, 초기 시스템은 UALink-over-Ethernet 상호 연결 방식 사용 — AMD의

요약

핵심 포인트

댓글