
Astera Labs, 데이터 센터의 벤더 중립적 확장을 위한 320레인 PCIe 6.0 스위치 공개 — PCIe만으로 최대 80개의 가속기
요약
Astera Labs가 Computex 2026에서 320레인 PCIe 6.0 스위치인 Scorpio X-Series를 공개했습니다. 이 제품은 단일 스위치로 최대 80개의 가속기를 연결할 수 있어 대규모 멀티 GPU 클러스터 구축에 최적화되어 있습니다.
핵심 포인트
- 320레인 PCIe 6.0 지원 및 20 Tbps 스위칭 대역폭 제공
- 단일 스위치로 최대 80개의 가속기 연결 가능
- 스위치 홉을 줄여 클러스터 효율성 및 확장성 증대
- Nvidia, AMD 등 벤더에 종속되지 않는 개방형 인프라 지원

Astera Labs는 타이베이에서 열린 Computex 2026에서 최근 선보인 Scorpio X-Series 320레인 스마트 패브릭 스위치 (Smart Fabric Switch)를 시연했습니다. 이 제품은 업계 최대 규모의 개방형 메모리 시맨틱 패브릭 스위치 (open memory-semantic fabric switch)로 보입니다. 320개의 레인을 갖춘 이 PCIe 6.0 스위치는 대규모 멀티 GPU 스케일업 클러스터 (multi-GPU scale-up clusters), 대규모 공유 KV-캐시 메모리 풀 (shared KV-cache memory pools), 그리고 커스텀 토폴로지 (custom topologies)를 사용한 분리형 데이터 센터 인프라 (disaggregate data center infrastructure)를 구축하는 데 사용될 수 있습니다.



이 스위치는 이전 세대 장치의 144레인 및 9 Tbps에서 향상된 320개의 PCIe 6.0 레인과 20 Tbps의 스위칭 대역폭 (switching bandwidth)을 제공합니다. Astera Labs는 늘어난 레인 수가 더 큰 스케일업 도메인 (scale-up domains)을 가능하게 하여, 단일 스위치를 사용하여 최대 80개의 가속기 (accelerators)를 연결할 수 있다고 밝혔습니다. 이와 대조적으로, 기존의 144레인 스위치는 스위치당 최대 32개의 가속기를 지원했습니다. 64개 이상의 가속기를 사용하는 클러스터의 경우, 이 회사는 새 장치가 스위치 홉 (switch hops)을 최대 3개에서 1개로 줄이고 스위치 수를 4~6배 감소시키는 동시에, Nvidia의 NVL72 시스템이 제공하는 것과 유사한 올투올 연결성 (all-to-all connectivity)을 제공한다고 설명했습니다 (비록 대역폭은 더 낮고 지연 시간은 더 높지만). 이 스위치는 표준 PCIe 연결을 사용하는 한 표준 및 커스텀 가속기를 모두 지원할 수 있습니다.

전시회 현장에서 Astera Labs는 Intel의 Arc B70 Pro 그래픽 카드를 사용하여 자사의 스위칭 역량을 선보이고 있습니다. 하지만 Scorpio X-Series 320레인 PCIe 스위치를 기반으로 한 실제 배포 환경에서는 더 발전된 Intel 하드웨어를 사용할 가능성이 높습니다. 일반적으로 이 스위치는 AMD의 Instinct MI350P 및 Nvidia의 RTX 6000 Blackwell을 포함하여, 자체적인 NVLink 또는 UALink와 유사한 상호 연결을 지원하지 않는 모든 유형의 가속기로 클러스터를 구축하는 데 사용될 수 있습니다. Astera는 Scorpio X-Series 320레인 PCIe 스위치를 8주 전에 팹(fab)으로부터 막 전달받았기 때문에, 아직 80개의 가속기를 갖춘 완전한 작동 클러스터를 선보이지는 못했습니다. 또한, 80개의 유사한 가속기를 확보하는 것도 쉬운 일이 아닙니다. 그럼에도 불구하고, 회사의 시연을 바탕으로 볼 때 이 스위치는 정상적으로 작동하는 것으로 보입니다.

Scorpio X-Series의 핵심 기능은 Hypercast로, 이는 AI 모델에서 흔히 발생하는 통신 집약적인 연산을 가속화하기 위해 설계된 하드웨어 기반 데이터 복제 엔진(data replication engine)입니다. Astera Labs에 따르면, MoE(Mixture of Experts) 네트워크는 수백 명의 전문가(experts)를 통해 토큰을 라우팅하는 경향이 있으며, 가속기 간에 대량의 멀티캐스트(multicast) 트래픽을 생성합니다. Astera Labs는 이러한 경우 전통적인 스위칭 아키텍처는 데이터 전송을 반복하거나 멀티캐스트 그룹 재설정(multicast-group reconfiguration) 속도가 느려지는 문제가 발생하는 반면, Hypercast는 이러한 통신 패턴을 하드웨어에서 직접 처리하도록 설계되어 GPU 네트워킹 오버헤드를 줄이고 가속기 효율성을 향상시킨다고 주장합니다.

또한 이 회사는 AllReduce, ReduceScatter, AllGather, AllScatter 및 all-to-all 교환과 같은 집합 연산(collective operations)을 오프로드(offload)하는 인-네트워크 컴퓨트(In-Network Compute) 엔진을 추가했습니다. Astera에 따르면 이러한 기능은 특정 워크로드에서 통신 지연 시간(communication latency)을 50% 이상 줄일 수 있습니다.
Scorpio X-Series 320레인 PCIe 스위치의 또 다른 중요한 특징은 메모리 시맨틱 연결성(memory-semantic connectivity)입니다. 이를 통해 연결된 프로세서는 소프트웨어 제어 트랜잭션(software-controlled transactions) 대신 네이티브 로드 및 스토어 연산(native load and store operations)을 사용하여 패브릭 부착 리소스(fabric-attached resources)에 접근할 수 있습니다. 이는 장치 사용을 크게 단순화하며, 오버헤드를 줄이고 대규모 환경에서의 패브릭 효율성을 개선함으로써 실제 성능을 향상시킵니다.

Astera는 Scorpio X-Series 320레인 PCIe 스위치의 양산 확대(production ramp)가 2026년 하반기로 예정되어 있다고 밝혔습니다. 현재 이 회사는 선도적인 하이퍼스케일러(hyperscalers)들을 대상으로 해당 스위치의 샘플을 제공하고 있습니다.
Anton Shilov는 Tom’s Hardware의 기고가입니다. 지난 수십 년 동안 그는 CPU와 GPU부터 슈퍼컴퓨터, 현대적인 공정 기술과 최신 팹(fab) 도구, 그리고 첨단 기술 산업 트렌드에 이르기까지 모든 분야을 다뤄왔습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Tom's Hardware의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기