AI 데이터센터의 미래: XPO와 CPO를 통한 초고밀도 광학 기술
요약
본 글은 AI 데이터센터가 요구하는 극도의 네트워크 밀도를 달성하기 위한 최신 광학 솔루션인 XPO와 CPO를 비교 분석합니다. 현재의 OSFP 모듈로는 204.8 Tb/sec 스위치 ASIC을 구현하려면 과도한 랙 공간(4U)이 필요하지만, XPO는 동일 면적에서 레인 밀도를 4배, 대역폭은 8배 증가시켜 효율성을 극대화합니다. 또한, 엔비디아(Nvidia)가 차세대 GPU에 적용할 CPO 기술과 비교하며, XPO가 CPO로 전환하지 않고도 고밀도와 낮은 지연 시간 목표를 달성하는 현실적인 대안임을 강조합니다.
핵심 포인트
- AI 데이터센터는 OSFP 모듈의 한계를 넘어선 초고밀도 광학 솔루션을 필요로 하며, XPO(eXtended Pluggable Optics)가 이를 해결할 핵심 기술입니다.
- XPO는 기존 OSFP 대비 동일 공간에서 레인 밀도를 4배, 대역폭을 8배 증가시키며, 열 방출은 최대 10배까지 높아져 액체 냉각(Liquid Cooling)이 필수적입니다.
- 엔비디아는 차세대 GPU('Feynman', 2028년 예상)와 NVSwitch에 CPO (Co-packaged Optics)를 적용할 계획을 밝히며, 이는 데이터센터 광학 기술의 다음 큰 흐름임을 시사합니다.
- XPO 모듈은 특정 광학 표준이나 기술에 구애받지 않고 다양한 옵틱스를 지원하며, CPO로 전환하지 않고도 고밀도 향상을 달성하는 경제적이고 실용적인 대안을 제시합니다.
AI 데이터센터의 폭발적인 성장은 네트워크 인프라에 전례 없는 밀도와 성능 요구를 제기하고 있습니다. 현재까지 20년간 지배해 온 SFP, QSFP, OSFP 같은 플러그형 광학 모듈로는 더 이상 AI 시스템이 필요로 하는 초고밀도의 네트워킹을 감당하기 어렵다는 것이 업계의 공통된 인식입니다.
1. 고밀도 요구와 기존 기술의 한계:
AI 데이터센터는 'Scale Up' 및 'Scale Out' 영역에서 엄청난 대역폭이 필요합니다. OSFP 모듈은 2016년 Arista Networks가 주도한 표준으로, 과거 플러그형 광학 분야에서 가장 성공적인 표준 중 하나였습니다. 하지만 이 OSFP 형태는 현대 AI 시스템에 필요한 높은 레딕스(radix)를 구현하기에는 물리적으로 너무 크다는 한계에 직면했습니다.
2. XPO: 고밀도 솔루션의 등장:
이러한 문제를 해결하는 대안으로 **XPO (eXtended Pluggable Optics)**가 주목받고 있습니다. XPO는 기존 OSFP 모듈이 차지하던 공간과 동일한 면적에 64채널을 200 Gb/sec로 집적할 수 있어, 레인 밀도를 4배 증가시키고 대역폭은 8배 향상시키는 혁신적인 구조를 가집니다. 특히 XPO는 기존의 패들 카드(paddle cards) 디자인과 같은 공간에 구현이 가능하여 설계 변경 부담을 최소화했습니다.
다만, 이러한 고밀도 집적은 필연적으로 열 밀도(Heat Density) 증가를 수반합니다. XPO 모듈은 최대 400W까지의 발열을 발생시키므로, 안정적인 운영을 위해서는 액체 냉각 (Liquid Cooling) 시스템이 필수적입니다. 이는 현재 GPU와 XPU가 연결되는 랙스케일 시스템(rackscale systems)에서 이미 일반화되고 있는 추세입니다.
3. CPO의 부상과 XPO의 역할:
한편, 데이터센터 광학 기술의 궁극적인 목표는 **CPO (Co-packaged Optics)**로 향하고 있습니다. 엔비디아(Nvidia)는 자사의 차세대 GPU인 'Feynman' (2028년 예상)와 NVSwitch에 CPO를 적용할 계획임을 공개하며 시장의 기대를 모으고 있습니다. 실제로 Nvidia는 Lumentum 및 Coherent 등 주요 광학 제조사에 수십억 달러 규모의 투자를 진행하며 CPO 생태계를 구축하고 있습니다.
하지만 XPO가 제시하는 강점은 단순히 밀도 향상에 그치지 않습니다. XPO는 특정 옵틱스 표준이나 기술, 드라이버 등에 구애받지 않고 다양한 광학 솔루션을 지원할 수 있다는 유연성을 가집니다. 즉, CPO로의 전환이 경제적으로 최적화되지 않았더라도, XPO를 통해 충분한 밀도 향상과 성능 개선을 달성하며 시장에 현실적인 대안을 제공합니다.
결론적으로, AI 데이터센터는 궁극적으로 낮은 지연 시간(latency)과 높은 성능을 위해 컴포넌트를 최대한 가깝게 배치해야 하며, XPO와 같은 고밀도 플러그형 광학 솔루션은 CPO로의 완전한 전환에 앞서 시장이 요구하는 당장의 대역폭 및 밀도 문제를 해결할 가장 실용적이고 강력한 기술임을 알 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 The Next Platform의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기