AI 데이터 센터 네트워크 진화 과정에서의 구리(Copper)와 CPO(Co-Packaged Optics)의 경쟁
요약
AI 데이터 센터 네트워크의 진화 과정에서 구리(Copper)의 물리적 한계와 이를 극복하기 위한 CPO(Co-Packaged Optics) 기술의 필요성을 분석합니다. 데이터 센터의 3대 네트워크 계층별 요구사항과 기존 플러거블 광모듈의 전력 소모 및 지연 시간 문제를 심도 있게 다룹니다.
핵심 포인트
- 구리 전송은 200Gbps 이상에서 2미터 이내로 거리 제한 발생
- AI 네트워크는 프론트엔드, 스케일업, 스케일아웃의 3단계 계층으로 구성
- 스케일업 네트워크는 스케일아웃보다 10배 높은 대역폭 요구
- 기존 광모듈의 주요 전력 소모 및 지연 원인은 레이저가 아닌 DSP
- 차세대 기술로서 CPO(Co-Packaged Optics)의 중요성 부각
이 영상은 유명 반도체 분석 기관인 SemiAnalysis에서 발표한 것으로, AI 데이터 센터 네트워크 진화 과정에서의 구리(Copper)와 CPO(Co-Packaged Optics, 판재 공봉장 광학) 간의 경쟁과 미래에 대해 매우 심도 있고 상세하게 분석했습니다.
영상의 핵심 논리는 다음과 같은 몇 가지 주요 섹션으로 나눌 수 있습니다:
1. 배경: 구리의 물리적 한계와 3대 네트워크 계층
1. 구리의 물리적 한계
영상 도입부에서는 반도체가 항상 구리(예: 칩 금속층, 메인보드 배선, NVL72 랙의 백플레인 버스)에 의존해 왔음을 강조합니다. 하지만 단일 채널 전송 속도가 200 Gbits/second (경로당) 이상에 도달하면, 구리의 전송 거리 한계는 2미터 이내로 엄격히 제한됩니다 oxed{00:55}. 이 거리를 초과하면 현대 AI 서버의 방대한 대역폭 요구사항은 광섬유와 레이저에 의존할 수밖에 없습니다 oxed{01:01}.
2. AI 데이터 센터의 3대 네트워크 계층 oxed{01:43}
- 프론트엔드 네트워크 (Front-end Network): 기초적인 데이터 로딩, SSH 접속 및 사용자 요청을 담당하며, 대역폭 요구사항이 가장 낮습니다 oxed{01:51}.
- 스케일업 네트워크 (Scale-up Network): 단일 랙 내의 모든 컴퓨팅 및 네트워크 트레이를 연결합니다 (예: NVIDIA의 NVLink). 이를 통해 여러 개의 GPU가 매우 높은 대역폭과 매우 낮은 지연 시간으로 마치 '단일 GPU'처럼 협업할 수 있게 합니다 oxed{02:07}. 이 네트워크의 대역폭 요구사항은 Scale-out의 10배에 달합니다 oxed{03:47}.
- 스케일아웃 네트워크 (Scale-out Network): 랙과 랙 사이, 또는 데이터 센터 전체 범위의 서버 간 상호 연결을 담당합니다 oxed{03:00}. 이 네트워크의 대역폭 요구사항은 프론트엔드 네트워크의 8~10배입니다 oxed{03:47}.
2. 전통적인 플러거블 광모듈 (Pluggable Transceivers)의 치명적인 문제점
랙 간 연결이 필요한 Scale-out 네트워크에서 현재 업계 표준은 플러거블 광모듈(예: OSFP, QSFP-DD)입니다 oxed{04:29}.
영상은 광모듈의 4가지 구성 요소를 분석했습니다: 물리 인터페이스, DSP (Digital Signal Processor, 디지털 신호 처리기), TOSA (Transmitter Optical Sub-Assembly, 레이저 송신 컴포넌트), ROSA (Receiver Optical Sub-Assembly, 광 수신 컴포넌트) oxed{05:03}.
영상은 직관을 뒤엎는 사실을 제시합니다: 전력 소모와 지연 시간의 주범은 레이저가 아니라(레이저는 전력의 15%만 차지), 바로 DSP입니다. oxed{06:06}
- 전력 소모: DSP는 광모듈 전력의 60% 이상을 소비합니다 oxed{06:21}.
- 지연 시간: 신호가 전기에서 광으로 변환될 때 일반적으로 150~200나노초(ns)의 지연이 발생하는데, 이 중 90% 이상이 DSP에 의해 발생합니다 oxed{06:28}.
왜 반드시 DSP가 필요할까요?
GPU나 스위치에서 생성된 전기 신호가 칩 패키징(Chip Packaging)과 메인보드 배선을 거쳐 랙(Rack) 가장자리에 있는 광모듈(약 30cm 거리)에 도달할 때, 신호는 이미 심각하게 감쇠(Attenuation)되고 왜곡(Distortion)됩니다. 따라서 반드시 DSP를 통해 증폭 및 "세척(Cleaning)" 과정을 거쳐야 합니다 [07:17]. 반면 CPO의 핵심적인 존재 의의는 광학 엔진(Optical Engine)을 소스(Source)에 무한히 가깝게 배치하여 DSP를 완전히 제거하는 것입니다 [06:57].
3. LPO에서 CPO로의 기술 진화 경로
DSP를 제거하기 위해 업계는 다양한 방안을 시도해 왔습니다:
- LPO (Linear Pluggable Optics, 선형 플러그형 광모듈): 매우 대담한 방식으로, 플러그형 모듈에서 DSP를 직접 제거하고 왜곡된 전기 신호를 강제로 광신호로 변환하여 송출합니다. 효과는 있지만, 전송 거리가 크게 희생된다는 단점이 있습니다 [08:25].
- OBO (On-Board Optics, 온보드 광학): 광모듈을 랙 가장자리에서 메인보드 상의 칩과 더 가까운 위치로 이동시킵니다. 하지만 거리가 충분히 가깝지 않아 DSP를 완전히 제거하지 못했고, 동시에 플러그형의 편의성까지 상실하여 실패로 돌아갔습니다 [09:06].
- NPO (Near-Package Optics, 근접 패키징 광학): 광학 엔진을 ASIC(스위치 칩/GPU)과 매우 인접한 특수 고성능 기판으로 이동시키는 방식으로, 현재 도입되고 있는 절충안입니다 [09:38].
- CPO (Co-Packaged Optics, 공패키징 광학): 최종 형태로서, 광학 엔진과 칩을 동일한 패키지(Package) 내에 직접 패키징합니다 [10:01].
영상에서 분석한 CPO의 3단계 계층 (Tiers):
- 1단계 (최소 요건): 광학 엔진과 스위치 칩이 동일한 패키징 기판 위에 있으며, 구리 배선(Copper trace)을 통해 연결됩니다. DSP는 제거했지만, 여전히 병렬/직렬 신호 변환을 위한 SerDes가 필요합니다 [10:31].
- 2단계 (인터포저 통합): 칩과 광학 엔진이 동일한 실리콘 또는 유기 인터포저(Interposer) 위에 놓여 상호 연결 밀도가 대폭 향상됩니다. 이 단계에서는 SerDes가 완전히 불필요해지며, 완전한 병렬 통합을 구현합니다 [11:01].
- 최종 보스급: 하이브리드 본딩(Hybrid Bonding)과 같은 3D 적층 기술(TSMC의 CoWoS와 같은 2.5D 기술 포함)을 활용하여, 광학 엔진을 칩의 위 또는 아래에 직접 적층함으로써 극도로 낮은 전력 소비를 실현합니다 [11:31].
4. CPO의 상업적 도입을 둘러싼 격돌: Scale-out 네트워크
CPO의 첫 번째 도입 목표는 Scale-out 네트워크 내의 기존 광모듈을 대체하는 것입니다 [12:46]. 그러나 이에 대해 업계 내에서는 심각한 견해 차이가 존재합니다:
- 기존 플러그형(Pluggable)의 장점: 고장 시 교체가 매우 용이함 (운영 및 유지보수(O&M) 비용 저렴); 표준이 통일되어 있고 공급업체가 매우 많아, 대형 기업들이 강력한 가격 통제권을 가지며 **공급업체 종속(Vendor Lock-in)**을 피할 수 있음 oxed{13:29}.
- CPO의 약점: 패키징 레벨(Packaging level)에서 이루어짐. 만약 NVIDIA나 Broadcom의 CPO 칩을 구매한다면, 반드시 그들의 전체 광학 솔루션을 묶어서 구매해야 함; 일단 하나의 채널이라도 고장 나면 개별 수리가 불가능하며, 비싼 스위치 전체를 폐기하고 교체해야 함 oxed{14:11}.
- 시장 현황:
V. 최종 전장: Scale-up 네트워크와 구리(Copper)의 숙명
종적 확장(Scale-up) 네트워크는 현재 완전히 "구리"가 지배하고 있음 oxed{17:09}.
- 구리의 천연적 장점: 칩 내부 신호는 본래 전기 신호이므로, 구리를 사용하면 별도의 광전 변환(Electro-optical conversion)이 필요 없음. 랙(Rack) 내부 지연 시간은 미터당 약 5나노초(ns)에 불과하며(총 지연 시간 약 10ns), 이는 현재의 CPO보다 훨씬 빠름 oxed{17:17}.
왜 Scale-up의 미래에는 반드시 CPO가 필요한가?
구리의 물리적 한계("벽")에 부딪히고 있기 때문임. 현재 224G는 PAM4 변조(Modulation)를 통해 2미터까지 버틸 수 있음 oxed{18:51}. 하지만 차세대 **448G 인터커넥트(Interconnect)**는 PAM6 또는 PAM8을 사용하거나 보드 레이트(Baud rate)를 두 배로 높여야만 함. 이는 신호를 극도로 불안정하게 만들고 신호 대 잡음비(SNR)를 급격히 떨어뜨려, 구리의 전송 거리가 대폭 단축되어 단일 랙 내부조차 커버할 수 없게 만듦 oxed{19:14}.
- NVIDIA의 돌파구 (Blackwell에서 Rubin까지):
- Blackwell 세대의 거대한 성공은 NVL72 랙에 있음. 이는 순수 구리 백플레인(Backplane)을 사용하여 72개의 GPU를 하나의 거대한 "슈퍼 단일 카드"처럼 연결함 oxed{20:21}.
- 그러나 GTC 2026에서 Jensen Huang은 Vera Rubin Ultra NVL576 시스템을 발표함 oxed{21:27}. 이 시스템은 "구리 + 광학" 혼합 Scale-up 모드를 채택함: 랙 내부(NVL72)는 여전히 구리를 통해 극한의 저지연을 유지하지만, 랙 사이는 CPO 광학 인터커넥트를 통해 8개의 랙을 완전히 통합함 oxed{21:37}.
- 이를 통해 Scale-up 리소스 풀이 직접적으로 576개의 GPU까지 확장되었으며, 향후 Kyper 세대에서는 NVL1152에 도달할 것임 oxed{21:53}.
💡 영상 핵심 요약
영상 마지막에서는 업계의 표준(Industry standard)이 변하고 있음을 지적함. 과거의 원칙이 "구리를 쓸 수 있다면 구리를 쓰고, 어쩔 수 없을 때만 광학을 사용한다"였다면, 미래의 새로운 원칙은 "물리적 한계의 벽이 눈앞에 있으므로, 구리를 최대한 오래 쥐어짜낸다"임 oxed{22:27}.
CPO (Co-Packaged Optics)는 여전히 비용 문제와 개별 부품 수리 불가능 등의 과제가 남아 있지만, Scale-out 영역에서는 꾸준히 침투하고 있습니다 [22:40]。반면 Scale-up 영역에서는, 구리 (Copper)가 448G 단계에서 완전히 막다른 길에 다다르는 순간, **CPO는 "수만 개의 GPU를 하나로 통합할 수 있는" 압도적인 규모 확장 능력 (World Size)을 바탕으로 순식간에 전체 AI 컴퓨팅 클러스터를 지배하게 될 것입니다 [23:05].
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기