Cerebras, 웨이퍼 스케일 칩 냉각을 위한 기계적 플레이북 재설계
요약
Cerebras가 웨이퍼 스케일 칩의 균열 문제를 해결하기 위한 세 가지 기계적 혁신 기술을 공개했습니다. 수직 전력 공급, 유연한 인터포저, 직접 충돌 수냉 기술을 통해 열적·기계적 응력을 관리합니다.
핵심 포인트
- 수직 전력 공급으로 측면 열팽창 불일치 및 임피던스 감소
- 가동 핀 인터포저를 통한 열팽창 차이 수용
- 직접 충돌 수냉 기술로 효율적인 열 관리 구현
- 300mm 웨이퍼 스케일 칩의 물리적 파괴 방지
Cerebras는 웨이퍼 스케일 칩 (wafer-scale chips)의 균열을 방지하기 위해 수직 전력 공급 (vertical power delivery), 유연한 인터포저 (flexible interposers), 직접 충돌 냉각 (direct-impingement cooling)이라는 세 가지 기계적 혁신을 공개하며 엔지니어링의 기본 원칙을 새로 썼습니다.
Cerebras는 웨이퍼 스케일 칩이 균열되는 것을 방지하기 위해 수직 전력 공급 (vertical power delivery), 유연한 무빙 핀 인터포저 (flexible moving-pin interposers), 그리고 직접 충돌 수냉 (direct-impingement water cooling) 기술을 개발했습니다. 이 회사는 단일 모놀리식 실리콘 웨이퍼 (monolithic silicon wafer) 전체에 걸쳐 열적 및 기계적 응력 (thermal and mechanical stress)을 관리하기 위해 기계 공학의 기본 원칙을 재정립했습니다.
주요 사실 (Key facts)
- 웨이퍼 스케일 칩 직경: 300mm
- 실리콘 파괴 인성 (Silicon fracture toughness): ~0.8 MPa·m^0.5
- WSE-3 웨이퍼 내 대역폭 (on-wafer bandwidth): 21 PB/s
- 전력 부하 (Power load): 웨이퍼당 850W 이상
- 세 가지 혁신: 수직 전력 (vertical power), 유연한 인터포저 (flexible interposers), 수냉 (water cooling)
Cerebras는 자사의 웨이퍼 스케일 칩이 스스로 파괴되지 않고 작동할 수 있게 해주는 세 가지 핵심 기계적 혁신—수직 전력 공급 (vertical power delivery), 유연한 무빙 핀 인터포저 (flexible moving-pin interposers), 직접 충돌 수냉 (direct-impingement water cooling)—을 공개했습니다. @SemiAnalysis_에 따르면, 이 회사는 "단일 웨이퍼가 스스로 갈라지는 것을 막기 위해서만 기계 공학 플레이북을 새로 써야 했습니다."
균열 문제 (The cracking problem)
표준 실리콘 웨이퍼의 직경은 300mm입니다. 유휴 상태에서 850W 이상의 컴퓨팅 부하에 이르는 열 사이클링 (thermal cycling) 과정에서, 실리콘 다이 (silicon die)와 유기 기판 (organic substrate) 또는 소켓 사이의 열팽창 계수 (coefficient of thermal expansion) 불일치는 실리콘의 파괴 인성(~0.8 MPa·m^0.5)을 초과하는 응력을 발생시킬 수 있습니다. 모놀리식 웨이퍼 스케일 칩의 경우, 균열 전파 (crack propagation) 위험은 다이싱된 칩 (diced chips)보다 수십 배 더 높습니다. Cerebras의 솔루션은 상호 의존적인 세 가지 계층을 결합합니다.
수직 전력 공급 (Vertical power delivery)
기존의 칩들은 패키지 기판(package substrate)을 통해 측면으로 전력을 공급하여 평면 내 열 구배(in-plane thermal gradients)를 발생시킵니다. Cerebras는 인터포저(interposer)를 통해 전력 공급을 수직으로 이동시켜 측면 열팽창 불일치(lateral thermal expansion mismatches)를 줄입니다. 이는 또한 칩의 막대한 전류 소모에 있어 매우 중요한 전력 공급 네트워크(power-delivery network)의 임피던스(impedance)를 단축시킵니다.
가동 핀 인터포저 (Flexible moving-pin interposers)
고정된 핀을 가진 경직된 소켓 대신, Cerebras는 웨이퍼와 냉각판 사이의 열팽창 차이를 수용할 수 있는 가동 핀(moving pins)이 있는 인터포저를 사용합니다. 핀은 웨이퍼가 가열되고 냉각됨에 따라 동적으로 위치를 조정하여, 특정 지점에 응력(stress)이 집중되는 것을 방지합니다.
직접 분사식 수냉 (Direct-impingement water cooling)
액체 냉각(Liquid cooling)은 고전력 칩의 표준이지만, Cerebras는 마이크로 노즐(micro-nozzles)을 통해 웨이퍼 뒷면에 직접 물 분사를 유도하여 콜드 플레이트 전도(cold-plate conduction)보다 더 높은 열전달 계수(heat transfer coefficients)를 달성합니다. 또한 물 분사 방식은 300mm 웨이퍼 표면 전체에 걸쳐 균일한 냉각을 제공하여, 국부적인 열 응력(thermal stress)을 유발할 수 있는 핫스팟(hot spots)을 방지합니다.
여기서 독특한 점은 Cerebras의 기계적 혁신이 실리콘 설계보다 더 차별화되어 있다고 볼 수 있다는 것입니다. Nvidia나 AMD와 같은 경쟁사들이 다이(die) 또는 칩렛(chiplet) 수준에서 최적화를 수행하는 반면, Cerebras의 웨이퍼 스케일(wafer-scale) 접근 방식은 대부분의 AI 칩 기업들이 기성품 구매 결정으로 취급하는 패키징, 냉각 및 응력 관리 분야에 대한 근본적인 재사고를 강요합니다. 이 회사는 구체적인 열 성능 수치나 웨이퍼당 비용을 공개하지 않았으나, SemiAnalysis는 이러한 엔지니어링 복잡성을 고려할 때 기존 GPU 시스템보다 단위당 비용이 더 높을 것임을 시사한다고 언급했습니다.
이것이 업계에 의미하는 바
웨이퍼 스케일 칩 (Wafer-scale chips)은 메모리 대역폭 (Memory bandwidth)의 이점을 약속합니다. Cerebras의 WSE-3는 21 PB/s의 온-웨이퍼 대역폭 (On-wafer bandwidth)을 제공합니다. 하지만 이를 대규모로 신뢰성 있게 만들기 위해 필요한 기계 공학 (Mechanical engineering)은 그동안 블랙박스(Black box) 영역이었습니다. 이러한 세부 사항을 공개함으로써, Cerebras는 이 접근 방식이 단순한 실험실 실험이 아니라 양산 준비가 되었음을 시사합니다. 그러나 맞춤형 인터포저 (Custom interposer)와 냉각 시스템은 표준 패키징 (Standard packaging)과 비교했을 때 대량 생산 확장을 제한하는 공급망 의존성을 생성합니다.
주목할 점
Cerebras가 맞춤형 기계 공학 (Bespoke mechanical engineering)에서 대량 제조 (Volume manufacturing)로 전환할 수 있을지 여부입니다. 이 회사의 다음 이정표는 단일 웨이퍼 시스템에서 멀티 웨이퍼 구성 (Multi-wafer configurations)으로 확장하는 것입니다. 여러 웨이퍼를 함께 타일링 (Tile)할 때 균열 문제 (Cracking problem)는 더욱 심화됩니다.
관전 포인트
Cerebras의 멀티 웨이퍼 타일링 (Multi-wafer tiling)에 관한 다음 엔지니어링 공개를 주목하십시오. 여러 웨이퍼가 상호 연결될 때 균열 문제는 가중되며, 어떠한 해결책이라도 나온다면 대규모 클러스터 (Large-scale clusters)를 위한 준비가 되었음을 의미할 것입니다.
원문 게시처: gentic.news
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기