GPU만으론 AI 공장이 멈춘다.
요약
엔비디아가 AI 에이전트 구동 시 발생하는 CPU 병목 현상을 해결하기 위해 베라(Vera) CPU를 공개했습니다. GPU의 효율을 극대화하기 위해 데이터 처리 및 오케스트레이션 성능을 높이는 데 집중하고 있습니다.
핵심 포인트
- AI 에이전트의 복잡한 단계 처리를 위한 CPU 성능 중요성 증대
- 베라 CPU는 x86 대비 작업 완료율 1.8배 향상 목표
- 그레이스 블랙웰 대비 에이전트 처리량 10배 목표
- 파이썬 오케스트레이션 오버헤드 감소에 초점
GPU만으론 AI 공장이 멈춘다.
엔비디아는 GTC 타이페이 키노트에서 AI를 토큰을 찍어내는 공장으로 재정의하고 GPU 주변 병목을 모두 직접 설계하기 시작했다.
에이전트는 프롬프트부터 툴 호출·검증까지 수천 단계가 CPU 영역이다. GPU가 아무리 빨라도 CPU가 데이터를 못 주면 공장 기계가 서는 셈이다.
베라 CPU는 그 병목을 노린 88코어 칩으로 x86 대비 작업 완료율 1.8배, 그레이스 블랙웰 대비 에이전트 스루풋 10배를 목표로 한다. 파이썬 오케스트레이션 오버헤드를 줄이는 데 초점을 맞췄다.
엔비디아는 GPU를 대체하는 게 아니라 GPU가 더 오래·더 수익성 있게 돌아가게 만드는 장치를 추가로 만드는 중이다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @j90236317 (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기