본문으로 건너뛰기

© 2026 Molayo

Phoronix헤드라인2026. 05. 26. 23:06

NVIDIA Vera CPU 벤치마크: Olympus 코어가 ARM에서 역대 최고의 성능을 구현하다

요약

NVIDIA가 에이전틱 AI 워크로드에 최적화된 차세대 ARM 기반 CPU인 Vera를 공개했습니다. 자체 설계한 Olympus 코어를 탑재하여 x86 CPU에 필적하는 성능과 높은 에너지 효율성을 제공합니다.

핵심 포인트

  • 자체 설계한 Olympus 코어 탑재 및 Armv9.2 호환
  • 에이전틱 AI 및 데이터 센터 워크로드 최적화
  • 이전 세대 대비 2배 성능 향상 및 높은 에너지 효율성
  • LPDDR5X 결합 시 최대 1.2TB/s 메모리 대역폭 제공
  • 업스트림 Linux 커널 및 주요 ARM64 배포판 지원

NVIDIA Vera CPU 벤치마크: Olympus 코어가 ARM에서 역대 최고의 성능을 구현하다

NVIDIA의 Vera 데이터 센터(data center) CPU는 올해 말까지 본격적으로 출시되지는 않지만, 저는 최근 에이전틱 AI (agentic AI) 워크로드(workload)를 위해 설계된 이 새로운 ARM 기반 CPU를 테스트해 볼 기회를 가졌습니다. 자체 설계한 Olympus CPU 코어를 탑재한 NVIDIA의 Vera CPU는 기존의 다른 ARM 또는 비 x86_64 프로세서에서는 본 적이 없는, Intel/AMD x86_64 CPU에 필적하는 강력한 성능을 보여줍니다. Linux 환경에서 진행된 NVIDIA Vera CPU의 초기 벤치마크 결과를 계속해서 살펴보겠습니다.

Vera는 에이전틱 AI (agentic AI) 및 이와 유사한 현대적인 데이터 센터 워크로드 (data center workloads)를 위해 설계된 NVIDIA의 차세대 데이터 센터 CPU입니다. Vera는 특히 강력한 AI 랙(rack)을 구동하기 위한 호스트 CPU로서 NVIDIA NVL72 Vera Rubin에 탑재될 예정이며, CPU 랙을 위한 단독 제품으로도 제공될 것입니다. Arm Neoverse-V2 코어를 사용하는 NVIDIA의 Grace와 달리, Vera는 NVIDIA의 자체 설계인 "Olympus" 코어 설계를 사용합니다.

Vera는 이전 세대보다 2배의 성능을 제공하면서 선도적인 에너지 효율성까지 갖추었다고 주장하는 88개의 Olympus 코어를 특징으로 합니다. Olympus는 Armv9.2 ISA와 호환되며 FP8 정밀도(precision)를 지원하고, 공간 멀티스레딩 (spatial multi-threading)을 통해 총 176개의 스레드를 지원하며, LPDDR5X 메모리와 결합되어 최대 1.2TB/s의 메모리 대역폭 (memory bandwidth)을 제공합니다. Grace와 비교했을 때, Vera는 코어당 2MB의 두 배에 달하는 L2 캐시 (L2 cache), 164MB의 더 큰 통합 L3 캐시 (unified L3 cache)를 보유하고 있으며, PCIe Gen 6 및 CXL 3.1 연결성을 지원합니다.

이번 초기 벤치마킹 테스트를 위해 테스트된 Vera CPU의 소켓 TDP (socket TDP)는 450와트 (Watt)였습니다. LPDDR5X 메모리를 사용할 경우 전력 소비량은 약 50와트 (Watts) 이하입니다.

NVIDIA Vera 데이터 센터 CPU는 올해 하반기 출하를 목표로 순조롭게 진행 중이지만, 본격적인 양산에 앞서 NVIDIA는 저를 Santa Clara 본사로 초대하여 Olympus 코어가 탑재된 이 새로운 CPU의 첫 번째 공개 벤치마크 (benchmarks)를 실행해 볼 기회를 제공했습니다. 이 기사에는 바로 그 초기 결과들이 담겨 있습니다. 하지만 성능을 논하기 전에, Linux 지원 수준을 먼저 확인하는 것이 중요합니다. Vera가 아직 공식적으로 출시되지 않았기 때문에, 업스트림 Linux 커널 (upstream Linux kernel) 지원이나 주요 ARM64 Linux 배포판 등에 대한 NVIDIA의 계획이 어떠할지 정말 예측하기 어려웠습니다. 다행히 NVIDIA Vera는 이미 업스트림 Linux 커널 지원 상태가 양호합니다. Linux 7.1 이상 버전은 핵심 드라이버 (driver) 지원을 갖추고 있으며, Vera는 Ubuntu, Fedora 등과 같은 ARM64 서버 Linux 배포판에서 작동할 것입니다. 또한 NVIDIA는 모든 Vera 패치가 준비된 Ubuntu의 수정 버전을 통해 Base OS를 지속적으로 제공할 예정입니다. ACPI에 의존하므로 Linux에서 NVIDIA Vera를 사용할 때 짜증스러운 디바이스 트리 (Device Trees) 문제나 다른 골칫거리를 다룰 필요가 없습니다.

Vera는 Armv9.2와 호환되며 Arm의 서버 기본 시스템 아키텍처 (SBSA, Server Base System Architecture)를 준수하므로, 지원을 위해 많은 공통 ARM Linux 드라이버를 활용합니다. 하드웨어 가용성 이전에 업스트림 커널 지원 상태를 미리 추적하는 것이 어려운 이유 중 하나도 바로 이 때문입니다. 사용되는 공통 ARM Linux 코드 중에는 Vera가 지원할 VM (가상 머신) 기반의 기밀 컴퓨팅 (confidential computing)을 위한 Arm 기밀 컴퓨팅 (CCA, Arm Confidential Compute) 관련 지속적인 작업도 포함되어 있습니다.

지난해 GCC와 LLVM Clang은 Olympus 코어에 대한 지원을 추가했습니다. 이는 Vera를 위한 최적화된 바이너리 (optimized binaries)를 빌드하기 위해 GCC 16.1 이상 또는 LLVM Clang 21 이상이 필요함을 의미합니다. NVIDIA가 이처럼 이른 시기에 Olympus 컴파일러 지원을 도입한 것은 매우 훌륭하고 야심 찬 행보였으며, 그러한 주도적인 노력에 박수를 보낼 만합니다. 비교를 위해 살펴보자면, NVIDIA가 2025년 3월에 Olympus 지원을 업스트림 (upstream)한 반면, AMD Zen 6 (znver6) 지원은 2024년 12월에야 GCC에 추가되었고 올해 2월에 LLVM/Clang에 등장했습니다. NVIDIA의 Olympus 컴파일러 업스트림은 지난 수년간 Intel이 보여주었던 선제적인 지원 방식과 유사합니다. NVIDIA가 컴파일러 및 전반적인 분야에서 Vera의 업스트림을 위해 이와 유사한 주도성을 발휘하는 것을 보니 매우 고무적입니다. 향후 NVIDIA의 차세대 CPU 세대에서도 이러한 흐름이 계속되기를 바랍니다.

NVIDIA Vera에 다양한 Linux 배포판을 로드하는 등의 테스트는 수행할 수 없었으나, NVIDIA 재직 당시 들었던 모든 내용에 따르면 Vera를 위한 업스트림 오픈 소스 Linux 지원은 이미 양호한 상태입니다. 저의 테스트는 패치된 Linux 6.18 LTS 커널과 GCC 16.1이 결합된 기본 OS 구성의 Ubuntu 24.04 LTS에서 수행되었습니다.

Olympus 코어를 탑재한 NVIDIA Vera는 Linux에서 원활하게 작동했습니다. 한 가지 주의할 점은 일부 전력 관리 (power management) 튜닝이 아직 업스트림 과정에 있다는 것입니다. 최근 저는 NVIDIA가 Linux를 위한 ACPI CPPC v4 지원을 작업 중이라는 내용을 다룬 바 있는데, 이것이 관련 요소 중 하나로 보입니다. 이러한 전력 관리 튜닝이 여전히 진행 중이기 때문에, 불행히도 NVIDIA는 이번 초기 벤치마킹 단계 동안 CPU 전력 소비 모니터링을 활성화하지 말아 달라고 요청했습니다. 마찬가지로, 이번 첫 번째 테스트 라운드 동안에는 CPU 주파수 (frequency) 모니터링도 허용되지 않았습니다. 또한, NVIDIA Vera 벤치마킹은 양산 전 단계의 오픈 플랫폼 시스템 중 하나에서 수행되었으며, 전력 및 주파수를 살펴보는 데 있어 더 유의미한 데이터는 2026년 후반에 출시될 실제 양산용 밀폐형 서버 섀시 (enclosed server chassis) 설계에서 확인될 것입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Phoronix의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0