새로운 서버 중심인 SPEC CPU 2026 벤치마크 스위트에 Raspberry Pi 5 결과 발표 - 업데이트된 도구는 더 많은 테스트를
요약
SPEC CPU 벤치마크가 약 10년 만에 새로운 버전인 SPEC CPU 2026을 출시했습니다. 이 업데이트된 스위트는 기존보다 두 배 이상 증가한 테스트 케이스와 현대화된 워크로드를 포함하며, Raspberry Pi부터 서버급 시스템까지 다양한 환경에서 실행될 수 있도록 포터빌리티를 고려하여 설계되었습니다. SPEC의 핵심 목표는 모든 준수 시스템에서 결정론적(Deterministic) 결과를 보장하는 것입니다. 이를 위해 벤치마크 코드는 C/C++/Fortran으로 통일하고, 운영체제나 하드웨어 아키텍처에 따른 비결정성을 제거하기 위해 광범위한 수정 과정을 거칩니다. SPEC CPU는 서버 환경을 목표로 하며, 성능 측정은 단일 실행의 '속도(Speed)'와 동시 다발적 처리를 측정하는 '처리량(Rate)' 두 가지 지표를 통해 이루어집니다.
핵심 포인트
- SPEC CPU 2026이 출시되었으며, 이는 기존 대비 테스트 케이스가 두 배 이상 증가한 대규모 업데이트입니다.
- 벤치마크는 Raspberry Pi부터 서버까지 다양한 시스템에서 실행 가능하도록 포터빌리티에 중점을 두고 설계되었습니다.
- 결정론적 결과를 보장하기 위해 벤치마크 코드는 C/C++/Fortran으로 통일되고, 비결정성을 제거하는 엄격한 수정 과정을 거칩니다.
- SPEC CPU는 서버 환경을 목표로 하며, 성능은 단일 실행의 '속도(Speed)'와 동시 처리의 '처리량(Rate)' 두 가지 지표로 측정됩니다.
약 10 년 만에, Standard Performance Evaluation Corporation (SPEC) 은 널리 배포된 SPEC CPU 벤치마크의 새로운 버전을 출시합니다. 예상과 같이, SPEC CPU 2026 은 스위트에 포함된 워크로드를 현대화하고 더 많은 벤치마크를 추가하여 SPEC CPU 2017 의 코드베이스보다 두 배 이상 증가시켰습니다. 그러나至关重要的是, 이 스위트는 포터빌리티 (Portability) 를 고려하여 설계되었으며, Raspberry Pi 와 Windows-on-ARM 노트북부터 벤치마크가 설계된 서버 플레트까지 다양한 시스템에서 실행할 수 있습니다.
엔thusiasts(호기심 많은 사용자) 들을 위해 많이 언급되는 두 SPEC 벤치마크는 그래픽 성능을 위한 SPECviewperf 과 CPU 리뷰에서 우리가 실행하는 SPEC Workstation 입니다. SPEC CPU 는 CPU 에 집중하지만, 이는 게임용 최고의 CPU 보다 서버를 목표로 하는 스위트입니다.
업데이트된 스위트는 52 개의 테스트를 포함하며, 이는 SPEC CPU 2017 에 포함된 것보다 9 개 더 많고 코드 라인 수도 두 배 이상 많습니다. 이것이 SPEC 이 무엇을 하는지에 대한 중요한 부분입니다. 스위트는 실제 애플리케이션을 사용하지만, 벤치마크 스위트에 맞게 다양한 방식으로 수정됩니다. SPEC 의 기술 논문에 따르면 주요 초점은 각 애플리케이션에서 결정론적 (Deterministic) 결과를 보장하는 것이며, 이는 비결정성 (Non-determinism) 의 원인을 제거하는 것을 의미합니다. 예를 들어, 기술 논문은 C++ 의 std::sort 함수를 std::stable_sort 로 교체하는 것으로 설명합니다.
기술 논문에 따르면 "기본적인 목표는 모든 준수 시스템에서 사용자 공간 작업의 동일한 양을 실행하고 주어진 허용 범위 내에서 각 실행에서 동일한 결과를 생성하는 것입니다. 이러한 엄밀함을 달성하기 위해, 각 후보 벤치마크는 일련의 수정을 거칩니다."
비결정성을 제거하는 것 외에도 SPEC 은 애플리케이션을 포터빌리티를 위해 수정하며, 모든 것이 C, C++, 또는 Fortran 으로 작성되도록 보장하고 사용자 공간 실행에 집중합니다. 논문에 따르면 SPEC 의 목표는 벤치마크의 사용자 공간 코드의 95% 이상의 실행 시간이 발생하도록 하는 것이며, 운영 체제의 영향을 최소화하는 것입니다.
SPEC 은 새로운 스위트의 후보를 수집하기 위해 약 3 년 (2020 년 2 월 ~ 2023 년 3 월) 을 소요했습니다. 70 개의 후보 애플리케이션을 발표했으며, 그중 38 개가 SPEC 의 CPU 위원회에 통과되었습니다. 다시 한번, 비결정성이 애플리케이션 선택에 영향을 미쳤습니다. 위원회는 "해결책으로 이어질 수 있는 '단축 (Short-cuts)' 을 유발할 수 있는 주요 아키텍처 또는 컴파일러 차이"를 피하려고 했습니다. 몇 가지 특정 애플리케이션은 심층 평가에 도달했지만 최종적으로 포함되지 않았습니다. 기술 논문에 따르면.
중요한 것은 llama.cpp 와 whisper.cpp 과 같은 현대 AI 워크로드입니다. 기술 논문은 "포터빌리티 C++ 코드 경로 (내부 함수 제거됨) 에만 제한하는 것이 실제 세계의 행동에서 근본적인 분기를 유발하여 최종적으로 불합격"이라고 설명합니다. SPEC 는 또한 AV1 및 Opus 코덱을 피하여 위원회 구성원에게 편향이라는 주장이 발생하지 않도록 피했습니다. 위원회는 Intel, AMD, IBM, Arm, Nvidia, Dell, HPE, Ampere, 그리고 다른 기관의 대표들로 구성된 것입니다.
Tom's Hardware 의 가장 좋은 뉴스와 심층 리뷰를 이메일로 받아보세요.
SPEC CPU 2026 벤치마크 목록
SPEC CPU 작동 방식에 대한 개요를 먼저 살펴봅시다. 전체 테스트 스위트는 네 가지 지표, 즉 정수 속도 (integer speed), 정수 처리량 (integer throughput), 부동소수점 속도 (floating point speed), 그리고 부동소수점 처리량 (floating point throughput) 을 검토합니다. 두 속도 지표를 합산하면 SPECspeed 를 얻고, 두 처리량 지표를 합산하면 SPECrate 을 얻습니다. SPECspeed 는 아마도 Tom's Hardware 독자들에게 가장 친숙할 것입니다. 이는 단일 시스템에서 단일 애플리케이션을 실행하고 해당 애플리케이션에 모든 자원을 할당하는 것을 검토합니다. 반면 SPECrate 은 서버에 더 초점을 맞추며, 동일한 애플리케이션이 동시에 여러 복사본으로 실행될 때의 총 처리량을 측정합니다.
각 스위트는 자체 벤치마크 목록을 가지고 있지만, 다른 스위트 간에 일부 애플리케이션은 재사용됩니다. 예를 들어, GCC 와 LLVM 컴파일러 테스트는 SPECrate 및 SPECspeed 정수 스위트 모두에서 이용 가능합니다. 벤치마크 위치를 결정할 때, SPEC 는 부동소수점 지시어가 10% 이상인 애플리케이션을 FP 카테고리 (부동소수점 카테고리) 로 세분화합니다. 일부 애플리케이션은 1%~10% 부동소수점 지시자 사이로 기술된 '회색 구역'에 해당했습니다. SPEC 는 애플리케이션의
|
|
|800.pot3d_s | Fortran | Solar physics |
803.sph_exa_s | C++ | Smoothed Particle Hydrodynamics |
809.cactus_s | C++, C | Astrophysics |
811.tealeaf_s | C | High-energy physics |
816.nab_s | C | Molecular modeling |
820.cloverleaf_s | Fortran | Hydrodynamics |
822.palm_s | Fortran | Atmospheric science |
849.fotonik3d_s | Fortran | Computational electromagnetics |
857.namd_s | C++ | NAMD molecular dynamics simulator |
865.roms_s | Fortran | Regional ocean modeling |
867.nest_s | C++ | Neuroscience simulator to spike neural networks |
872.marian_s | C++ | Neural machine translation framework |
881.neutron_s | C | Physics simulator for nuclear reactors |
Initial SPEC CPU 2026 results
SPEC 는 AMD, Intel, Dell, Lenovo, Supermicro, HPE 등 다양한 브랜드에서 제출된 초기 결과를 수십 가지 제공했습니다. 당연한 일로, 대부분의 결과가 서버용이며 여기에서는 모든 것을 다루기 어렵습니다. 하지만 관심이 있다면 직접 SPEC 에서 전체 결과를 확인할 수 있으며, 몇 가지 흥미로운 시스템을 강조하겠습니다.
결과에 앞서, SPEC 는 각 시스템의 점수를 평가하기 위해 자체 점수를 사용하며, 각 세트마다 기본값 또는 피크 (또는 둘 다) 숫자를 제공합니다. 최종 점수는 각 테스트의 비율의 기하평균이며, SPEC 은 이를 기준 시스템에서 워크로드를 완료하는 시간과 테스트된 시스템에서 워크로드를 완료하는 시간을 나누어 계산합니다.
|
|
|
|
|
Raspberry Pi 5 Model B Rev 1.1 | 4 | 1 | 3.72 | 3.93 |
Nvidia DGX Spark ( | 1 | 1 | 9.7 | N/A |
Nvidia DGX Spark (GB10) | 20 | 1 | 75 | N/A |
MINISFORUM EliteMini AI370 (AMD Ryzen AI 9 HX 370) | 1 | 1 | 3.72 | 3.93 |
ThinkSystem HR330A (Ampere eMAG 8180) | 32 | 1 | 22.4 | 23.1 |
ProLiant DL145 Gen11 (AMD EPYC 8534P) | 64 | 1 | 173 | 173 |
PowerEdge XR8720t (Intel Xeon 6776P-B) | 144 | 1 | 285 | 293 |
PowerEdge R7625 (AMD EPYC 9754) | 256 | 2 | 662 | 662 |
ProLiant Compute DL580 Gen12 (Intel Xeon 6788P) | 688 | 4 | 1,180 | 1,180 |
부동소자 통량 결과의 샘플링부터 시작하면, 서버 군과 함께 소비자 장치가 몇 가지 포함되어 있으며, Raspberry Pi, Nvidia DGX Spark, 그리고 Minisforum 의 미니 PC 도 있습니다. 여기서 최고 성능자는 HPE 의 ProLiant Compute DL580 Gen12 로, 4 개의 Intel Xeon 6788P CPU 를 탑재하여 시스템에 총 688 개의 스레드를 제공합니다.
|
|
|
|
|
Hyper A+ Server AS -1116CS-TN (AMD EPYC 9375F) | 32 | 1 | 9.19 | 9.19 |
ThinkSystem HR330A (Ampere eMAG 8180) | 32 | 1 | 1 | 1.04 |
PowerEdge R770 (Intel Xeon 6732P) | 64 | 2 | 8.73 | 9.22 |
ThinkSystem SR665 V3 (AMD EPYC 9575F) | 128 | 2 | 16.9 | 16.9 |
PowerEdge R7625 (AMD EPYC 9654) | 192 | 2 | 13.2 | 13.2 |
ProLiant DL385 Gen11 (AMD EPYC 9754) | 256 | 2 | 13 | 13 |
Hyper A+ Server AS -2126HS-TN (AMD EPYC 9965) | 384 | 2 | 17.7 | 17.7 |
PowerEdge M7725 (AMD EPYC 9755) | 256 | 2 | 18.6 | 18.6 |
부동소자 세트의 속도 결과로 넘어가면, 소비자 시스템이 여기에서 사라집니다. 여기서 가장 낮은 결과는 Ampere eMAG 8180 에서 나왔으며, 가장 높은 결과는 Dell 의 PowerEdge M7725 에서 나온 것으로, 2 개의 96 코어 AMD EPYC 9755 칩을 탑재했습니다. 속도 결과는 단일 시스템이 단일 애플리케이션을 실행하는 것을 보는 것이므로, 우리는 "복제본" 열을 "스레드"로 대체했습니다.
Raspberry Pi 5 Model B Rev 1.1 | 4 | 1 | 4.8 | 4.89
MINISFORUM EliteMini AI370 (AMD Ryzen AI 9 HX 370) | 1 | 1 | 5 | N/A
Nvidia DGX Spark (GB10) | 1 | 1 | 5.97 | N/A
Nvidia DGX Spark (GB10) | 20 | 1 | 66.6 | N/A
MacBook Pro 16 (M5 Pro) | 18 | 1 | 82.7 | N/A
PowerEdge R570 (Intel Xeon 6787P) | 172 | 1 | 329 | 346
Cisco UCS X215c M8 (AMD EPYC 9575F) | 256 | 2 | 630 | 630
ThinkSystem SD535 V3 (AMD EPYC 9965) | 384 | 1 | 626 | 626
PowerEdge M7725 (AMD EPYC 9965) | 768 | 2 | 1,270 | 1,270
정수 결과로 전환하면 소비자 시스템은 다시 등장하며, 하드웨어 하부에 숨겨져 있음에도 불구하고 놀랍게 잘 수행되는 __MacBook Pro 16 (M5 Pro)__도 함께 나타납니다. 최고 순위는 AMD EPYC 9965 듀얼 CPU 를 탑재하여 총 768 개의 스레드를 가지는 Dell 의 PowerEdge M7725 입니다. 대부분의 결과가 오픈 소스 컴파일러가 아닌 벤더 전용 컴파일러를 사용하여 있음을 강조할 가치가 있으며, 유사한 하드웨어에서도 다른 결과를 볼 수 있습니다. SPEC CPU 2026 은 소스 코드 형태로 제공되며, 결과 보고 시 컴파일러를 공개해야 합니다.
|
|
|
|
|
MacBook Pro 16 (M5 Pro) | 18 | 1 | 3.9 | N/A
Hyper A+ Server AS -1116CS-TN (AMD EPYC 9375F) | 64 | 1 | 5.14 | 5.14
PowerEdge R770 (Intel Xeon 6732P) | 128 | 2 | 5.87 | 5.92
ThinkSystem SR665 V3 (3.30 GHz, AMD EPYC 9575F) | 256 | 2 | 7.74 | 7.74
ProLiant Compute DL580 Gen12 (Intel Xeon 6788P) | 344 | 4 | 6.45 | 6.45
PowerEdge R770AP (Intel Xeon 6980P) | 512 | 2 | 7.6 | N/A
Hyper A+ Server AS -2126HS-TN (AMD EPYC 9755) | 512 | 2 | 8.26 | 8.26
마지막으로, 단일 시스템의 속도를 측정하는 정수 결과의 샘플입니다. Throughput 은 주된 초점이 아니므로, 더 많은 칩 (그리고 따라서 더 많은 스레드) 을 추가할 때 일부 시스템이 성능이 떨어지는 것을 볼 수 있습니다. 예를 들어 HPE 의 ProLiant Compute DL580 과 같이. 최고 순위는 Supermicro 의 서버인 Hyper A+ Server AS -2126HS-TN 으로, AMD EPYC 9755 듀얼 CPU 를 탑재하여 총 512 개의 스레드를 가집니다.
SPEC CPU 2026 출시 후, 기업들이 더 많은 결과를 발표할 수 있는 냉각 기간이 있을 것입니다. 우리는 2026 년 6 월 4 일에 더 많은 결과를 볼 수 있습니다. 8 월 11 일에는 SPEC 에서 2026 과 함께 2017 의 결과도 제시해야 하며, 11 월 3 일은 CPU 2017 을 완전히 폐지할 예정입니다.
11 월 3 일까지 SPEC CPU 2017 라이선스를 보유한 사용자는 새로운 세트에 $2,000 으로 업그레이드할 수 있습니다. 새로운 라이선스는 $3,000 입니다. 비영리 조직은 할인된 가격인 $750 으로 세트를 구매할 수 있으며, 일부 학술 기관은 무료 라이선스를 받을 수 있습니다.
Google News 에서 Tom's Hardware 를 Follow하거나, 우리를 선호하는 소스로 추가하여 최신 뉴스, 분석 및 리뷰를 피드에 가져오세요.**
-GB10 의 Cortex-X925 코어 중 하나와 Pi 5 의 Cortex-A72 네 개의 코어 모두의 속도 차이가 얼마나 큰지 재미있습니다!
Reply
BTW, SPEC_rate 는 N 개의 벤치마크 독립 복사본을 실행하므로 캐시 및 대역폭 집약적입니다. 따라서 스레드 간에는 본질적으로 공유 상태가 없습니다. 이는 매우 좋은 NUMA-스케일링 특성을 제공하며, 단일 CPU 와 듀얼 CPU 점수를 비교하면 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Tom's Hardware의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기