본문으로 건너뛰기

© 2026 Molayo

TNP중요헤드라인2026. 04. 24. 09:50

TACC의 Horizon 시스템: 혼합 정밀도와 FP64 에뮬레이션을 통한 HPC 혁신

요약

텍사스 고급 컴퓨팅 센터(TACC)는 차세대 슈퍼컴퓨터 'Horizon'을 통해 HPC 시뮬레이션 및 모델링의 새로운 지평을 열고 있습니다. 이 시스템은 Blackwell GPU를 핵심으로 하며, 기존 FP64 기반 워크로드에 대해 혼합 정밀도(Mixed Precision)와 Ozaki Scheme 같은 기술을 활용한 에뮬레이션 FP64 기능을 제공합니다. 이를 통해 TACC는 네이티브 FP64 대비 2배에서 최대 3배의 성능 향상을 기대하고 있습니다. 또한, CPU 전용 파티션과 GPU 기반 하이브리드 파티션을 모두 갖추어 다양한

핵심 포인트

  • TACC는 차세대 슈퍼컴퓨터 'Horizon'을 도입하며 Blackwell B200 GPU를 핵심으로 사용하고, 이는 161.3 petaflops (FP64)의 성능을 제공합니다.
  • Horizon 시스템은 혼합 정밀도(Mixed Precision)와 Ozaki Scheme 기반 에뮬레이션 FP64 기능을 활용하여 네이티브 FP64 대비 2~3배의 성능 향상을 목표로 합니다.
  • 시스템은 GPU 전용 파티션 외에도 Vera CV100 프로세서가 탑재된 CPU 전용 파티션을 갖추어 다양한 워크로드 요구사항을 충족합니다.
  • TACC는 Nvidia와의 2021년 계약 덕분에, 급격히 상승한 시장 가격에도 불구하고 Blackwell 세대 GPU를 안정적으로 확보할 수 있었습니다.

텍사스 고급 컴퓨팅 센터(Texas Advanced Computing Center, TACC)가 차세대 슈퍼컴퓨터 'Horizon'을 통해 고성능 컴퓨팅(HPC) 시뮬레이션 및 모델링의 새로운 가능성을 탐구하고 있습니다. TACC는 미국 국립과학재단(NSF)의 주요 시스템이 위치하는 곳으로, 천체 물리학부터 양자 역학, 기후 모델링에 이르기까지 광범위한 과학 응용 분야가 이곳에서 실행됩니다.

TACC는 기존 'Frontera' 시스템을 거쳐 'Vista' 시스템(2023년 말 가동)을 통해 하이브리드 CPU-GPU 아키텍처로 전환하는 과정을 겪었습니다. 이러한 흐름에 따라, Horizon 시스템은 최신 GPU 기술인 Blackwell B200을 핵심으로 채택했습니다.

Horizon 시스템의 주요 특징 및 성능:

  1. 하이브리드 컴퓨팅 파워: Horizon 시스템의 CPU-GPU 부분은 72코어 'Grace' CG100 Arm 프로세서와 Blackwell B200 GPU 쌍으로 구성되어 있습니다. Grace CPU는 6.9 petaflops (FP64)를, Blackwell GPU는 161.3 petaflops (FP64)의 성능을 제공합니다.
  2. 혼합 정밀도 활용: 이 Blackwell GPU는 FP16에서 20 exaflops 이상, FP8에서 40 exaflops 이상, 그리고 FP4에서 약 81 exaflops에 달하는 압도적인 저정밀도(Low-Precision) 성능을 자랑합니다. 이는 HPC 워크로드의 효율성을 극대화할 수 있는 기반이 됩니다.
  3. CPU 전용 파티션: 여전히 많은 NSF 워크로드가 CPU에서 실행되므로, 88코어 Vera CV100 프로세서가 탑재된 CPU 전용 파티션도 운영됩니다. 이 파티션은 총 131.8 petaflops (FP64)의 성능을 제공합니다.

혁신의 핵심: 에뮬레이션 FP64:

TACC가 가장 주목하는 부분은 바로 '혼합 정밀도'를 활용하여 에뮬레이션 FP64(Emulated FP64) 계산을 수행한다는 점입니다. 과학자들이 사용하는 HPC 시뮬레이션의 핵심 워크로드들은 전통적으로 FP64 정밀도를 요구합니다. 하지만 저정밀도 회로가 급증하는 시대적 흐름 속에서, TACC는 Blackwell GPU의 텐서 코어(Tensor Cores) 내 저정밀도 기능을 활용하여 FP64 계산을 에뮬레이션할 계획입니다.

이 과정에는 Ozaki Scheme과 같은 방법론이 사용될 예정이며, 이를 통해 네이티브 FP64 대비 2배에서 최대 3배에 달하는 성능 향상을 기대하고 있습니다. TACC는 이 기술의 결과가 IEEE 표준을 완벽하게 준수하지 않을 수 있다는 점을 인지하고 있으며, 모든 응용 프로그램에 대한 검증 과정을 거칠 예정입니다.

이러한 다각적인 접근 방식(CPU 전용 파티션 + GPU 하이브리드 파티션)과 최첨단 컴퓨팅 기술의 결합은 TACC가 과학계 연구자들에게 더욱 강력하고 효율적인 계산 자원을 제공할 수 있게 함을 의미합니다. 또한, Nvidia와의 초기 계약 덕분에 시장 가격 상승에도 불구하고 안정적으로 Blackwell 세대 장비를 확보한 점도 중요한 성과로 평가됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 The Next Platform의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0