NVIDIA Ising: 며칠에서 몇 시간으로──22개 기관이 동시에 채택한 양자 계산 AI 모델

「AI가 양자 머신의 제어 평면(Control Plane), 즉 OS가 될 것이다」──NVIDIA의 CEO Jensen Huang 씨가 2026년 4월 14일에 이렇게 선언한 날, IonQ의 주가는 그날 즉시 약 20% 급등했으며, IonQ, Infleqtion, IQM을 포함한 22개의 기업 및 연구 기관이 동시에 하나의 AI 모델군 채택을 표명했다. 발표된 것은 바로 「NVIDIA Ising」이다. 양자 컴퓨터가 벗어나지 못했던 「교정(Calibration)에 수일 소요」, 「1,000번에 1번 에러 발생」이라는 두 가지 장벽에 서로 다른 AI 모델을 적용한 양자 AI의 새로운 카테고리이자, 양자 하드웨어 방식을 가로지르는 세계 최초의 오픈 모델군이기도 하다. 본 기사에서는 Ising의 내용, 채택한 4개 그룹의 사용법, 그리고 여기서 파생될 수 있는 프로덕트 아이디어를 순서대로 정리한다.

양자 컴퓨터가 「작동하지 않을」 때, 멈추는 지점은 대개 정해져 있다. 하나는 캘리브레이션 (Calibration, 교정)이다. 마이크로파나 레이저로 물리적으로 큐비트(Qubit)를 제어하기 때문에, 온도나 자기장의 미세한 흔들림만으로도 응답이 달라져 연구자가 매일 수일에 걸쳐 조절 장치를 다시 돌려야만 안정적으로 동작한다. 또 다른 하나는 오류 정정 (Quantum Error Correction, 이하 QEC)이다. Tom's Hardware에 따르면, 현재 최고 수준의 양자 프로세서에서도 약 1,000번에 1번은 에러가 발생하기 때문에, 계산과 병행하여 에러를 계속해서 탐지하고 정정하는 전용 회로가 필요하다.

이 두 가지를 저렴하고, 빠르고, 똑똑하게 돌릴 수 없는 한, 양자 컴퓨터는 연구실 밖으로 나올 수 없다. Jensen Huang 씨가 발표 당시 언급한 「AI가 양자 머신의 제어 평면, 즉 OS가 될 것이다」라는 한마디는 바로 이 지점을 가리킨다. Ising은 그 「OS」를 구성하는 첫 번째 두 가지 부품이다.

Ising은 하나의 모델이 아니라, 서로 다른 문제에 서로 다른 아키텍처를 적용하는 2개 모델 구성이다.

Ising Calibration: 교정 담당. Hugging Face의 공식 모델 카드에 따르면, Qwen3.5-35B-A3B를 베이스로 한 **총 35B/액티브 3B 파라미터의 MoE (Mixture-of-Experts) 비전 언어 모델 (VLM)**이다. 256개의 전문가(Expert) 중 토큰마다 8개만 활성화되는 방식으로, 262K 토큰의 컨텍스트 길이를 가진다. 양자 프로세서의 측정 파형이나 히스토그램, 라비 진동 곡선(Rabi oscillation curve) 등의 「이미지」를 직접 읽고, 설정 파라미터의 재조정 방침을 텍스트로 반환한다. -
Ising Decoding: QEC 디코더 담당. NVIDIA Developer Blog에 따르면, 3차원 합성곱 신경망 (3D CNN)을 핵심으로 하는 2개 모델로, Fast 버전은 약 912K 파라미터·수용 영역(Receptive Field) 9, Accurate 버전은 약 1.79M 파라미터·수용 영역 13이다. CUDA-Q QEC와 TensorRT를 통해 라운드당 2.33μs로 동작하도록 설계되었다.

사이즈감이 극단적으로 다르다는 점이 포인트로, Calibration은 「생각하는」 담당의 중량급이며, Decoding은 「실시간으로 반응하는」 담당의 초경량급이다. 전자는 백그라운드에서 연구자를 대신해 교정 실험을 구성하고, 후자는 양자 계산 바로 옆에서 초당 수십만 번 실행되는 분담 구조를 갖는다.

왜 교정에 VLM을 적용했는가? 양자 프로세서의 교정은 파형이나 플롯을 보고 「이것은 정상」, 「이 부분이 어긋나 있음」이라고 판단하는 작업으로, 도메인 지식이 이미지와 텍스트에 분산되어 있다. 일반적인 텍스트 LLM으로는 파형을 읽을 수 없고, 이미지 분류 모델로는 판단 이유를 언어화할 수 없다. 두 가지를 하나의 모델로 다룰 수 있는 VLM이 자연스럽게 적용되는 것이다. NVIDIA 공식에 따르면, 초전도 큐비트, 양자점(Quantum Dot), 트랩 이온(Trapped Ion), 중성 원자 등 각 방식의 측정 데이터로 학습되어 하드웨어에 상관없이 범용적으로 교정할 수 있다.

왜 QEC 디코더에 3D CNN을 사용하는가? 표면 코드 (Surface Code)를 사용하는 양자 계산에서는 에러 탐지에 사용하는 신드롬(Syndrome) 정보가 「2차원 칩 위에서 시간별로 업데이트되는 배열」로 나타난다. 이는 이미지의 세로·가로·시간 그 자체이므로, 3차원 합성곱이 자연스러운 선택이 된다. Google이 2024년에 발표한 AlphaQubit은 Transformer로 동일한 문제에 도전했으나, Google DeepMind 블로그에 따르면 「초전도 프로세서에서 실시간으로 구동하기에는 아직 너무 느리다」고 명시되어 있다. NVIDIA는 「Production 환경에서 라운드당 2.33μs 이내로 맞춘다」는 레이턴시(Latency) 요구사항으로부터 역산하여, 경량 3D CNN에 집중했다.

Ising의 위치를 이해하려면, 인접한 기법들과 나란히 비교해 보는 것이 빠르다.

pyMatching (고전 MWPM): Oscar Higgott 등이 개발한 오픈 소스 구현체로, 현재 양자 오류 정정 (QEC) 디코더의 사실상 표준 (de facto)이다. 최소 가중치 완전 매칭 (Minimum Weight Perfect Matching)이라는 고전 알고리즘을 사용하며, 거리 17의 표면 부호 (Surface Code)를 라운드당 1마이크로초 (μs) 이하로 해결할 수 있다. 결정론적이고 빠르다는 장점이 있는 반면, 누설 상태 (leakage state)나 상관 오류 (correlated error)와 같은 '예상치 못한 노이즈'에는 취약하다.

Google AlphaQubit (2024, Transformer): Nature에 게재된 Google의 연구로, 텐서 네트워크 비 (tensor network ratio) 6%, 상관 매칭 비 (correlation matching ratio) 30%의 에러를 줄이는 정밀도를 보여주었으나, Google 블로그에서 인정하듯 실시간 동작에는 도달하지 못했으며 코드와 가중치(weights)는 공개되지 않았다.

NVIDIA Ising Decoding (2026, 3D CNN): NVIDIA 공식 발표에 따르면 Fast 버전은 pyMatching보다 2.5배 빠르고 1.11배 높은 정밀도를, Accurate 버전은 2.25배 빠른 속도와 1.53배 높은 정밀도를 제공한다. 게다가 가중치와 코드가 리포지토리(repository)를 통해 공개되어 있다.

여기서 핵심적인 차이는 설계 사상의 대비에 있다. Google은 '최고 정밀도의 모델을 먼저 만들고, 배포는 나중에 생각한다'는 연구 선행적 태도를 취한다. 반면 NVIDIA는 '프로덕션 (production)에서 구동되는 제약 조건으로부터 역산하여 아키텍처를 선택한다'는 엔지니어링 선행적 태도를 취하며, 이것이 오픈 소스화와 22개 기관의 동시 채택이라는 GTM (Go-to-Market) 전략 구축까지 이어졌다.

Ising Calibration은 공개 모델로 배포되어 있어, Hugging Face Transformers의 표준 파이프라인으로 호출할 수 있다. 교정 대상인 측정 도표를 입력하고 조정 방침을 텍스트로 반환하는 최소 샘플은 다음과 같다.

from transformers import pipeline
# Ising Calibration 을 image-text-to-text 파이프라인으로 호출
pipe = pipeline(
...

실제 운용 시에는 vLLM으로 vllm serve "nvidia/Ising-Calibration-1-35B-A3B"와 같이 서버를 띄운 후, NVIDIA Developer Blog가 제시하는 에이전트 워크플로우 (Quantum-Calibration-Agent-Blueprint)를 통해 반복적으로 호출하는 방식이 표준이다.

NVIDIA 공식 발표 당일 명시된 채택 조직은 22개 이상에 달한다. 성격이 다른 4개 그룹을 살펴본다.

IonQ (미국 · 상장, 트랩 이온 방식): 상용 양자 클라우드의 대기업으로, SkyWater의 반도체 팹 (fab) 인수 등 하드웨어 측면의 확장도 추진하고 있다. Ising Calibration을 트랩 이온형 양자 프로세서의 자동 교정에 통합했으며, Investing.com 등에 따르면 발표 당일 주가가 약 20% 상승하는 등 시장의 반응도 뜨거웠다.

Infleqtion (미국 · 비상장, 중성 원자 방식): Sqale이라 불리는 중성 원자 양자 컴퓨터를 전개한다. Infleqtion 공식 블로그에 따르면, 중성 원자는 원자가 계산 공간 외의 준위로 '새어 나가는' 누설 (leakage) 현상이 본질적으로 피할 수 없기 때문에, Ising Decoding을 누설 인식형 예비 디코더 (predecoder)로 통합하고 저지연 NVQLink를 통해 GPU와 연결하는 설계를 채택하고 있다. 이 회사는 2026년 말까지 12개 논리 양자 비트에서 30개로 확장한다는 로드맵을 내걸고 있다.

IQM Quantum Computers (핀란드, 초전도 방식): 유럽을 대표하는 초전도 양자 벤더로, 상용 클라우드와 온프레미스 (on-premise) 제공을 모두 수행한다. NVIDIA 공식 채택 조직 리스트에 따르면 Calibration과 Decoding을 모두 채택하고 있어, Ising의 모든 기능을 사용하는 드문 사례 중 하나다.

Northwestern University × Fermilab (미국 · 연구 기관): 양측은 지하 107미터의 NEXUS 테스트베드에서 수집한 약 1개월 분량의 초전도 양자 비트 측정 데이터를 제공하였으며, NVIDIA와 공동으로 평가 벤치마크인 'QCalEval'을 구축했다. NVIDIA Developer Blog에 따르면, 이 QCalEval 상에서 Ising Calibration은 평균적으로 Claude Opus 4.6을 9.68%, GPT-5.4를 14.5% 상회하는 점수를 기록했다.

Ising의 내부를 살펴보면, '노이즈가 많은 물리 장치의 측정 도표를 읽고 재조정한다', '3차원 검출 데이터로부터 정정 방침을 실시간으로 도출한다'라는 두 가지 추상적 패턴을 추출할 수 있다. 이를 축으로 하는 세 가지 사업 아이디어를 그려본다.

기본 사례: IonQ, Infleqtion, IQM이 각각 자사 운영을 위해 Ising을 통합하여 사용하고 있는 패턴. Calibration (교정) 모델은 초전도, 중성 원자, 트랩 이온, 양자점 (Quantum Dot) 등 방식을 가리지 않고 학습되어 있다.

발전 아이디어: 이 "하드웨어 독립성"을 상품화하여, 양자 클라우드 사업자가 아닌 중소 양자 스타트업이나 대학 연구실을 대상으로, 자체 측정 데이터를 보내면 교정 어드바이스가 JSON 형식으로 반환되는 SaaS를 구축한다. Ising Calibration 본체는 OSS (Open Source Software)로 사용할 수 있으므로, 그 위에 얹을 가치는 "방식별 프롬프트·전처리·실험 템플릿 모음"과 "24시간 온콜 (On-call) 교정 에이전트 운영"이 될 것이다.

기본 사례: Cornell, Sandia, UC San Diego 등이 pyMatching 기반의 스택을 대체하는 형태로 Ising Decoding을 채택하고 있는 패턴.

발전 아이디어: Qiskit (IBM)이나 Cirq (Google), CUDA-Q 상의 QEC (양자 오류 정정) 계층에 drop-in 방식으로 삽입할 수 있는 AI 프리디코더 (Pre-decoder) 확장을 만든다. 본래의 OSS 코드를 래핑(Wrapping)하여, 기존의 신드롬 (Syndrome) 취득 API는 그대로 유지하면서 내부만 AI 예측으로 교체한다. NVQLink 의존성을 해소하고 싶은 계층을 위해, CUDA 없이 동작하는 CPU 또는 별도 GPU용 경량 빌드를 제공한다.

기본 사례: Ising Calibration이 "측정도를 읽고 장치를 재조정하는" VLM (Vision Language Model)이라는 추상적 패턴.

발전 아이디어: 양자 분야 외에도 노이즈가 많은 물리 장치에서 "인간이 매일 파형을 보며 교정하는" 곳은 매우 많다. 반도체 Fab의 플라즈마 식각 장치, MRI의 자기장 시밍 (Shimming), 전파 천문대의 간섭계, 산업용 CT 스캐너 등이 그 예다. Ising과 동일한 "VLM + 도메인 측정 이미지" 레시피를 활용해 각 산업의 교정 데이터셋을 수집하여 파생 모델을 만들고, 장치 제조사에 통합한다. NVIDIA가 Open License로 공개하고 있는 만큼, 포크 (Fork), 추가 학습, 재배포의 자유도는 충분하다.

Ising은 화려한 수치들이 나열되어 있지만, 세 가지만 냉정하게 확인하고 싶다. 첫째, Tom's Hardware가 지적했듯이 "가중치(Weights)는 열려 있지만 스택(Stack)은 닫혀 있다". Ising Decoding은 NVQLink 상호 연결과 CUDA-Q를 전제로 하며, 진정으로 낮은 레이턴시 (Latency)를 끌어내려면 NVIDIA 하드웨어가 사실상 필수적이다. 둘째, 라이선스는 Apache 2.0이 아니라 "NVIDIA Open Model License"이며, 재배포나 상업적 이용에 독자적인 조건이 있다. 셋째, 애초에 양자 컴퓨터 자체의 오류율이 2026년 시점에서 1,000번에 1번 꼴로 발생하는 수준이기에, Ising으로 교정과 정정을 가속한다고 해서 즉각적으로 고전 컴퓨터를 대체하는 응용 분야가 늘어나는 것은 아니다.

공식 입구는 NVIDIA Newsroom과 NVIDIA Developer Blog이며, 구현은 GitHub의 NVIDIA/ising과 NVIDIA/Ising-Decoding, 모델 본체는 Hugging Face의 nvidia/Ising-Calibration-1-35B-A3B이다. 비교 대상으로 pyMatching 논문 (arXiv:2105.13082)과 Google DeepMind의 AlphaQubit에 관한 Nature 게재 논문을 함께 읽으면, "고전 MWPM → Transformer → 경량 CNN"으로 이어지는 QEC 디코더의 3세대 흐름을 쉽게 파악할 수 있다.

Ising이 흥미로운 점은 특정 양자 하드웨어의 승패를 가리러 온 것이 아니라, 양자 계산의 "OS 계층"을 단번에 장악하러 왔다는 점이다. 22개 기관의 동시 채택과 오픈 모델화는 해당 계층이 NVIDIA를 중심으로 표준화되고 있다는 신호이기도 하다. 양자 AI라는 새로운 계층이 클라우드나 LLM에 이어 AI 인프라의 구성 요소로 성장할 것인가── 인접 영역의 사업자들에게 이번 발표는 Ising을 직접 사용할지 여부를 넘어, "자신의 영역에서도 측정도를 읽는 VLM, 3차원 검출 데이터를 읽는 경량 CNN이 유효한 곳은 어디인가"를 고민하게 하는 기점이 될 것이다.

NVIDIA Newsroom - NVIDIA, 유용한 양자 컴퓨터로 가는 경로를 가속화하기 위한 세계 최초의 오픈 AI 모델 Ising 출시 https://nvidianews.nvidia.com/news/nvidia-launches-ising-the-worlds-first-open-ai-models-to-accelerate-the-path-to-useful-quantum-computers
NVIDIA Developer Blog - NVIDIA Ising, 결함 허용 양자 시스템 (Fault-Tolerant Quantum Systems) 구축을 위한 AI 기반 워크플로우 도입 https://developer.nvidia.com/blog/nvidia-ising-introduces-ai-powered-workflows-to-build-fault-tolerant-quantum-systems/
GitHub - NVIDIA/ising https://github.com/NVIDIA/ising
GitHub - NVIDIA/Ising-Decoding https://github.com/NVIDIA/Ising-Decoding
Hugging Face - nvidia/Ising-Calibration-1-35B-A3B (모델 카드) https://huggingface.co/nvidia/Ising-Calibration-1-35B-A3B
The Quantum Insider - NVIDIA, Ising 출시 https://thequantuminsider.com/2026/04/14/nvidia-launches-ising-the-worlds-first-open-ai-models-to-accelerate-the-path-to-useful-quantum-computers/
SiliconANGLE - NVIDIA, 양자 오류 정정 (Quantum Error Correction) 및 교정 (Calibration)을 위한 Ising AI 모델 공개 https://siliconangle.com/2026/04/14/nvidia-unveils-ising-ai-models-quantum-error-correction-calibration/
Tom's Hardware - NVIDIA, Ising 오픈 AI 모델 출시 https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-releases-ising-open-ai-models
Quantum Computing Report - NVIDIA, 양자 개발을 가속화하기 위한 Ising 오픈 소스 AI 모델 출시 https://quantumcomputingreport.com/nvidia-launches-ising-open-source-ai-models-to-accelerate-quantum-development/
Northwestern University Quantum - Northwestern 및 Fermilab의 양자 데이터, NVIDIA Ising을 활용한 양자 교정 (Quantum Calibration)용 새로운 AI 벤치마크 구축에 기여 https://quantum.northwestern.edu/news-and-stories/2026/northwestern-and-fermilab-quantum-data-helps-build-a-new-ai-benchmark-for-quantum-calibration-with-nvidia-ising-open-models.html
MarkTechPost - NVIDIA, Ising 출시 https://www.marktechpost.com/2026/04/19/nvidia-releases-ising/
Infleqtion - AI 가속 양자 오류 수정(Quantum Error Correction)을 중성 원자 논리 큐비트(Neutral-Atom Logical Qubits)에 적용하다 https://infleqtion.com/ai-accelerated-qec/
Quantum Computing Report - Infleqtion이 AI 가속 양자 오류 수정을 위해 NVIDIA Ising을 통합하다 https://quantumcomputingreport.com/infleqtion-integrates-nvidia-ising-for-ai-accelerated-quantum-error-correction/
Google DeepMind - AlphaQubit: 양자 오류 수정(Quantum Error Correction) https://blog.google/technology/google-deepmind/alphaqubit-quantum-error-correction/
Nature - 양자 프로세서용 고정확도 오류 디코딩 학습 (AlphaQubit) https://www.nature.com/articles/s41586-024-08148-8
GitHub - oscarhiggott/PyMatching https://github.com/oscarhiggott/PyMatching
arXiv - PyMatching: 최소 가중치 완전 매칭(Minimum-Weight Perfect Matching)을 이용한 양자 코드 디코딩용 Python 패키지 (arXiv:2105.13082) https://arxiv.org/abs/2105.13082
Investing.com - Nvidia의 양자 컴퓨팅 플레이가 IonQ와 Rigetti를 추월하다 https://www.investing.com/analysis/nvidias-quantum-computing-play-just-sent-ionq-and-rigetti-flying-200678564

Insights

NVIDIA Ising: 며칠에서 몇 시간으로──22개 기관이 동시에 채택한 양자 계산 AI 모델

요약

핵심 포인트

댓글

다중 지역 SEO를 위한 지리적 페이지 구조화 방법

Marriott, 2분기 실적 호조에 따라 연간 RevPAR 전망치 상향 조정

OpenAI가 모델 가격을 80% 인하했으나 아무에게도 알리지 않았습니다. 가격 추적기를 운영하는 저조차 알아차리는 데 23일이 걸렸습니다.

GPT-5.6 출시 — 15분 만에 단 하나의 작업으로 최고의 GPT를 검증하는 방법

다중 지역 SEO를 위한 지리적 페이지 구조화 방법

Marriott, 2분기 실적 호조에 따라 연간 RevPAR 전망치 상향 조정

OpenAI가 모델 가격을 80% 인하했으나 아무에게도 알리지 않았습니다. 가격 추적기를 운영하는 저조차 알아차리는 데 23일이 걸렸습니다.

GPT-5.6 출시 — 15분 만에 단 하나의 작업으로 최고의 GPT를 검증하는 방법