OpenAI Jalapeño: AI 경제학을 재정의하는 맞춤형 추론 칩

요약

OpenAI가 Broadcom과 협력하여 개발한 맞춤형 추론 전용 ASIC인 'Jalapeño'를 공개했습니다. TSMC 3nm 공정을 기반으로 제작된 이 칩은 Nvidia GPU 대비 토큰당 추론 비용을 약 50% 절감하는 것을 목표로 합니다.

핵심 포인트

OpenAI의 첫 맞춤형 추론 전용 ASIC 'Jalapeño' 공개
Nvidia GPU 대비 추론 토큰당 비용 약 50% 절감 목표
Broadcom과 협력하여 9개월 만에 초고속 개발 완료
TSMC 3nm 공정 및 HBM3 메모리 탑재

요약 답변: Broadcom과 협력하여 TSMC 3nm 공정에서 기록적인 9개월 만에 공동 개발된 OpenAI의 Jalapeño 칩은 Nvidia GPU 대비 토큰당 AI 추론 (Inference) 비용을 약 50% 절감할 것을 약속합니다. 이것이 실현된다면, 이는 ChatGPT 출시 이후 AI 경제학에서 가장 중요한 변화가 될 것이며, LLM 워크로드를 실행하는 모든 개발자의 API 비용을 직접적으로 낮추고 추론 하드웨어 분야에서 Nvidia의 10년 넘는 가격 지배력을 깨뜨릴 것입니다.

Bloomberg Television의 Ed Ludlow가 OpenAI와 Broadcom의 Jalapeño 칩 발표(2026년 6월 24일)에 대해 보도합니다.

OpenAI Jalapeño란 무엇인가?

2026년 6월 24일, OpenAI와 Broadcom은 Jalapeño를 공개했습니다. 이는 OpenAI의 첫 번째 맞춤형 "Intelligence Processor"로, LLM 워크로드를 위해 처음부터 설계된 추론 전용 ASIC (주문형 반도체)입니다. TSMC의 3nm 노드를 기반으로 제작된 이 칩은 약 840mm²(EUV 레티클 한계에 근접) 크기이며, 6개의 HBM3 메모리 스택을 탑재하고 있습니다. HBM4는 이미 Micron에서 샘플링 중입니다.

이것은 연구 프로젝트가 아닙니다. 엔지니어링 샘플은 현재 OpenAI 연구실에서 목표 주파수와 전력으로 GPT-5.3-Codex-Spark를 구동하고 있습니다. 이 칩은 컨셉 단계에서 테이프아웃 (Tape-out)까지 단 9개월 만에 이루어졌으며, 이는 반도체 산업 역사상 가장 빠른 ASIC 개발 주기인 것으로 믿어집니다.

우리는 이전 기사인 OpenAI Jalapeño: Broadcom과 함께하는 OpenAI의 첫 맞춤형 칩이 어떻게 AI 인프라 플레이북을 재정의하고 있는가에서 초기 발표 내용을 다루었습니다.

50% 비용 목표: Jalapeño가 추론 경제학을 재정의하는 방법

가장 핵심적인 수치인 — Nvidia GPU 대비 추론 토큰당 비용을 약 50% 낮춘다는 내용 — 은 CNBC 인터뷰에서 Broadcom의 CEO Hock Tan이 직접 밝힌 것입니다. OpenAI의 블로그는

Jalapeño가 목표로 하는 50% 비용 절감의 절반만 달성하더라도, OpenAI의 API 가격은 크게 하락할 것입니다. 즉, GPT-4 규모의 워크로드 (workload)를 실행하는 모든 개발자의 추론 (inference) 비용이 줄어들게 됩니다.

Nvidia의 가격 압박은 모두에게 이득이 됩니다

OpenAI는 2026년 2월에 Nvidia 하드웨어 구매를 위해 300억 달러를 약정했으며, 10GW 규모의 Vera Rubin 계약을 체결했습니다. 자체 추론 실리콘 (inference silicon)을 구축함으로써, OpenAI는 Nvidia의 가격 하한선을 깨뜨리고 있습니다. DeepSeek의 DSpark가 소프트웨어적 접근 방식을 취했다면, Jalapeño는 그에 상응하는 하드웨어적 접근 방식입니다.

맞춤형 실리콘은 이제 필수 요소입니다

Google에는 TPU v7 "Ironwood"가 있고, Amazon에는 Trainium과 Inferentia가 있으며, Microsoft에는 Maia 200, Meta에는 MTIA가 있습니다. Anthropic 또한 Broadcom과 협력하여 맞춤형 실리콘 (custom silicon)을 개발 중입니다. OpenAI의 Jalapeño는 이 구성을 완성합니다. 이제 모든 주요 AI 기업이 자체 실리콘을 설계하고 있습니다.

타임라인 현실 점검

프로토타입 (prototype) 배포는 2026년 말에 시작되어 2027년 내내 물량이 확대되며, 2028년 상반기에 본격적인 생산에 들어갑니다. 향후 12~18개월은 여전히 Nvidia의 독무대입니다. Nvidia의 RTX Spark 슈퍼칩은 경쟁사들의 대응이 이미 시작되었음을 보여줍니다.

결론

OpenAI Jalapeño는 단순한 칩 발표 그 이상입니다. 이는 AI가 확장(scale)되기 위해서는 추론 경제학 (inference economics)이 반드시 변해야 한다는 선언입니다. 그 증거는 벤치마크 (benchmark)와 API 가격표를 통해 드러날 것입니다. 만약 Jalapeño가 비용 목표를 달성한다면, 2027년은 AI 추론 가격이 획기적으로 낮아지는 해가 될 것입니다.

대표 이미지: 2026년 6월 24일 발표 행사에서 Jalapeño 인텔리전스 프로세서 (Intelligence Processor) 웨이퍼와 함께 있는 OpenAI CEO Sam Altman과 Broadcom CEO Hock Tan. 이미지 출처: Tom's Hardware / Future plc.

자주 묻는 질문 (FAQ)

OpenAI Jalapeño 칩은 언제 대규모로 사용 가능해지나요?

초기 프로토타입 배포는 2026년 말에 시작되며, 2027년 동안 물량이 확대되고, 2028년 상반기에 본격적인 생산이 이루어집니다.

Jalapeño는 Nvidia GPU에 비해 얼마나 더 저렴한가요?

Broadcom의 CEO Hock Tan은 추론 토큰 (inference token)당 비용이 약 50% 더 낮다고 주장합니다. OpenAI의 블로그는 "실질적으로 더 나은 와트당 성능 (performance-per-watt)"이라는 표현을 사용했습니다. 독립적인 벤치마크 (benchmarks)는 아직 발표되지 않았습니다.

AI가 정말로 이 칩을 설계했나요?

OpenAI 모델은 테스트벤치 (testbench) 생성, 검증 (verification), 그리고 타이밍 클로저 (timing closure) 과정을 가속화했습니다. 플로어플래닝 (floorplanning) 및 라우팅 (routing)과 같은 물리적 설계 (physical design) 작업은 여전히 사람이 주도했습니다.

원문 출처: TekMag.

AI 자동 생성 콘텐츠

원문 바로가기