본문으로 건너뛰기

© 2026 Molayo

HN분석2026. 06. 25. 03:47

OpenAI, Broadcom과 협력하여 제작한 첫 번째 맞춤형 칩 공개

요약

OpenAI가 Broadcom과 협력하여 맞춤형 추론 프로세서인 'Jalapeño'를 공개했습니다. 이 칩은 OpenAI 모델의 추론 워크로드에 최적화되어 전력 대비 성능이 뛰어나며, Nvidia GPU 의존도를 낮추고 운영 비용을 절감하는 것을 목표로 합니다.

핵심 포인트

  • Broadcom과 협력하여 맞춤형 추론 칩 'Jalapeño' 설계 및 제조
  • 기존 최첨단 대안 대비 우수한 전력 대비 성능(performance-per-watt) 확보
  • Nvidia GPU 의존도 완화 및 AI 추론 비용 절감을 통한 수익성 개선
  • 모델 개발부터 인프라(칩, 커널, 메모리 등)까지 수직 계열화 추진

수요일, OpenAI는 Broadcom과의 협력을 통해 설계 및 제조된 첫 번째 맞춤형 추론 프로세서(inference processor)를 공개했습니다. Jalapeño라고 명명된 이 새로운 프로세서는 OpenAI의 추론 시스템의 고유한 요구 사항에 맞춰 특별히 설계되었습니다. OpenAI는 자사의 AI 모델이 칩 개발을 지원했다고 밝혔습니다.

이 칩은 아직 테스트 단계에 있지만, OpenAI는 초기 결과가 현재의 최첨단 대안들보다 전력 대비 성능(performance-per-watt) 면에서 현저히 우수함을 보여준다고 말했습니다.

이번 파트너십은 지난 10월 공식적으로 발표되었으나, OpenAI의 칩 계획은 Nvidia의 GPU에 대한 의존도를 낮추기 위한 방안으로 오랫동안 소문이 돌았습니다. Google과 Amazon 모두 유사한 목적을 위해 맞춤형 칩을 구축해 왔으며, 이는 흔히 머신러닝(machine learning) 워크로드를 가속화하기 위해 특별히 설계된 실리콘인 "AI 가속기(AI accelerators)"라고 불립니다.

OpenAI의 사장인 Greg Brockman은 Broadcom과의 파트너십이 발표된 직후, 사내 팟캐스트에서 회사의 칩 개발 접근 방식을 설명했습니다.

Brockman은 해당 에피소드에서 "우리는 워크로드에 대해 깊이 이해하고 있습니다"라고 말했습니다. "우리는 정말로 서비스가 충분히 제공되지 않는 특정 워크로드를 찾아왔으며, [질문하며] 어떻게 하면 가능한 것을 가속화할 수 있는 무언가를 만들 수 있을지 고민해 왔습니다."

Jalapeño는 사용자 명령에 대응하여 사전 구축된 AI 모델을 실행하는 과정인 추론(inference)을 위해 특별히 설계되었습니다. 발표에서 OpenAI는 실시간 코딩 모델을 실행할 때 이 칩의 낮은 운영 비용을 강조했습니다. 사전 학습(pre-training)과 같이 더 높은 성능을 요구하는 작업은 여전히 Nvidia 하드웨어에 의존할 가능성이 높지만, 추론 비용의 작은 감소만으로도 회사의 수익성을 개선하는 데 큰 도움이 될 수 있습니다.

그러한 추론 (inference) 시스템을 최적화하는 것은 향후 AI 경제성 측면에서 결정적인 요소가 될 수 있으며, 이는 스택 (stack)의 모든 계층에서 이루어질 가능성이 높습니다. OpenAI는 이미 Codex와 같은 에이전트형 (agentic) 제품과 이를 구동하는 모델뿐만 아니라, 해당 모델들을 실행하기 위한 데이터 센터 (data center)를 구축하고 있습니다. 발표에서 회사가 설명했듯이, 목적 맞춤형 칩 (purpose-built chips) 분야로 진출함으로써 회사는 그 과정을 더욱 심화할 수 있습니다.

"OpenAI는 프런티어 모델 (frontier models)을 개발하거나 그 위에 제품을 구축할 뿐만 아니라, 그 밑단의 인프라(infrastructure)를 설계하고 있습니다: 칩 아키텍처 (chip architecture), 커널 (kernels), 메모리 시스템 (memory systems), 네트워킹 (networking), 스케줄링 (scheduling), 배포 시스템 (deployment systems), 그리고 제품 경험 (product experience)까지 포함됩니다."라고 회사는 밝혔습니다. "OpenAI는 스택 전체에 걸쳐 운영되기 때문에, 각 계층은 모델을 더 빠르고, 더 신뢰할 수 있으며, 사용자들에게 더 저렴하게 제공한다는 동일한 목표를 중심으로 최적화될 수 있습니다."

AI 자동 생성 콘텐츠

본 콘텐츠는 HN AI Posts의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0