X요약2026. 06. 25. 01:57

모두가 OpenAI의 해자(Moat)가 AI 거대 모델이라고 생각했지만, 오늘 그들은 진정한 승부처가 실리콘 칩 안에 있음을 증명했습니다.

요약

OpenAI가 Broadcom과 협력하여 추론 전문 AI 칩인 'Jalapeño'를 공개했습니다. 이는 NVIDIA 의존도를 낮추고 모델부터 하드웨어까지 직접 통제하는 풀스택 전략의 일환입니다.

핵심 포인트

추론 전용 칩 Jalapeño를 통해 와트당 성능 극대화
LLM을 활용한 칩 설계로 개발 주기(Tape-out)를 9개월로 단축
추론 비용 절감을 통한 비즈니스 수익성 확보 전략
하드웨어와 AI가 서로를 강화하는 자가 순환 구조 구축

모두가 OpenAI의 해자(Moat)가 AI 거대 모델(Large Language Model)이라고 생각했지만,
오늘 그들은 진정한 승부처가 실리콘 칩(Silicon) 안에 있음을 증명했습니다.

Broadcom(브로드컴)과 협력하여 설계부터 테이프아웃(Tape-out)까지 9개월 만에,
거대 모델 추론(Inference)을 전문으로 하는 첫 번째 자체 개발 AI 칩 Jalapeño를 선보였습니다.

학습(Training)은 하지 않고, 오직 사용자와의 대화 시 응답 계산만을 담당하며,
와트당 성능(Performance per watt)은 현재 가장 앞선 수준보다 명확히 우수합니다.
몇 가지 상식에 반하는 결론을 여러분과 공유하고자 합니다.

첫 번째 상식에 반하는 점은,
왜 더 멋진 학습용 칩이 아닌 추론용 칩을 먼저 선택했는가 하는 점입니다.
학습은 일회성으로 비용을 쏟아붓고 나면 끝나는 것이지만,
추론은 매일 수억 명의 사용자가 지속적으로 소비하는 진정한 비용의 핵심입니다.

추론 비용을 30%에서 50%까지 낮출 수 있다면, 규모가 커졌을 때 이는 천문학적인 이익으로 돌아옵니다.
이것이 사실 가장 실무적인 비즈니스 선택입니다.

두 번째 상식에 반하는 점은,
9개월 만의 테이프아웃(Tape-out)이 무엇을 의미하는가 하는 점입니다.
전통적인 고성능 칩의 경우 2~3년이 정상적인 설계 주기입니다.
그들은 거대 모델(LLM)을 사용하여, 거대 모델을 구동할 칩의 설계를 보조했습니다.
AI가 AI 하드웨어를 만드는 자가 순환(Self-loop) 구조가 일단 작동하기 시작하면,
반도체 전체의 반복 주기(Iteration speed)가 완전히 다시 쓰여질 것입니다.

가장 본질적인 전략적 의도는
OpenAI가 더 이상 NVIDIA(엔비디아)의 거대 고객으로 남고 싶어 하지 않는다는 것입니다.
그들은 실리콘 칩부터 모델, 제품에 이르기까지 모든 것을 스스로 통제하는 풀스택(Full-stack) 경로를 걷고자 합니다.
쉽게 말해, 누가 하층부의 연산 능력(Computing power)을 장악하느냐가 가격 결정권과 이익 공간을 장악하는 길입니다.
모델 가중치(Weight)도 중요하지만, 연산 능력에 대한 발언권 또한 치명적으로 중요합니다.

이전에는 인간이 하드웨어를 만들고 하드웨어가 AI를 구동했다면,
앞으로는 AI가 인간을 도와 더 나은 하드웨어를 만들고, 그 하드웨어가 다시 더 강력한 AI를 구동하게 됩니다.
이러한 자기 강화(Self-reinforcement)의 순환이야말로 진정한 특이점(Singularity)의 서막입니다.

AI 자동 생성 콘텐츠

원문 바로가기

모두가 OpenAI의 해자(Moat)가 AI 거대 모델이라고 생각했지만, 오늘 그들은 진정한 승부처가 실리콘 칩 안에 있음을 증명했습니다.

요약

핵심 포인트

댓글