AI 기술이 학습에서 추론으로 이동 중 — ON Semiconductor가 추론 분야의 Nvidia가 될 수 있는 이유 - Insights | Molayo

원문은 twarx.com에서 처음 게시되었습니다 - 전체 인터랙티브 버전은 그곳에서 읽을 수 있습니다.

최종 업데이트: 2026년 6월 21일

대부분의 AI 기술 워크플로우는 완전히 잘못된 문제를 해결하고 있습니다. 모든 이들이 어떤 칩이 다음 프런티어 모델 (Frontier Model)을 학습시킬지에 집착하고 있지만, AI 기술에서 이미 진행 중인 조 단위 달러 규모의 변화는 추론 (Inference) 지출이 곧 학습 지출을 압도할 것이라는 점입니다. 그리고 이를 포착할 준비가 된 기업들은 헤드라인이 찬양하는 기업들과는 전혀 다르게 생겼습니다. 이것이 현재 AI 기술에서 가장 중요한 재정의이며, 거의 아무도 이에 대한 예산을 세우고 있지 않습니다.

Yahoo Finance에 게시된 2026년 6월 20일자 Motley Fool 분석에 따르면, GPU 벤더가 아닌 전력 및 센싱 칩 제조사인 ON Semiconductor (NASDAQ: ON)가 'AI 추론의 Nvidia'가 될 수 있다고 주장합니다. 이 주장이 지금 중요한 이유는 추론이 일회성 자본 구축이 아니라, 영원히 확장되는 _운영 비용 (Operating Cost)_이기 때문입니다.

이 글의 끝에 도달할 때쯤 여러분은 재무적 측면, 이러한 현상이 발생하는 시스템 수준의 이유, 그리고 추론 경제학이 왜 모든 엔지니어링 팀의 구축 방식을 재편하려 하는지를 설명하는 프레임워크인 'AI 조정 격차 (AI Coordination Gap)'를 이해하게 될 것입니다.

ON Semiconductor power chips for AI data center inference and edge computing infrastructure

ON Semiconductor는 자사의 전력 및 센싱 포트폴리오를 하이퍼스케일러 (Hyperscaler) 데이터 센터와 에지 (Edge) 전반에 걸친 AI 추론 워크로드의 핵심 인프라로 포지셔닝하고 있습니다. 출처: The Motley Fool / Yahoo Finance

개요: 발표 내용 및 중요성

2026년 6월 20일 토요일 오후 11:20 GMT+2, Motley Fool의 기고자 Lee Samaha는 Yahoo Finance에 매우 단순해 보이지만 기발한 논점을 담은 분석을 게시했습니다. 즉, 향후 몇 년 동안 추론(Inference) 지출이 데이터 센터 인프라(Data center infrastructure) 지출을 추월함에 따라, 가장 큰 수혜자는 뻔한 GPU 제조사가 아니라 추론을 지속시키는 전력 반도체 (Power semiconductor) 기업이 될 수 있다는 것입니다.

이 논지는 전기차 (EV) 및 산업 시장에 공급되는 전력 및 센싱 칩으로 가장 잘 알려진 Nvidia의 파트너, ON Semiconductor (NASDAQ: ON)에 집중되어 있습니다. 보고서에 따르면, 이 회사의 데이터 센터 매출은 1분기에 30% 성장했으며, 2025년 총 매출 60억 달러 중 2억 5,000만 달러에 달했습니다. Samaha는 EV 시장의 변곡점과 개선되는 산업 최종 시장(Industrial end markets)을 근거로 ON을 '2026년에 매수해야 할 최고의 주식'으로 선정했으며, 그는 이 두 가지 요소가 모두 실현되었다고 기술했습니다.

다음은 투자자뿐만 아니라 엔지니어들에게도 뉴스 가치가 있는 차이점입니다. 이 기사는 **인프라 지출 (Infrastructure spending)**을 AI의 자본 예산 (Capital budget) — 즉, 하이퍼스케일러(Hyperscalers)가 데이터 센터를 구축하고 모델을 학습시키기 위해 일시적으로 쏟아붓는 비용 — 으로 규정합니다. 반면, 실제 사용을 위해 AI 모델을 실행하는 **추론 지출 (Inference spending)**은 지속적인 운영 비용 (Ongoing operating cost) 입니다. 기사에서 언급했듯이, 인프라가 초기에 구축된 후에는 '추론이 지출의 대부분을 차지하게 될 가능성이 높습니다.' 그리고 추론은 '전력 소모가 크고, 열 관리 (Thermal management)가 필요하며, 시간이 지남에 따라 필연적으로 규모가 커질 것'입니다.

30%
ON Semiconductor 1분기 데이터 센터 매출 성장률
[Yahoo Finance / Motley Fool, 2026](https://finance.yahoo.com/technology/ai/articles/company-could-become-nvidia-ai-212000227.html)
...

왜 전력 칩(power-chip) 이야기가 AI 기술 엔지니어링 간행물에 실려야 할까요? ON Semiconductor가 투자자들에게 매력적인 이유가 되는 바로 그 경제적 변화가, 오늘날 대부분의 팀이 AI 시스템을 설계하는 방식을 무너뜨리는 변화이기 때문입니다. 추론 (Inference)이 지배적이고 영구적인 비용이 될 때, 병목 현상은 '우리가 이것을 학습(Training)시킬 수 있는가?'에서 '수천 개의 모델 호출을 엣지(edge)와 클라우드(cloud)에서 신뢰할 수 있고 저렴하게, 서로 조율하며 실행할 수 있는가?'로 바뀝니다. 두 번째 문제는 거의 아무도 구조적으로 해결하지 못하고 있는 문제이며, 그 이름이 있습니다. 근본적인 칩 경제학에 대한 맥락은 Reuters Technology의 분석 보고서와 Nasdaq의 시장 데이터를 참조하십시오.

학습 (Training)은 한 번 지불하는 자본 지출 (CAPEX)입니다. 추론 (Inference)은 영원히 지불해야 하는 운영 비용 (OPEX)입니다. AI 산업 전체가 여전히 2023년처럼 예산을 편성하고 있습니다.

핵심 내용: ON Semiconductor와 추론 경제 (Inference Economy)를 쉬운 언어로 설명하자면

전문 용어를 걷어내 보겠습니다. 사람들이 'AI'라고 말할 때, 보통 다음 두 가지 활동이 결합된 모습을 상상합니다.

학습 (Training) — 모델을 가르치는 과정입니다. 엄청난 컴퓨팅 자원이 필요하며, 대규모 클러스터의 Nvidia GPU를 사용하여 일시적으로 폭발적인 연산이 일어납니다. 이를 공장을 짓는 과정이라고 생각하십시오.
추론 (Inference) — 학습된 모델을 사용하여 질문에 답하거나, 텍스트를 생성하거나, 이미지를 분류하거나, 에이전트 (agent)를 구동하는 과정입니다. 이는 사용자가 AI 기능과 상호작용할 때마다 매번 발생합니다. 24시간 내내 전기 요금을 내며 가동되는 공장과 같습니다.

Yahoo Finance 기사는 현재 산업이 '공장을 짓는' 단계에 있다고 주장합니다. 즉, 하이퍼스케일러 (hyperscalers)들이 데이터 센터에 자본을 쏟아붓고 있다는 것입니다. 하지만 일단 공장이 완공되면, 이를 '운영'하는 데 드는 반복적인 비용이 주도권을 잡게 되며 그 비용은 결코 멈추지 않고 성장합니다. 저는 소프트웨어 측면에서 이 과정이 전개되는 것을 직접 목격했습니다. 팀들은 학습 비용 때문에 고민하지만, 출시 후 추론 비용이 매 분기 두 배씩 늘어날 때 뒤통수를 맞는 격이 됩니다.

ON Semiconductor는 두뇌 역할을 하는 GPU를 만들지는 않습니다. 대신 이들은 **전력 공급 및 열 관리 관련 반도체 (power delivery and thermal-related semiconductors)**를 만듭니다. 즉, GPU에 전력을 공급하고 변환, 조절, 관리하며 GPU가 과열되어 녹아내리는 것을 방지하는 부품들을 제조합니다. 추론 (inference) 하드웨어의 모든 랙에는 이러한 부품이 더 많이 필요합니다. 추론 규모가 커질수록 전력 칩에 대한 수요도 함께 증가합니다. 이것이 바로 '추론 분야의 Nvidia'라는 논리입니다. 연산 (compute) 자체를 담당하는 것이 아니라, 연산을 안정적으로 실행하기 위한 '곡괭이와 삽 (picks-and-shovels, 인프라 필수 요소)' 역할을 한다는 것입니다. 더 광범위한 에너지 과제는 International Energy Agency (국제 에너지 기구)에 의해 잘 기록되어 있으며, 이들은 이번 10년 동안 데이터 센터의 전력 수요가 두 배로 증가할 것이라고 전망합니다.

이 회사의 영향력은 클라우드보다 더 넓습니다. 기사에 따르면, 이들의 기회는 '하이퍼스케일러 데이터 센터, 기업, 그리고 에지 추론 (edge inference)을 포함한 다양한 환경'에 걸쳐 있습니다. 이는 AI가 거대한 데이터 센터뿐만 아니라 기기, 공장 바닥, 차량 및 로컬 서버에서도 실행된다는 것을 의미합니다. 이 더 넓은 지형에 대해 더 자세히 알고 싶다면, 당사의 AI 인프라 (AI infrastructure) 트렌드 개요를 참조하십시오.

ON의 데이터 센터 매출은 여전히 미미합니다. 60억 달러 중 2억 5천만 달러로, 매출의 약 4% 수준입니다. 낙관적인 전망 (bull case)은 현재의 수치가 아니라 그 궤적에 있습니다. 즉, 배포된 모든 추론 워크로드와 함께 복리로 성장하는 세그먼트에서 1분기 30%의 성장을 기록했다는 점입니다.

새롭게 명명된 프레임워크

AI 조정 격차 (The AI Coordination Gap)

AI 조정 격차 (AI Coordination Gap)란 조직이 유능한 AI 구성 요소를 '구축 (build)'하는 능력과, '추론 시점에 이를 함께, 안정적으로, 그리고 저렴하게 실행 (run them together, reliably, and affordably at inference time)'하는 능력 사이의 벌어지는 간극을 의미합니다. 이는 왜 팀들이 인상적인 데모를 선보임에도 불구하고, 실제 환경의 추론 부하, 비용 및 오케스트레이션 (orchestration) 복잡성 앞에서 무너지는지를 설명하는 용어입니다.

Diagram comparing one-time AI training capital expense versus recurring inference operating expense over time

이 뉴스의 핵심에 있는 경제적 교차점은 다음과 같습니다: 학습 (training)은 자본의 급증(capital spike)인 반면, 추론 (inference)은 상승하는 운영 곡선(operating curve)입니다. AI 조정 격차 (AI Coordination Gap)는 전적으로 추론 측면에 존재합니다. 출처: Yahoo Finance / Motley Fool

작동 원리: 추론 스택 (Inference Stack)과 조정 격차 (Coordination Gap)

전력 반도체와 오케스트레이션 소프트웨어 (orchestration software)가 왜 동전의 양면인지 이해하려면, 전자 (electron)에서 에이전트 (agent)에 이르는 전체 추론 스택을 보아야 합니다. 그 흐름은 다음과 같습니다.

전체 스택 추론 파이프라인: 전력 칩에서 조정된 에이전트까지

  1

    **전력 및 열 계층 (Power & Thermal Layer) (ON Semiconductor)**

전력 반도체는 GPU/가속기 랙을 위해 전압을 조절하고 열을 관리합니다. 입력: 그리드 전력. 출력: 컴퓨팅을 위한 깨끗하고 밀도 높으며 효율적인 전력. 이것은 모든 추론 호출의 물리적 기반입니다.

↓

  2
...

모델의 순전파 (forward pass)를 실행합니다. 지연 시간 (latency)에 매우 민감합니다. 여기서의 토큰당 비용 (cost-per-token)은 추론을 사용량에 따라 확장되는 운영 비용 (operating expense)으로 만드는 요소입니다.

↓

  3
...

요청을 배치 (batch) 처리하고, KV 캐시 (KV cache)를 관리하며, 가장 저렴하고 실행 가능한 모델로 라우팅합니다. 대부분의 실제 추론 비용 절감이 발생하는 지점입니다.

↓

  4
...

Pinecone, pgvector 또는 유사한 기술이 각 호출 전에 관련 컨텍스트 (context)를 가져옵니다. 이는 환각 (hallucination)을 줄이고 거대한 프롬프트 (prompt)를 피함으로써 토큰 비용을 절감합니다.

↓

  5
...

여러 모델 호출을 워크플로 (workflow) 또는 멀티 에이전트 시스템 (multi-agent system)으로 조정합니다. 이곳이 바로 AI 조정 격차 (AI Coordination Gap)가 문제를 일으키는 지점입니다: 신뢰성은 단계들을 따라 _하향식_으로 복합적으로 작용합니다.

↓

  6
...

에이전트가 도구와 데이터에 접근하는 방식을 표준화합니다. Anthropic의 MCP는 조정된 시스템이 여러 벤더에 걸쳐 확장될 수 있도록 하는 연결 조직 (connective tissue)이 되어가고 있습니다.

이 순서는 매우 중요합니다. 비용과 신뢰성은 하향식 (전력, 컴퓨팅)으로 결정되지만, 실패는 상향식 (오케스트레이션)으로 체감되기 때문입니다. ON Semiconductor는 레이어 1에서 활동하며, 엔지니어들은 레이어 5~6에서 조정 격차 (Coordination Gap)와 싸웁니다.

대부분의 팀이 너무 늦게, 보통은 이미 제품을 출시한 후에야 발견하게 되는 직관에 반하는 진실이 있습니다. 바로 각 단계의 신뢰도가 97%인 6단계 파이프라인의 전체 신뢰도는 약 83%에 불과하다는 점입니다 (0.97⁶ ≈ 0.833). 여기에 더 많은 에이전트(Agent), 더 많은 도구 호출(Tool call), 더 많은 모델 점프(Model hop)가 추가될수록 신뢰도는 급격히 추락합니다. 이것이 바로 하나의 방정식으로 표현된 AI 조정 격차 (AI Coordination Gap)입니다. 이러한 모든 점프는 추론 호출 (Inference call)이며, 이는 조정 격차가 단순한 신뢰도 문제만이 아님을 의미합니다. 그것은 비용 증폭기 (Cost-amplifier)입니다. 조정 실패는 시스템이 고장 났다는 것을 누군가 알아차리기도 전에 재시도 (Retry) 과정에서 돈을 낭비하게 만듭니다. 이러한 복리적 오류 (Compounding-error) 역학은 arXiv의 학술 연구에서도 점점 더 많이 기록되고 있습니다.

정립된 프레임워크

AI 조정 격차 (The AI Coordination Gap)

신뢰도는 더해지는 것이 아니라 곱해집니다. 97% 신뢰도를 가진 개별 구성 요소와 97% 신뢰도를 가진 '시스템' 사이의 격차는 프로덕션 AI (Production AI)에서 가장 비용이 많이 드는 사각지대이며, 추가되는 모든 추론 호출에 따라 그 규모가 커집니다.

전체 역량 목록: ON의 추론 포지셔닝이 실제로 제공하는 것

보고서와 ON의 공개적인 포지셔닝에 엄격히 근거하여, 이 회사가 추론 경제 (Inference economy)에 가져다주는 가치는 다음과 같습니다:

AI 기술이 학습에서 추론으로 이동 중 — ON Semiconductor가 추론 분야의 Nvidia가 될 수 있는 이유

요약

핵심 포인트

개요: 발표 내용 및 중요성

핵심 내용: ON Semiconductor와 추론 경제 (Inference Economy)를 쉬운 언어로 설명하자면

AI 조정 격차 (The AI Coordination Gap)

작동 원리: 추론 스택 (Inference Stack)과 조정 격차 (Coordination Gap)

AI 조정 격차 (The AI Coordination Gap)

전체 역량 목록: ON의 추론 포지셔닝이 실제로 제공하는 것

댓글