AI 투자 스택 (The AI Investment Stack)
요약
AI 경제를 실리콘부터 애플리케이션까지 7개의 계층으로 구분하여 분석한 보고서입니다. 각 계층의 마진 구조, 경쟁 역학, 그리고 지속 가능한 가격 결정력을 평가하여 투자 관점에서의 핵심 통찰을 제공합니다.
핵심 포인트
- AI 경제는 7개의 계층(실리콘, 메모리, 패키징, 제조, 에너지, 클라우드, 앱)으로 구성됨
- 계층별 공급 가능성과 구축 속도에 따라 수익성과 범용화 여부가 결정됨
- NVIDIA는 CUDA를 통해 강력한 해자를 구축하며 고객 기반을 확장 중
- 양자 컴퓨팅 및 맞춤형 실리콘 등 기술 변화가 계층별 중요도를 재편할 수 있음
AI 경제는 근본적으로 다른 경쟁 역학을 가진 7개의 계층으로 구성된 스택입니다. 하이퍼스케일러 (Hyperscaler)의 자본 지출 (CapEx)로 7,250억 달러 이상이 투입되었습니다. 이 글은 현재 데이터를 바탕으로 각 계층을 매핑하고, 중요한 기업들의 이름을 명시하며, 지속 가능한 가격 결정력 (Pricing power)이 어디에 존재하는지 식별하고, 어떤 계층이 실질적인 파괴적 혁신 (Disruption) 위험에 직면해 있는지 평가합니다. 이 글은 2026년 2월에서 6월 사이에 발표된 300개 이상의 보고서를 바탕으로 작성되었습니다.
AI 투자에 대해 가장 흔히 던지는 질문은 AI에 투자해야 하는가 하는 점입니다. 하지만 이 질문은 잘못되었습니다. 하이퍼스케일러 (Hyperscaler)의 자본 지출 (CapEx)로 7,250억 달러 이상이 이미 투입되었습니다. 베팅은 이미 이루어졌습니다. 이제 질문은 수익이 어디로 집중되느냐가 되어야 합니다.
AI 경제는 아래에서 위로 실리콘 (Silicon), 메모리 (Memory), 패키징 및 상호 연결 (Packaging and interconnect), 제조 (Manufacturing), 에너지 (Energy), 클라우드 인프라 (Cloud infrastructure), 그리고 애플리케이션 (Applications)이라는 7개의 계층으로 구성된 스택입니다. 각 계층은 서로 다른 공급업체, 서로 다른 마진 구조, 그리고 서로 다른 경쟁 역학을 가지고 있습니다. 대부분의 투자자들은 이 스택을 하나의 거래 (Single trade)로 취급합니다. 어떤 계층은 수십 년 동안 막대한 수익을 창출할 것이지만, 다른 계층은 5년 이내에 범용화 (Commoditized)될 것입니다. 그 차이는 단 하나의 변수, 즉 얼마나 많은 기업이 해당 계층을 공급할 수 있는지, 그리고 새로운 공급을 구축하는 데 얼마나 오래 걸리는지에 달려 있습니다.
하지만 지속 가능한 경쟁 우위를 식별하는 것은 분석의 절반에 불과합니다. 시장은 지난 3년 동안 AI 거래 (AI trade)에 대한 가격 책정을 진행해 왔습니다. 어떤 계층은 이미 수십 년간의 지배력을 가정하는 배수 (Multiples)로 거래되고 있습니다. 반면 어떤 계층은 AI 사이클이 그저 또 다른 호황과 불황 (Boom-bust)의 반복일 것이라고 가정하며 할인된 가격에 거래되고 있습니다. 기술은 계속해서 움직입니다. 양자 컴퓨팅 (Quantum computing), 맞춤형 실리콘 (Custom silicon), 오픈 소스 모델 (Open-source models), 그리고 새로운 에너지원들은 모두 어떤 계층이 중요해질지를 재편할 수 있는 일정에 따라 발전하고 있습니다.
이 글은 현재 데이터를 바탕으로 각 계층을 매핑하고, 중요한 기업들의 이름을 명시하며, 지속 가능한 가격 결정력 (pricing power)이 어디에 존재하는지 식별하고, 시장이 이미 가격에 반영한 것이 무엇인지 평가하며, 어떤 계층이 진정한 파괴적 혁신 (disruption) 위험에 직면해 있는지 평가합니다. 이 글은 2026년 2월부터 6월 사이에 The Synthesis에 게시된 300개 이상의 보고서를 바탕으로 작성되었으며, 각 보고서는 AI 인프라 구축 과정에서의 특정 데이터 포인트를 분석했습니다. 해당 항목들은 가공되지 않은 관찰 결과이며, 이것이 바로 그 종합(synthesis)입니다.
계층 1: 실리콘 (Silicon)
NVIDIA는 2026년 5월에 분기 매출 816억 달러를 기록했다고 보고했습니다. 데이터 센터 매출의 절반은 이제 기존 5대 하이퍼스케일러 (hyperscalers) 이외의 고객으로부터 발생합니다 (제2의 고객). 고객 기반이 확장되고 있으며, 이 확장이 바로 핵심 논지 (thesis)입니다.
GPU의 지배력은 실재하지만, 그 밑단의 아키텍처 (architecture)는 변화하고 있습니다. NVIDIA의 해자 (moat)은 CUDA로, 이는 자사의 하드웨어를 AI 워크로드 (workloads)의 기본값으로 만드는 소프트웨어 계층입니다. 6개의 하이퍼스케일러는 Broadcom에 자신들의 특정 추론 (inference) 요구 사항에 맞춘 맞춤형 실리콘 (custom silicon) 설계를 요청했습니다. Broadcom은 이러한 설계로부터 106%의 AI 매출 성장을 보고했으며, 730억 달러의 수주 잔고 (backlog)와 2027년까지 연간 1,000억 달러의 AI 칩 매출 달성을 목표로 하고 있습니다. 맞춤형 ASIC 출하량은 전년 대비 44.6% 성장하고 있으며, 이는 범용 GPU (merchant GPUs)의 성장률인 16.1%의 거의 세 배에 달합니다. 맞춤형 경로가 NVIDIA를 대체하는 것은 아닙니다. 이는 과거 단일 채널을 통해 흐르던 수요를 파편화 (fragment)하는 것입니다.
AMD는 단일 분기에 58억 달러라는 기록적인 데이터 센터 매출을 기록하며, 시장이 제2의 공급업체를 수용할 수 있음을 증명했습니다. AMD는 하이퍼스케일러들에게 NVIDIA와의 협상에서 레버리지 (leverage)를 제공하며, NVIDIA의 공급이 제한될 때 대안을 제공합니다. AMD에 대한 투자 논거는 지배적인 것이 아니라, 필수적인 존재라는 점에 기반합니다.
Cerebras는 첫 거래일에 IPO 가격의 거의 두 배인 350달러로 시작했으며, 2025년 매출 5억 1,000만 달러와 47%의 순이익률 (net margin)을 기록했습니다. 목적 기반 추론 하드웨어 (Purpose-built inference hardware)는 컴퓨팅 믹스 (compute mix)가 변화할 것이라는 데 거는 베팅입니다. 2023년에는 추론 (Inference)이 AI 컴퓨팅의 3분의 1을 소비했습니다. 2026년 말까지는 3분의 2를 소비하게 될 것입니다 (The Inference Layer). 2025년 12월 NVIDIA가 Groq를 200억 달러에 인수한 것은 가장 강력한 추론 경쟁사를 흡수하는 동시에 그 기술을 통합한 방어적인 신의 한 수였습니다. 이 인수 가격은 추론 전문화 (inference specialization)가 실질적인 위협임을 확인시켜 줍니다.
NVIDIA는 2026년 6월 Computex에서 RTX Spark와 함께 PC 칩 시장에 진입했습니다. 이는 커스텀 Grace CPU와 Blackwell GPU, 그리고 128GB 통합 메모리 (unified memory)를 결합한 Arm 기반 슈퍼칩입니다. Dell, HP, Lenovo, ASUS, Microsoft가 출시 파트너로 참여합니다. 이 움직임은 다각화처럼 보이지만, 실제로는 해자 확장 (moat extension)입니다. 만약 모든 개발자의 노트북에서 CUDA가 네이티브로 실행된다면, 모든 개발자는 기본적으로 CUDA 네이티브 코드를 작성하게 될 것이며, 이는 데이터 센터 GPU에 대한 락인 (lock-in) 효과를 심화시킵니다. 3세대 로드맵 (Spark, 그 다음 LPDDR6를 탑재한 Rubin, 그 다음 Rosa Feynman)은 장기적인 의지를 나타냅니다.
시장이 가격에 반영한 것: NVIDIA는 선행 수익 (forward earnings) 기준 약 25배에 거래되고 있습니다. 이는 연간 수익이 25~35% 성장하는 기업치고는 역설적으로 저렴한 수준입니다. PEG 배율 (PEG ratio)은 0.9배 근처에 머물러 있습니다. 매출 기대치는 이미 가격에 완전히 반영되어 있습니다. 하지만 멀티플 (multiple)은 실제 수익 성장 대비 압축되었으며, 이로 인해 성장 조정 기준으로는 65배의 AMD나 50배의 Marvell보다 주가가 덜 비싼 설정이 만들어졌습니다. 시장의 컨센서스 (consensus)는 한계 AI 달러가 다각화된 실리콘 공급업체로 흐른다는 것이며, 이는 AMD의 131% 급등에 비해 NVIDIA가 연초 대비 8%라는 완만한 상승을 기록한 이유를 설명해 줍니다. 선행 수익 31배의 Broadcom은 맞춤형 실리콘 (custom silicon) 분야에서 가장 유리한 위치를 점하고 있습니다.
가치가 축적되는 곳: CUDA가 학습 표준으로 남아 있는 한 NVIDIA는 가격 결정력 (pricing power)을 유지합니다. 맞춤형 실리콘 (Custom silicon, Broadcom, Marvell)은 추론 마진 (inference margin)을 확보합니다. AMD는 제2 공급원 프리미엄 (second-source premium)을 가져갑니다. 진짜 리스크는 추론 경제성 (inference economics)이 학습 경제성 (training economics)이 확장되는 속도보다 더 빠르게 압축되어, 전체 마진 풀 (margin pool)이 줄어드는 것입니다.
파괴적 혁신 리스크: 중간 (Medium). 맞춤형 ASIC은 이미 점유율을 확보하고 있으며, 3년 전에는 미미했던 수준에서 2026년에는 AI 서버 출하량의 28%에 도달할 것으로 예상됩니다. Google은 Gemini 추론의 75% 이상을 자체 TPU에서 실행합니다. AWS는 Bedrock 토큰 처리량의 50% 이상을 Trainium으로 처리합니다. 하지만 NVIDIA의 대응 전략은 효과를 거두고 있습니다. Groq 인수, AI 가속 칩 설계를 위한 20억 달러 규모의 Synopsys 투자, 그리고 RTX Spark 플랫폼 확장은 축소되는 입지를 방어하기보다 경쟁사를 흡수하고 인접 시장으로 확장하는 기업의 모습을 보여줍니다. NVIDIA의 GPU 시장 점유율은 약 87%에서 75%로 하락했지만, 데이터 센터 매출이 1분기에만 752억 달러에 달할 정도로 시장이 매우 빠르게 성장하고 있습니다. RISC-V가 데이터 센터에서 유의미해지려면 아직 10년은 더 남았으며, 단기적인 영향은 엣지 AI (edge AI)와 중국의 소버린 컴퓨팅 (sovereign computing)에 국한됩니다.
레이어 2: 메모리 (Memory)
메모리 과점 체제는 GPU 독점 체제보다 더 지속적인 가격 결정력을 보유하고 있습니다 (The Input Tax). Samsung, SK Hynix, Micron은 AI 가속기에 들어가는 거의 모든 고대역폭 메모리 (HBM, high-bandwidth memory)를 제조합니다. 대체재가 없으며, 새로운 진입자도 보이지 않습니다. HBM 공급업체의 인증 주기 (qualification cycles)는 18개월에서 2년이 소요됩니다. 새로운 HBM 팹 (fab)을 건설하기 위한 자본 지출 (capital expenditure)은 150억~200억 달러에 달합니다. 진입 장벽은 물리적, 재무적, 그리고 시간적입니다.
2026년에 제조되는 모든 메모리 칩의 70%가 데이터 센터로 향할 것입니다. 이러한 밀려남(crowding-out) 현상은 가전제품의 경제 구조를 다시 써 내려갔습니다. 스마트폰에 들어가는 것과 동일한 DRAM이 이제는 AI 서버에서 더 필요로 하기 때문에 프리미엄이 붙게 되었습니다. HBM 가격이 상승함에 따라 일반 DRAM 가격도 동일한 수요에 이끌려 함께 상승하고 있습니다.
이 수요는 주기적인 것이 아니라 지속적입니다. AI는 아시아의 경제 지형을 다시 쓰고 있는 메모리 반도체 슈퍼 사이클(super-cycle)을 촉발했습니다. Samsung의 최대 노조는 2026년 5월에 18일간의 파업 기간을 설정했습니다. 한국 법원은 파업을 금지하지 않았습니다. 대신, 반도체 제조를 필수 서비스로 재정의했습니다. 이 법적 도구는 노동 분쟁보다 더 중요합니다. 이는 메모리 생산이 이제 국가에 의해 핵심 인프라(critical infrastructure)로 취급된다는 것을 확인시켜 줍니다. Samsung은 전 분기 대비 43% 증가한 133.9조 원의 기록적인 1분기 매출을 기록했으며, 영업 이익은 185% 증가한 57.2조 원을 달성했습니다.
스토리지(Storage)는 가격이 재조정될 마지막 AI 인프라 계층입니다. GPU가 가장 먼저 움직였습니다. 메모리가 그 뒤를 이었습니다. 네트워킹(Networking)은 사이클의 중간 단계에 있습니다. 하지만 학습(training) 실행과 추론(inference) 워크로드에 의해 생성된 데이터는 어딘가에 저장되어야 합니다. 모든 엑사바이트(exabyte) 단위의 학습 데이터, 모든 체크포인트(checkpoint), 모든 모델 아티팩트(model artifact)는 아직 스토리지 가치 평가(valuation)에 완전히 반영되지 않은 스토리지 수요 신호입니다.
시장이 반영한 가격: 이것은 전체 AI 스택(AI stack)에서 발생하는 가장 큰 펀더멘털 가치 평가(fundamental-valuation)의 괴리입니다. SK Hynix는 기록적인 매출과 이익에도 불구하고 선행 수익(forward earnings)의 56배 수준에서 거래되고 있습니다. Samsung은 67배 수준입니다. Micron은 선행 수익의 약 10배 수준에서 거래되며 PEG 비율은 0.2배에 가깝습니다. 이는 이 지표를 기준으로 볼 때 통계적으로 가장 저평가된 대형 반도체 기업입니다. 시장은 여전히 이들을 이전 DRAM 사이클의 호황과 불황(boom-bust) 템플릿을 적용하는 경기 순환형 메모리 주식으로 가격을 책정하고 있습니다. 5월 25일자 CNBC 헤드라인은 이러한 공통된 공포를 잘 보여줍니다: "메모리 주식의 호황과 불황 사이클을 주의하라." 만약 HBM 슈퍼사이클(HBM supercycle)이 지속 가능한 것으로 증명된다면(18개월의 퀄리피케이션(qualification) 장벽과 대체재가 없다는 점을 고려할 때 증거는 이를 뒷받침합니다), 이러한 멀티플(multiple)은 심각하게 잘못 책정된 것입니다. Samsung과 SK Hynix는 추가적인 이익 성장 없이 오직 멀티플 재평가(re-rating)만으로도 두 배로 상승할 수 있습니다.
가치가 축적되는 지점: HBM은 이 스택에서 가장 명확한 과점(oligopoly) 시장입니다. 세 개의 공급업체, 대체재 없음, 다년간의 퀄리피케이션(qualification) 사이클. 투자 논거는 특정 기업의 승리가 아니라 시장의 형태에 달려 있습니다: 적은 판매자, 많은 구매자, 그리고 신규 공급에 대한 물리적 제약입니다. SK Hynix는 HBM 수율(yield) 측면에서 앞서 나가고 있습니다. Samsung은 생산 능력(capacity) 측면에서 앞서 있습니다. Micron은 순수 서구권 옵션입니다. 세 기업 모두 동일한 순풍(tailwind)의 혜택을 입습니다.
파괴적 혁신 위험(Disruption risk): 낮음, 그리고 존재하는 위험은 기존 기업들에게 이득이 됨. Samsung과 SK Hynix는 JEDEC을 통해 LPDDR6-PIM (processing-in-memory)을 공동 표준화하고 있으며, Samsung은 기존 HBM 대비 2배의 성능 향상과 70%의 전력 감소를 주장하고 있습니다. PIM을 HBM 로직 다이(logic die)에 통합하는 것은 2027-2028년경으로 예상되며, 이를 통해 메모리 스택 자체 내에서 AI 연산이 수행될 것입니다. 이는 아키텍처의 파괴적 혁신이 기존 기업들의 입지를 강화하는 드문 사례입니다. 메모리 제조사들은 범용 제품(commodity) 공급업체에서 컴퓨팅 아키텍트(compute architects)로 가치 사슬(value chain)의 상단으로 이동하고 있습니다. PIM은 실제로 NVIDIA가 독점적인 메모리 관리 기술에 대해 부과하는 프리미엄을 낮추어, 레버리지(leverage)를 메모리 과점 체제로 이동시킬 수 있습니다. 전자식 메모리를 완전히 우회하는 광학 컴퓨팅(Optical computing)은 여전히 10년 이상의 연구 과제로 남아 있습니다.
레이어 3: 패키징 및 인터커넥트 (Packaging and Interconnect)
AI 스택의 가치는 칩 설계에서 물리적 패키징과 메모리(The Interposer)로 이동했습니다. 현대적인 AI 가속기는 시스템 인 패키지(system-in-package)입니다. GPU 다이(dies), HBM 스택, 인터포저(interposers), 그리고 서브스트레이트(substrates)가 마이크론(micron) 단위의 공차로 조립됩니다. 패키징 단계는 수율(yield)이 비용을 결정하는 지점이며, 수율은 축적하는 데 수년이 걸리는 제조 경험에 달려 있습니다.
TSMC의 CoWoS (Chip-on-Wafer-on-Substrate) 첨단 패키징은 얼마나 많은 AI 가속기를 생산할 수 있는지를 결정하는 구속 요인(binding constraint)입니다. NVIDIA는 더 많은 칩을 설계할 수 있습니다. 하지만 CoWoS 용량이 허용하는 것보다 더 빠르게 패키징할 수는 없습니다. Amkor와 ASE가 다른 주요 패키징 공급업체들이지만, 칩 제조 공정과의 통합 측면에서 TSMC를 따라올 수 있는 곳은 없습니다.
네트워킹 (Networking) 분야에서도 동일한 이동이 일어나고 있습니다. 모든 AI 광 트랜시버 (Optical transceiver)에는 인듐 인화물 (Indium phosphide) 레이저 칩이 필요하며, 수요는 공급을 거의 3대 1의 비율로 초과하고 있습니다. 2026년 3월 단 일주일 만에 40억 달러가 광학 (Photonics) 기업들로 유입되었습니다. Cisco는 기록적인 매출을 발표했으며, AI 인프라 가이던스를 80% 상향 조정했습니다. 네트워킹 계층은 "곡괭이와 삽 (Picks and shovels)" 이론이 유효한 지점인데, 이는 광학 부품들이 단순한 수요 급증이 아닌 실질적인 물리적 공급 제약에 직면해 있기 때문입니다.
가장 적은 관심을 받는 병목 지점(Chokepoint)은 성숙 공정 (Mature semiconductor node)입니다. 3nm 및 2nm를 향한 경쟁이 헤드라인을 장식하고 있습니다. 하지만 AI 인프라의 실제 병목 구간은 전력 관리 칩 (Power management chips), 네트워킹 ASIC, 그리고 센서 IC가 제조되는 28nm 공정입니다. 이러한 부품들은 모든 서버, 모든 스위치, 모든 전력 공급 시스템에 들어갑니다. 성숙 공정 용량에 대한 수요는 공급 확대를 앞질렀는데, 이는 자본 투자가 선단 공정 (Leading edge)을 따라가기 때문입니다. 글로벌 성숙 공정 생산량 중 중국의 점유율은 2024년 25%에서 2028년까지 42%로 상승할 것으로 예상되며, 이는 GlobalFoundries 및 UMC와 같은 비중국계 성숙 공정 파운드리 (Fabs)의 마진을 압박할 것입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기