Intel Xeon 6+ Computex 라운드테이블 인터뷰 녹취록 — Kira Boyko와 Tim Wilson이 말하는 18A 웨이퍼 할당 - Insights | Molayo

Intel은 타이베이에서 열린 Computex 2026에서 Xeon 6+ "Clearwater Forest" 프로세서를 출시했으며, 월요일에는 해당 제품을 담당하는 두 명의 관계자가 기자들과 만나 질문에 답하는 자리를 가졌습니다. Intel 데이터 센터 그룹(Data Center Group)의 E-Core Xeon 제품 담당 제품 라인 디렉터(Product Line Director)인 Kira Boyko가 세션을 주도했으며, Intel 데이터 센터 실리콘 엔지니어링(Data Center Silicon Engineering) 그룹의 부사장 겸 총괄 매니저인 Tim Wilson이 세션 중간에 합류했습니다.

약 30분 동안 두 사람은 Intel이 왜 E-core 서버 부품에서 하이퍼스레딩 (Hyper-threading)을 제거했는지와 이를 다시 도입해야 하는 기술적 근거, CPU를 기다리는 동안 값비싼 GPU 플릿(fleet)을 유휴 상태로 만드는 에이전틱 AI (Agentic AI) 수요 급증 문제, Clearwater Forest를 AVX2만 지원하도록 출시하기로 한 의도적인 결정, 그리고 고객 간의 칩 할당이 "경우에 따라 매일" 이루어질 정도로 타이트한 18A 공급 상황에 대해 다루었습니다.

Intel의 차세대 P-core Xeon인 Diamond Rapids에 대해서는 반복적인 질문이 이어졌으나, Intel은 세부 사항에 대한 답변을 미루었으며, Evangelista는 기자들에게 약 두 달 후에 나올 더 상세한 논평을 참고하라고 안내했습니다. 이 시점은 Intel이 Diamond Rapids에 대해 더 많은 내용을 공유할 것으로 예상되는 Hot Chips 일정과 일치합니다.

Clearwater Forest 사양 변경 사항

Clearwater Forest는 소켓당 최대 288개의 Darkmont E-core와 576MB의 L3 캐시를 탑재하며, Intel의 18A 공정으로 제작된 첫 번째 데이터 센터 CPU입니다.

Kira Boyko: 이것은 현재 시장에서 가장 성능이 뛰어난 Xeon이며, 특히 스케일 아웃 (Scale-out) 워크로드에 최적화되어 있습니다. 따라서 단순히 와트당 성능 (Per-watt performance) 측면만 고려한 것이 아닙니다.

Jake Roach, Tom's Hardware: 그것이 Sierra Forest와 비교했을 때 큰 사양 변경을 일으킨 원동력이었습니까? 분명히 코어 수는 두 배가 되었지만, L3 캐시 양은 5배 이상 증가했고 TDP 또한 크게 늘어난 것으로 보입니다.

Kira Boyko: TDP는 주로 이 제품이 이전에 Granite [Rapids]-AP를 위해 가졌던 플랫폼 설계 버전과 소켓 호환성(socket-compatible)을 유지하기 때문이며, 이는 더 높은 TDP를 가진 제품입니다. 우리의 초기 E-core 파트는 더 낮은 TDP였으나, 이번 제품은 Granite 버전과 거의 동일한 범위를 가지고 있어 플랫폼 설계 정렬(platform-design alignment)의 일환이기도 합니다. 하지만 일반적으로 고객들이 추구하는 코어 밀도(core density)를 위해 어차피 높은 TDP 영역을 목표로 한다는 것을 확인했기에, 결과적으로 상당히 잘 맞아떨어졌습니다. 우리는 이미 해당 영역을 지원하는 설계를 보유하고 있었습니다.

Jake Roach: 그리고 L3 캐시는 또 다른 워크로드 유형 때문이었나요?

Kira Boyko: 맞습니다, 수백 MB 단위에서 약 576MB 정도로 5배 이상 증가했습니다.

Jake Roach: 플래그십 제품이라면 L3가 상당히 많은 편이군요.

Diamond Rapids 및 하이퍼스레딩 (Hyper-threading)

최근 실적 발표(earnings calls)에서 Intel CEO Lip-Bu Tan은 동시 다중 스레딩 (SMT, simultaneous multi-threading)을 배제한 것이 "우리를 경쟁적 열세에 놓이게 했다"고 언급했으며, 회사는 Diamond Rapids의 후속 P-core Xeon 세대인 Coral Rapids와 함께 이를 다시 도입할 것이라고 밝혔습니다. 현재 출하 중인 Intel의 E-core Xeon인 Sierra Forest 및 Clearwater Forest는 코어당 단일 스레드(single thread)로 동작합니다.

Jake Roach: 미래 제품에 대해 언급할 수 없다는 점은 이해하지만, Diamond Rapids를 위한 프레스 덱(press deck)에 예고가 있었습니다. 매우 기대되는 제품이죠. 하이퍼스레딩(hyper-threading)에 대해 질문하고 싶습니다. 지난 두 번의 실적 발표에서 Lip-Bu Tan은 Coral Rapids와 함께 하이퍼스레딩이 돌아올 것이라고 언급했습니다. 현재 우리는 하이퍼스레딩이 없는 Xeon P-core 제품을 출하하고 있지 않습니다. 그렇다면 Diamond Rapids에는 하이퍼스레딩이 없다는 뜻인가요?

Andrew Evangelista: Diamond Rapids에 대해서는 [나중에] 더 자세히 말씀드리겠습니다.

Kira Boyko: E-core는 싱글 스레드 (single-threaded) 방식이라고 말씀드리겠습니다. E-core는 해당 코어가 처리하는 워크로드 (workloads)에 적합한 코어 밀도 (core density)를 갖추고 있으며, Diamond Rapids에 의해 대체될 것으로 예상하지 않습니다. 저희는 P-core의 고성능 측면이 더 많이 필요한 워크로드는 Granite에서 Diamond로 이동할 것으로 예상하는 반면, E-core를 위한 더 스칼라적인 (scalar) 워크로드들은 Clearwater Forest에 머물며 차세대 제품을 통해 계속 서비스되고, 그 다음 세대에서 이어질 것으로 보고 있습니다.

Andrew Evangelista: 전반적인 Diamond Rapids에 대해 이야기하게 만든 것은 질문자님의 질문이었던 것 같습니다. 더 많은 내용이 곧 공개될 것입니다.

Kira Boyko: Diamond 관점에서 제가 정말로 말씀드릴 수 있는 유일한 것은 Clearwater Forest에서 도입하는 새로운 기능인 AET입니다. 이는 향후 모든 Xeon 제품군에 걸쳐 출시될 예정이므로, Diamond와 그 이후의 제품에서도 이를 볼 수 있을 것입니다. 세대별 기능 관점에서의 로드맵(roadmap)이 어떻게 구성되는지에 대해서는 오늘 말씀드릴 수 있는 수준의 세부 정보는 없습니다. 하지만 Clearwater에서 확실히 도입되고 있습니다. 저희는 Clearwater에 이를 배포하는 다수의 고객을 보유하고 있으며, 다른 전형적인 P-core 고객들은 서로 다른 워크로드로 Clearwater에서 개념 증명 (proof-of-concepts)을 수행하여 Diamond를 즉시 사용할 수 있도록 준비하고 있습니다.

Jake Roach: 질문을 안 할 수가 없었습니다.

Kira Boyko: 마치 "그건 제가 원한 게 아니에요, 훨씬 더 자세한 내용을 원한다고요"라고 말씀하시는 것 같네요.

Jake Roach: Diamond에는 하이퍼스레딩 (hyper-threading)이 없다고 확정되었다는 기사들이 많이 작성되었는데, 저는 어디에서도 그 확정된 내용을 찾을 수 없었습니다.

Kira Boyko: Diamond에 대해서는 여기저기 떠도는 정보가 아주 많습니다. [불분명함] 변형 모델에 대한 언급이나 수많은 루머들이 존재합니다.

Andrew Evangelista: 더 공식적인 논평이 나올 예정이며, 사람들이 기대하고 있는 것도 바로 그것입니다. 저희는 기대감이 높다는 것을 이해하고 있으며, [두 달 후에] 더 많은 내용을 공유하겠습니다.

에이전틱 AI (Agentic AI) 및 CPU 수요

기자 2: 이러한 에이전틱 AI (Agentic AI) 파도에 대해 고객들이 무엇이라고 말하고 있나요? 그들은 이에 어떻게 대응하고 있으며, 향후 Intel은 그 과정에서 어떤 역할을 하게 될까요?

Kira Boyko: 고객들은 이제 막 자신들의 AI 배포 모델을 이해하기 시작한 단계이며, 상당수는 아직 준비가 완전히 되지 않았습니다. 많은 기업이 GPU에 먼저 투자하기 시작했지만, 이제는 해당 GPU를 실제로 구동할 수 있는 CPU 대응 제품이 부족하다는 사실을 깨닫고 있습니다. 그래서 막대한 투자를 했음에도 불구하고, 현재 20%에서 30% 정도의 상당히 낮은 가동률로 운영되고 있습니다. 고객들은 특정 워크로드 (Workload)를 더 효율적인 CPU로 오프로딩 (Offloading) 할 수 있는 영역이 있다는 점을 이해하고 있으며, 이는 Xeon 6+ 관점에서 매우 흥미로운 부분입니다. 다른 고객들은 여전히 서비스 제공업체와 협력하거나, AI 전략을 가장 잘 활용하는 방법을 이해하기 위해 업계 백서 (White papers)를 검토하고 있습니다.

기자 2: 외부 관찰자 입장에서 보면, CPU 수요가 증가하던 중 11월과 12월을 거치며 모든 제품이 즉시 매진된 것처럼 보였습니다. 현재 수요 중 에이전틱 AI (Agentic AI)가 차지하는 비중은 이전과 비교했을 때 어느 정도인가요? 현재 상황이 어떠한지, 그리고 6개월에서 9개월 후에는 어떻게 될지 파악하고 싶습니다. 패러다임의 전환 (Paradigm shift)이 일어난 것 같으며, 우리는 적어도 몇 분기 동안 이 트렌드를 타게 될 것으로 보입니다.

Kira Boyko: 저도 그렇게 생각합니다. 또한 우리는 데이터 센터 현대화 (Modernization) 및 통합 (Consolidation) 과정을 꽤 많이 목격하게 될 것이라고 생각합니다. 이미 존재하는 워크로드 중 CPU로 통합할 수 있는 것이 무엇인지 살펴보는 과정이죠. 어떤 워크로드는 에이전틱 (Agentic)을 위해 설계되었을 수도 있고, 그렇지 않을 수도 있지만, 더 스토리지 지향적이거나 아주 강력한 성능을 요구하지 않아도 충분히 처리할 수 있는 워크로드들이 있습니다. 이를 통해 성능과 에너지를 조금 더 확보할 수 있으며, 그렇게 확보한 자원을 그들의 AI 워크로드 서비스에 활용할 수도 있습니다.

애플리케이션 에너지 텔레메트리 (Application Energy Telemetry)

AET, 즉 애플리케이션 에너지 텔레메트리 (Application Energy Telemetry)는 Clearwater Forest의 기능으로, 운영자에게 에너지 사용에 대한 애플리케이션 수준의 가시성을 제공합니다. Intel은 이를 통해 워크로드를 튜닝(tune)할 수도 있고, 추정치가 아닌 측정된 소비량을 기준으로 고객에게 비용을 청구할 수도 있다고 밝혔습니다.

Jake Roach: AET를 언급하셨는데, 이번 출시에서 매우 중요한 부분이라는 것을 알고 있습니다. 소비자용 제품인 Arrow Lake Refresh에서 우리가 보았던 것과 연결되는 지점이 있을까요? AET는 실리콘 내의 실제 레지스터(register)로부터 정보를 가져옵니다. 칩 내에 이를 수행하는 하드웨어가 있는 것이죠. 마찬가지로 Arrow Lake Refresh의 iBot 역시 하드웨어 기반(hardware-enabled)이었으며, 워크로드를 실행하면서 판독값을 얻어 최적화 지점을 확인할 수 있었습니다. 이 사이에 어떤 연결 고리가 있나요, 아니면 완전히 별개인가요?

Kira Boyko: 협업 관계가 있는지에 대해서는 나중에 다시 답변해 드리겠습니다. 보통 저희 팀들은 매우 분리되어 있지만, 협업이 있을 가능성도 매우 높으므로 확인해 보겠습니다. 제가 이해하기로는 이 기능은 매우 고객 주도적(customer-driven)입니다. 때로는 기존 기술을 활용하기도 합니다.

Jake Roach: 이건 제 개인적인 궁금증을 해소하기 위한 질문입니다.

Andrew Evangelista: 그 질문에 답하기 위해 Tim을 잠시 불러보겠습니다. 실리콘 엔지니어링(silicon-engineering) 수준의 질문이기 때문입니다. 그는 클라이언트(client)와 엔터프라이즈(enterprise) 분야 모두에서 일해 왔습니다.

Jake Roach: 네, Darkmont을 사용하고 계시니 최소한 그럴 만한 역량은 갖춰져 있을 테니까요.

Kira Boyko: 정곡을 찌르시네요(Touché). 다음 세대로 넘어가더라도, 그것이 E-core가 아니더라도 여전히 존재할 것입니다. 따라서 만약 어떤 시너지(synergy)가 있었다 하더라도, 다른 코어 베이스(core base)로 발전해 나가는 과정일 것입니다.

Andrew Evangelista: 두 가지 질문으로 다시 돌아가 보겠습니다. 하나는 Arrow Lake와 관련된 유사성에 관한 것이었습니다.

Jake Roach: 기본적으로 Arrow Lake Refresh에서 iBot이 해당 변환을 최적화하기 위해 사용했던 훅(hooks)들이 있습니다. 그러한 하드웨어 훅(hardware hooks)을 고려하고 계신가요? 현재 그 사이에 어떤 연결 고리가 있습니까?

Tim Wilson: 저는 Arrow Lake를 꽤 오랫동안 살펴보지 않았습니다. 우선순위를 따져보자면, 근본적으로는 아니라고 말씀드리고 싶습니다. 그 둘은 사용 사례(use cases)가 다릅니다. 하드웨어에 내장된 동일한 텔레메트리(telemetry) 기능을 활용하고 있느냐고요? 그렇다 해도 놀랍지 않을 것입니다.

SMT 제거와 그 귀환

Intel은 Xeon 6 라인업을 Granite Rapids와 같이 하이퍼스레딩(hyper-threading)이 포함된 P-core 제품군과, Sierra Forest를 시작으로 하이퍼스레딩이 없는 E-core 제품군으로 나누었습니다.

Andrew Evangelista: SMT 및 하이퍼스레딩(hyper-threading) 결정에 관한 질문입니다.

Journalist 2: 왜 그것을 제거했는지, 그 이면에 어떤 생각이 있었는지 궁금합니다. 보안 문제 때문이었나요?

Tim Wilson: 저 개인적으로는 많은 생각이 있습니다. 몇 년 전 데이터 센터로 거슬러 올라가 보면, 핵심 논지는 최대 코어 성능(maximum core performance)과 소켓 내 코어 밀도(core density)가 중요하다는 것이었습니다. 따라서 제가 최대 코어 성능을 제공하고 소켓 내 코어 수를 늘릴 수 있다면, 정말로 [SMT]가 필요할까요? 하나의 물리적 코어 위에 구축된 두 개의 가상 코어보다는 항상 한두 개의 물리적 코어가 더 낫습니다. 저는 해당 결정이 매우 유용하고 가치 있으며 실질적인 가치를 제공하는 사용 사례와 워크로드(workloads)를 보게 될 것이라고 전적으로 예상하며, 일부 고객들로부터 그들이 수행하는 작업에는 싱글 스레드(single-threaded)가 정답이라는 이야기를 듣기도 했습니다. 그렇긴 하지만, 여전히 매우 멀티 스레드(multi-threaded)적인 작업 비중이 높으며, 특히 가상화(virtualized) 영역에서는 더욱 그렇습니다. 따라서 이를 완전히 제거하는 것은 문제가 될 수 있는데, 왜냐하면 무시할 수 없는 상당 부분의 워크로드를 차단하게 되기 때문입니다. 특히 라이선스가 코어와 스레드(threads)를 기준으로 책정되는 가상화된 라이선스 환경에서는 더욱 그렇습니다. 따라서 [SMT]를 원하는 기술적인 이유가 있었고, 그 기술적인 이유는 아마 여전히 유효할 것입니다. [...]

Journalist 2: 코어당 비용이 높은 VMware 같은 경우 말이죠. AMD나 이제는 Nvidia와 같은 주요 경쟁사들에 맞서 어떻게 시장에 접근하실 계획인가요? 향후 메시징은 무엇입니까? 18A 공정에서 그다음 단계로 넘어가면, 노드(node) 측면에서 훨씬 더 나아질 것입니다.

Tim Wilson: 우리의 의도는 매 세대마다 리더십 제품(leadership products)을 보유하는 것이며, 앞으로도 이를 완수할 의지가 확고합니다. 우리의 시장 진입 전략(go-to-market strategy)은 고객과 마주 앉아 그들이 무엇을 가치 있게 여기는지 묻고, 그 요구사항을 충족하는 리더십 제품을 구축하는 것입니다. 모든 데이터 센터(data center) 고객들과 함께, 우리는 단순히 코어(cores), 피드(feeds), 속도(speeds)를 넘어 그들이 구축하고자 하는 플랫폼의 특성(personality)에 대해 심도 있는 논의를 진행합니다. 시스템 균형(system balance)은 어떠한지, 메모리 대 연산 비율(memory-to-compute ratio)은 어떠한지? 멀티 소켓(multi-socket) 대 싱글 소켓(single-socket)을 어떻게 바라보고 있는지? 프라이빗(private) 및 퍼블릭(public) 워크로드, 엔터프라이즈(enterprise) 대 클라우드(cloud) 모두에서 그들의 워크로드에 적합한 코어 수는 얼마인지? 이는 실제로 각 영역에 앉아 시장과 우리 부품을 구매하는 고객들이 무엇을 가치 있게 여기는지 묻고, 그들의 요구를 충족하기 위해 우리의 제품을 어떻게 최적화할지 결정하는 과정입니다.

Journalist 2: 에이전틱 AI(agentic AI) 수요의 폭발적인 증가로 인해 이러한 흐름이 지금 변하고 있습니까? 에이전틱 AI를 주요 용도로 사용하는 CPU 랙(CPU racks)을 보게 될까요?

Intel Xeon 6+ Computex 라운드테이블 인터뷰 녹취록 — Kira Boyko와 Tim Wilson이 말하는 18A 웨이퍼 할당

요약

핵심 포인트

Clearwater Forest 사양 변경 사항

Diamond Rapids 및 하이퍼스레딩 (Hyper-threading)

에이전틱 AI (Agentic AI) 및 CPU 수요

애플리케이션 에너지 텔레메트리 (Application Energy Telemetry)

SMT 제거와 그 귀환

댓글