본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 01. 02:44

Apple, Apple Silicon 약속 파기하고 AI 쿼리를 Google Cloud로 전송

요약

Apple이 온디바이스 AI 처리를 위해 Apple Silicon을 사용하겠다는 기존 약속과 달리, 무거운 AI 쿼리를 Google Cloud로 전송하고 있습니다. 로컬에는 경량화된 Gemini 모델을 사용하며, 클라우드 연산에는 Nvidia의 기밀 컴퓨팅 기술을 활용하는 복잡한 인프라 구조를 취하고 있습니다.

핵심 포인트

  • 경량화된 Gemini 모델은 iPhone 로컬에서 실행
  • 무거운 쿼리는 Google Cloud의 Nvidia 기술로 오프로드
  • Apple의 수직 계열화 전략과 프라이버시 마케팅에 균열 발생
  • Google에 대한 모델 및 인프라 의존도 심화

Apple이 AI 쿼리를 Apple silicon에서 처리하겠다는 2024년의 약속을 깨고, 대신 더 무거운 요청들을 Google Cloud로 전송하고 있습니다. @kimmonismus에 따르면, 경량화된 Gemini 모델은 iPhone에서 로컬로 실행되는 반면, 오프로드(offloaded)된 쿼리는 Google Cloud 내의 Nvidia 기밀 컴퓨팅(confidential-compute) 기술을 사용합니다.

주요 사실

  • 로컬 모델은 Google Gemini의 경량화(distilled) 버전임
  • 무거운 쿼리는 Apple silicon이 아닌 Google Cloud로 경로가 지정됨
  • Apple은 Google Cloud를 위한 Nvidia 기밀 컴퓨팅 (confidential-compute) 기술을 승인함
  • Apple은 온디바이스 모델 축소를 위해 Liquid AI를 검토함
  • 클라우드 전환에도 불구하고 Private Cloud Compute 명칭은 변경되지 않음

다음 달 열릴 Apple의 WWDC는 오랫동안 지연된 Siri 및 온디바이스 AI 업그레이드에 집중될 것으로 예상되지만, 인프라 이야기는 마케팅이 시사하는 것보다 더 복잡합니다.

Apple이 실제로 하고 있는 일

Apple은 개인정보 보호와 낮은 토큰 비용을 내세워 Google Gemini의 더 작고 경량화된 버전을 iPhone silicon에서 로컬로 실행할 예정입니다. [ @kimmonismus에 따르면 ] 해당 스택의 대부분은 외부에서 조달됩니다. 로컬 모델은 Gemini에서 경량화되었습니다.

기기에서 처리하기에 너무 무거운 쿼리는 Google Cloud로 경로가 지정되며, Apple은 이제 이를 처리하기 위해 Nvidia의 기밀 컴퓨팅 (confidential-compute) 기술을 사용하도록 승인했습니다. 또한 Apple은 모델 축소 작업을 가속화하기 위해 Liquid AI 등을 검토하며 소규모 온디바이스 AI 스타트업을 찾고 있는 것으로 알려졌습니다.

깨진 약속

2024년 출시 당시의 조용한 변화 중 하나는 다음과 같습니다: Apple은 당시 iPhone을 벗어나는 모든 데이터가 Private Cloud Compute 내부의 Apple silicon에서 실행될 것이라고 약속했습니다. 하지만 그곳에서 전체 Gemini를 실행할 수 없었기 때문에, 해당 쿼리들은 이제 Google Cloud에 머물게 됩니다. 그럼에도 Private Cloud Compute라는 명칭은 그대로 유지됩니다. [ The Information ]

독특한 관점

이는 Apple의 수직 계열화된 AI 서사(narrative)에 발생한 첫 번째 주요 균열입니다. 맞춤형 실리콘(custom silicon)을 구축하고 프라이버시를 차별화 요소로 마케팅하며 수년을 보낸 이 회사가, 이제는 가장 민감한 사용자 쿼리(voice commands, personal context)를 Nvidia GPU가 구동되는 경쟁사의 클라우드로 라우팅하고 있습니다. "Private Cloud Compute"라는 명칭은 아키텍처(architecture)가 아닌 브랜딩(branding)이 되어버렸습니다.

모델(Gemini)과 컴퓨팅(Google Cloud) 모두 Google에 의존하는 Apple의 상황은 어색한 종속 관계를 형성합니다. 만약 Google이 가격 정책, 약관 또는 모델 접근 권한을 변경한다면, Apple이 행사할 수 있는 영향력은 제한적입니다. 스타트업 인수 탐색은 Apple도 이 사실을 인지하고 있으며, 내부적인 모델 경량화(model-shrinking) 역량을 구축하려 노력하고 있음을 시사하지만, 이는 시간이 걸리는 작업입니다.

주목해야 할 점

Apple이 Siri 업그레이드에 대한 세부 사항을 공개할 WWDC 2026(다음 달)을 주목하십시오. 핵심 지표는 다음과 같습니다: Apple이 클라우드 제공업체와의 계약 관계를 공개하는지 여부, 그리고 Google 의존도를 낮추기 위해 Liquid AI와 같은 온디바이스 AI (on-device-AI) 스타트업을 인수한다고 발표하는지 여부입니다.

원문 출처: gentic.news

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0