본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 09. 17:04

iPhone에서 20B 모델이 구동되는 시대! WWDC26에서 발표된 Core AI와 Foundation Models 총정리!

요약

WWDC26에서 Apple은 온디바이스 AI를 위한 새로운 Core AI 프레임워크와 3세대 Apple Foundation Models(AFM)를 발표했습니다. 특히 스파스 아키텍처를 통해 iPhone에서 20B 규모의 모델을 효율적으로 구동하는 기술적 혁신을 선보였습니다.

핵심 포인트

  • Core ML의 후속인 Core AI 프레임워크 등장
  • 요구사항에 따라 온디바이스와 클라우드를 자동 라우팅
  • 스파스 아키텍처로 20B 모델의 온디바이스 구동 실현
  • AFM 3 Core Advanced는 MoE 방식 기반의 효율적 파라미터 로드

2026년 6월 8일, Apple은 연례 개발자 컨퍼런스인 「WWDC26」을 개최했습니다.

올해의 가장 큰 테마는 AI이며, 그중에서도 **iPhone의 로컬 LLM(대규모 언어 모델)**에 관한 발표는 상당히 임팩트가 있었습니다.

본 기사에서는 WWDC26에서 발표된 Core AI 프레임워크Foundation Models 프레임워크의 진화에 대해 초보자도 알기 쉽게 해설합니다.

LLM(Large Language Model)이란, ChatGPT나 Claude와 같이 문장을 이해하고 생성하는 AI를 말합니다. 보통 이러한 AI는 클라우드(인터넷상의 서버)에서 동작합니다.

반면 「로컬 LLM」이란, 인터넷에 접속하지 않고 수중에 있는 디바이스 상에서만 동작하는 LLM을 의미합니다.

비교 항목클라우드 LLM로컬 LLM
인터넷필요불필요
...

Apple은 iOS 26(2025년 출시)에서 Foundation Models 프레임워크를 처음으로 공개했으며, 이번 WWDC26에서 그 대폭적인 확장을 발표했습니다.

지금까지 Apple의 온디바이스 기계 학습은 「Core ML」이라는 프레임워크로 제공되어 왔습니다.

WWDC26에서는 이것의 후속으로서 **「Core AI」**라는 새로운 프레임워크가 등장했습니다.

Core AI는 LLM 및 생성 AI에 특화되어 설계되었으며, 다음과 같은 메커니즘을 가집니다.

  • 앱이 「속도 우선」, 「프라이버시 우선」, 「고성능 우선」과 같은 요구 사항을 지정하기만 하면, Core AI가 자동으로 온디바이스 모델, Apple의 클라우드 모델, 사용자가 선택한 외부 AI 서비스 중 하나로 라우팅(Routing)해 줍니다.
  • 개발자용 API 창구는 Foundation Models 프레임워크가 담당합니다.

기존의 Core ML이 즉시 서비스 종료되는 것은 아니지만, 신규 개발에서는 Core AI를 채택하는 것이 권장됩니다.

WWDC26에서 Apple은 제3세대 Apple Foundation Models(AFM)로서 5개의 모델을 발표했습니다. 온디바이스 2개, 클라우드(Private Cloud Compute) 3개로 구성되어 있습니다.

모델명동작 장소개요
AFM 3 Core온디바이스약 3B 파라미터의 범용 모델
...

덧붙여, 이 모델들은 Apple이 독자적으로 설계 및 개발한 것이지만, Google의 프론티어 모델을 이용하여 더욱 정교하게 다듬어졌습니다.

Craig Federighi(Apple 소프트웨어 엔지니어링 담당 SVP)는 「Google의 Gemini 앱 코드는 일절 사용하지 않았으며, Google이 고객용으로 배포하고 있는 모델도 사용하지 않았다」고 명시했습니다.

이번에 가장 주목을 받은 것이 온디바이스에서 동작하는 AFM 3 Core Advanced입니다.

통상적으로 20B 파라미터 모델을 스마트폰에서 구동하는 것은 불가능에 가깝습니다.

하지만 Apple은 **스파스 아키텍처(Sparse Architecture)**라는 독자 기술로 이를 실현했습니다.

애널리스트인 Max Weinbach 씨가 X(구 Twitter)를 통해 개요를 해설하고 있습니다.

AFM Core Advanced는 MoE(Mixture of Experts) 방식이지만, 프롬프트를 처리할 때는 필요한 파라미터만 로드하여 잠금(Lock)한다.

합계 20B 파라미터라도 특정 요청 시 실제로 사용하는 것은 1~4B 분량뿐이다.

프리필(Prefill) 시에 어떤 파라미터를 사용할지 결정한다. 아키텍처는 완전히 Apple 독자 설계이며, Google은 관여하지 않았다.

Apple 공식 ML 연구 블로그에서도 유사한 설명이 되어 있으며, 메커니즘은 다음과 같습니다.

모델 전체(20B)는 플래시 스토리지(NAND)에 저장
↓
요청마다 필요한 파라미터(1~4B 분량)만 선택
...

이 「Instruction-Following Pruning(IFP)」이라 불리는 Apple 독자 기술 덕분에, 12GB RAM만을 탑재한 iPhone 17 Pro에서도 20B 모델의 실행이 가능해졌습니다.

중요한 주의 사항으로, AFM 3 Core Advanced는 모든 iPhone에서 동작하는 것은 아닙니다.

대응 모델AFM 3 Core Advanced
A19 ProiPhone 17 Pro / 17 Pro Max / iPhone Air대응
...

iPhone 17 Pro 시리즈와 iPhone Air는 A19 Pro 칩과 12GB RAM을 탑재하고 있어, AFM 3 Core Advanced를 지원합니다.

반면, 표준 iPhone 17은 A19 칩과 8GB RAM을 사용하기 때문에, 기존의 AFM 3 Core (약 3B)만 지원됩니다.

즉, 모든 iPhone 모델이 20B 모델을 지원하는 것이 아니라, 상위 모델 한정 기능이라는 점을 유의해야 합니다.

지원되는 디바이스는 앞으로 늘어나겠지만, 플래그십 시리즈가 아니면 쾌적하게 동작시키기 어렵다는 점은 마찬가지일 것으로 생각됩니다.

네이티브 멀티모달 (Native Multimodal): 텍스트, 이미지, 음성 대응
표현력이 풍부한 음성 (Expressive Voices): 자연스러운 억양이 있는 음성 출력
고정밀 받아쓰기 (High-precision Dictation): 음성 입력 인식 정밀도 향상 - 완전 온디바이스 (On-device)로 동작하며, 데이터는 일절 외부로 전송되지 않음

Foundation Models 프레임워크 (iOS 26에서 최초 등장)는 Apple Intelligence를 구동하는 온디바이스 LLM을 서드파티 앱에서 Swift 코드로 직접 호출할 수 있는 메커니즘입니다.

WWDC26에서는 다음과 같은 기능이 추가 및 강화되었습니다.

온디바이스 모델 강화

  • 추론 능력과 도구 호출 (Tool Calling)이 개선된 모델로 쇄신
  • 컨텍스트 크기 확인 및 토큰 수 카운팅이 가능한 신규 API 추가 (iOS 26.4 이후)
  • 오탐지를 줄이도록 안전 필터 (Safety Filter) 정교화

Private Cloud Compute (PCC) 모델 확충

  • Apple의 서버 사이드 모델을 인증이나 API 키 없이 이용할 수 있는 PrivateCloudComputeLanguageModel이 추가됨
  • 컨텍스트 윈도우 (Context Window)는 32,000 토큰이며, 추론 레벨도 선택 가능
  • watchOS 27에서도 이용할 수 있게 됨
  • App Store Small Business Program에 등록되어 있으며 최초 다운로드 수가 200만 미만인 앱은 PCC 모델을 API 비용 없이 이용할 수 있음

macOS 터미널 대응

macOS 27에서는 fm이라는 CLI 도구가 추가되어, 터미널에서 온디바이스 모델이나 PCC 모델을 그대로 사용할 수 있게 되었습니다. 또한 Python SDK도 제공되어, Swift를 작성하지 않는 개발자도 Apple의 온디바이스 모델을 활용할 수 있습니다.

Siri는 WWDC26에서 "Siri AI"로 전면 재설계되었습니다.

Apple 독자적인 Foundation Models를 베이스로 Google의 프론티어 모델 (Frontier Model)로부터 증류(Distillation)한 지식을 조합한 아키텍처입니다 (Gemini의 코드나 모델을 그대로 Siri에 사용하는 것은 아닙니다).

Siri AI는 iPhone, iPad, Mac 상에서 스탠드얼론 (Standalone) 앱으로 동작하며, 대화 기록이 iCloud를 통해 디바이스 간에 동기화됩니다. 단, EU에서는 Siri AI가 제공되지 않습니다.

Foundation Models 프레임워크를 사용하면 API 키도 필요 없고 통신도 필요 없이 LLM을 앱에 내장할 수 있습니다. 스타트업이나 개인 개발자에게는 비용 측면의 장벽이 대폭 낮아졌습니다.

데이터가 디바이스 외부로 나가지 않기 때문에, 사용자의 개인 정보를 다루는 앱에서도 안심하고 AI 기능을 추가할 수 있습니다.

편리한 반면, 다음과 같은 제약 사항도 있습니다.

  • AFM 3 Core (약 3B 파라meter)는 범용적으로 사용할 수 있지만, 복잡한 태스크에서는 클라우드 LLM보다 성능이 떨어질 수 있습니다.
  • AFM 3 Core Advanced는 iPhone 17 Pro / Pro Max / Air 등 플래그십 모델 한정입니다. iPhone 17 표준 모델이나 iPhone 16 시리즈에서는 이용할 수 없습니다.
  • 모델의 가중치 (Weights)를 직접 파인튜닝 (Fine-tuning)할 수는 없습니다.
  • 오픈 소스 모델을 이용할 경우, 최초 실행 시 모델 다운로드와 "모델 특화 처리 (Specialization)"가 발생하여 랙 (Lag)이 생길 수 있습니다. Instruments 상의 새로운 Core AI 템플릿을 통해 이를 측정하고 대처하는 것이 권장됩니다.

WWDC26에서의 온디바이스 LLM (On-device LLM) 관련 발표를 정리하면 다음과 같습니다.

항목내용
새로운 프레임워크Core AI (Core ML의 후속)
...

Apple은 iPhone을 AI 처리의 거점으로 만들겠다는 의지를 명확히 드러내고 있으며, 프라이버시와 비용 양면에서 뛰어난 온디바이스 AI (On-device AI) 시대가 본격적으로 도래하고 있습니다.

특히 AFM 3 Core Advanced의 스파스 아키텍처 (Sparse Architecture)는 스마트폰 상에서의 LLM 실행 상식을 뒤바꿀 기술로서 앞으로도 주목받을 것입니다.

  • Apple Machine Learning Research - Introducing the Third Generation of Apple's Foundation Models
  • Apple Developer - What's new in the Foundation Models framework (WWDC26)
  • Apple Developer - Integrate on-device AI models into your app using Core AI (WWDC26)
  • Apple Developer - WWDC26 Apple Intelligence guide
  • Max Weinbach

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0