본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 15. 13:02

WWDC 2026 - Private Cloud Compute (PCC) 상의 Apple 신규 서버 LLM: 개발자에게 어떤 이점이 있는가

요약

Apple이 Private Cloud Compute(PCC)를 통해 개발자가 앱에서 직접 호출할 수 있는 서버급 LLM을 공개했습니다. 기존 Foundation Models API를 사용하여 단 한 줄의 코드 변경만으로 온디바이스 모델에서 더 강력한 서버 모델로 전환할 수 있습니다.

핵심 포인트

  • 단 한 줄의 코드 변경으로 온디바이스에서 서버 모델로 전환 가능
  • 32K 컨텍스트 윈도우, 추론 지원 및 이미지 입력 제공
  • API 키, 인증, 토큰 비용 부담 없이 iCloud 기반으로 운영
  • Apple의 프라이버시 정책을 유지하며 프런티어급 모델 활용 가능

지난해 Apple은 Foundation Models 프레임워크를 통해 온디바이스 (on-device) LLM을 제공했습니다. 올해는 그 온디바이스 모델이 더욱 개선되었으며, Apple은 우리 중 많은 이들이 요구했던 기능을 추가했습니다. 바로 **Private Cloud Compute (PCC)**에서 실행되며 앱에서 직접 호출할 수 있는 **더 큰 서버 모델 (larger server model)**입니다.

요약 (TL;DR)

  • 새로운 **서버급 모델 (server-class model)**을 기존에 사용하던 것과 동일한 Foundation Models API를 통해 사용할 수 있습니다.
  • 온디바이스에서 서버로 전환하는 것은 **단 한 줄의 코드 변경 (one-line change)**만으로 가능합니다.
  • 32K 컨텍스트 윈도우 (context window) (온디바이스의 4K 대비), 추론 (reasoning) 지원, 그리고 이미지 입력을 제공합니다.
  • 개발자에게 API 키, 인증, 토큰 비용이 발생하지 않습니다. 요청은 사용자의 iCloud 계정을 기준으로 측정되며, 사용자당 일일 제한이 있습니다.
  • 다운로드 수가 200만 회 미만인 앱이 대상입니다. 개발자 사이트에서 신청할 수 있습니다.
  • watchOS를 포함한 여러 플랫폼에서 작동합니다.

이미 온디바이스 모델이 있는데 왜 서버 모델이 필요한가

온디바이스 모델은 빠르고, 프라이빗하며, 오프라인 작업에 매우 훌륭하며, 올해는 더욱 개선되었습니다. 이제 **이미지 입력 (image input)**을 지원하고, 지시 사항을 더 안정적으로 따르며, 커스텀 도구 (custom tools)를 호출하는 능력이 향상되었습니다.

하지만 어떤 기능들은 더 많은 여유 공간 (headroom)이 필요합니다. 다음과 같은 경우를 생각해 보세요:

  • 방대한 양의 사용자 입력을 바탕으로 추론하는 어시스턴트.
  • 많은 도구 호출 (tool calls)을 수행하고 대량의 출력을 생성하는 워크플로우.
  • 더 큰 컨텍스트 윈도우와 깊은 추론이 품질을 실질적으로 변화시키는 작업들.

이 지점에서 PCC가 등장합니다. Apple의 프라이버시 정책을 그대로 유지하면서 프런티어급 (frontier-class) 모델을 사용할 수 있습니다.

프라이버시와 가격 정책 (진정으로 차별화되는 부분)

대부분의 서버 LLM은 다음과 같은 과정을 의미합니다: 계정 생성, API 키 관리, 토큰 비용 부담, 그리고 이를 고려한 개인정보 처리방침 작성. PCC는 이 중 대부분을 제거합니다:

  • 설계 단계부터 고려된 개인정보 보호 (Privacy by design). 데이터는 요청을 위해서만 사용되며 절대 저장되지 않습니다. Apple은 연구자들을 통해 이 사실을 독립적으로 검증받았습니다.
  • 키 또는 인증 불필요. PCC는 OS 및 iCloud에 통합되어 있습니다. 사용자는 Apple Intelligence를 지원하는 기기만 있으면 됩니다.
  • 개발자의 토큰 비용 부담 없음. 각 사용자는 자신의 iCloud 계정과 연결된 일일 한도를 부여받습니다. iCloud+ 사용자는 더 높은 한도를 제공받습니다.

감수해야 할 트레이드오프 (trade-off): 네트워크 연결이 필요하며, 설계 시 고려해야 할 사용자당 일일 제한(cap)이 존재합니다 (자세한 내용은 아래 참조).

통합하기: 모델 전환을 위한 단 한 줄의 코드

이전에 파운데이션 모델 (Foundation Models)을 사용해 본 적이 있다면, 온디바이스 (on-device) 모델에 프롬프팅 (prompting)하는 코드는 세 줄입니다:

import FoundationModels

let session = LanguageModelSession()
...

PCC 서버 모델로 전환하는 것은 단 한 줄이면 충분합니다. 세션에 다른 모델을 전달하기만 하면 됩니다:

import FoundationModels

let session = LanguageModelSession(
...

이것이 핵심적인 인체공학적 이점 (ergonomic win)입니다. 동일한 통합 Swift API를 사용하면서, 그 이면에는 더 큰 모델이 작동합니다.

구조화된 출력 (Structured output) 및 도구 (Tools)는 동일하게 작동합니다

@Generable 구조화된 출력과 Tool 호출은 온디바이스에서 실행하든 PCC에서 실행하든 동일하게 동작합니다. 두 환경 사이를 이동하기 위해 코드를 다시 작성할 필요가 없습니다:

import FoundationModels

@Generable
...

항상 가용성을 확인하세요

온디바이스 모델과 마찬가지로 PCC도 Apple Intelligence 지원 기기에서만 실행됩니다. 가용성을 확인하고 우아한 폴백 (graceful fallback)을 제공하세요:

import FoundationModels

struct ArticleSummarizationView: View {
...

온디바이스 vs PCC: 선택 방법

두 방식 모두 프라이버시를 보장합니다. 나머지는 다음과 같은 트레이드오프 (trade-offs)의 문제입니다:

요소온디바이스 (On-device)PCC 서버
프라이버시 (Privacy)
...

세션의 조언은 반복할 가치가 있습니다: 느낌(vibes)이 아니라 데이터에 기반하여 모델을 선택하십시오. 업데이트된 온디바이스 모델은 예상보다 더 많은 작업을 처리할 수 있으며, 요청 제한(request limits)이 없습니다. 이를 확인하는 유일한 방법은 귀하의 특정 기능을 평가하는 것입니다 (

  • 경고(Alerts)를 피하세요. 사라지지 않고 유지되는 UI를 사용하십시오. 예를 들어, 버튼을 비활성화하고 그 아래에 미세한 레이블을 표시하는 방식이 있습니다.
  • 업그레이드 경로를 제공하세요. limitIncreaseSuggestion을 통해 사용자가 자신의 한도를 관리하거나 높일 수 있도록 유도할 수 있습니다 (예: iCloud 계정 업그레이드).
  • "한도 도달 임박" 케이스도 처리하세요. 이를 통해 사용자가 어떤 요청에 비용(한도)을 소비할 가치가 있는지 정보에 기반한 결정을 내릴 수 있도록 합니다.

Xcode에서 한도 상태 테스트하기

이를 테스트하기 위해 실제 할당량(Quota)을 소모할 필요는 없습니다. 스킴(Scheme)에서 Debug > Options로 이동하여 Simulate Apple Foundation Models Availability를 사용하십시오. Quota Usage Limit ReachedNearing Usage Limit를 선택하여 두 가지 코드 경로를 모두 실행해 볼 수 있습니다.

온디바이스(On-device) 모델과 서버 모델의 결합

하나만 선택해야 하는 것은 아닙니다. 일반적인 패턴은 간단한 작업은 온디바이스 모델로 라우팅하고, 더 어려운 작업은 PCC로 에스컬레이션(Escalate)하는 것입니다. 해당 워크플로우에 대해서는 "Foundation Models로 에이전트형 앱 경험 구축하기" 세션을 참고하십시오.

액세스 권한 얻기

서버 모델은 다운로드 수가 200만 회 미만인 앱에서 사용할 수 있으며, Apple Developer 웹사이트에서 신청해야 합니다. 귀하의 기능이 진정으로 더 큰 컨텍스트(Context)나 추론(Reasoning) 능력을 필요로 한다면, 조기에 신청할 가치가 있습니다.

--
요약
이미 Foundation Models를 사용 중이라면, 이제 프라이버시가 보장되고 관리해야 할 토큰 비용도 없는 상태에서 더 큰 모델을 사용하는 것이 단 한 줄의 결정만으로 가능해졌습니다. 각 작업에 적합한 티어(Tier)를 평가 및 선택하고, 일일 한도를 고려하여 미리 설계하십시오.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0