5억 달러짜리 교훈과 주권적 해답

세 가지 숫자가 같은 주에 발표되었으며, 이는 개별적으로 해석되기를 거부했습니다. 한 기업은 단 한 달 동안 5억 달러(five-hundred-million-dollar)에 달하는 Claude 청구서를 받았다고 보고되었습니다. Microsoft는 엔지니어당 월간 비용이 수백에서 수천 달러로 치솟자 내부 Claude Code 라이선스를 제한(throttle)하기로 했습니다. 별도의 보도에 따르면, Uber의 2026년 AI 예산은 4월에 이미 소진되었습니다. 개발자 측면에서는 Reddit의 r/ClaudeCode 커뮤니티(reddit.com/r/ClaudeCode/s/DzTsNI5yA3)의 한 스레드에서 실제 프로그래머들이 이미 소리 높여 말하고 있는 내용이 포착되었습니다. 즉, 호스팅된 구독(hosted subscription)을 통해 실제 엔지니어링 작업을 수행하는 비용이 이를 사용하는 엔지니어의 임금보다 더 빠르게 상승하고 있다는 것입니다.

이 세 가지 숫자를 함께 읽으면 하나의 트렌드가 나타납니다. 프런티어급(Frontier-class) 추론(inference)에는 서비스 제공을 위한 비용이 발생합니다. 표준 구독 모델은 모델이 실제로 실행될 때 소비하는 양과 거의 관계없이 고정된 월간 금액 뒤에 그 비용을 숨기는 정중한 허구(polite fiction)입니다. 이 허구는 연구소(labs)들이 그 차액을 보조할 용의가 있는 동안에는 유지되었습니다. 하지만 그것이 영원히 유지되지는 않을 것입니다.

하지만 현금 비용(cash cost)이 헤드라인이었습니다. 현금 비용은 규제 대상 구매자나 주권적 부처(sovereign department)를 밤잠 설치게 만들 만큼 중요한 이야기의 핵심은 아니었습니다. 현금 비용은 계량기(meter)일 뿐입니다. 계량기는 회복 가능합니다. 감당할 수 없는 구독은 취소할 수 있습니다. 바닥난 예산은 보충하거나 배급(rationed)할 수 있습니다.

헤드라인에 나온 어떤 숫자에도 포함되지 않은 두 번째 청구서가 있었으며, 그것이 가장 중요한 것이었습니다.

숨겨진 두 번째 청구서, 데이터 비용

5억 달러를 지출한 그 달은 기업이 모델로 보낸 모든 프롬프트 (prompt), 모든 문서, 모든 코드 한 줄, 모든 기밀 이메일, 모든 고객 기록, 모든 내부 전략 메모, 모든 법률 초안, 모든 임상 기록, 그리고 모든 인수 정보가 해외 엔드포인트 (endpoint)로 전송되고, 공급업체의 정책에 따라 명시되지 않은 기간 동안 보관되며, 운영자의 통제 하에 있지 않은 인프라에 머물고, 소환장을 통해 제출되거나, 유출되거나, 내부자에 의해 접근되거나, 외국 정부의 요청에 의해 인도될 수 있는 달이었습니다. 기업은 이 중 어느 것도 방지할 수 없었으며, 대부분은 감지조차 할 수 없었습니다.

이것은 과장이 아닙니다. 이것은 클라우드-AI (cloud-AI) 계약의 구조적 조건입니다. 운영자는 작업을 공급업체에 넘깁니다. 공급업체는 작업을 처리합니다. 그 후 작업은 운영자가 소유하지 않은 시스템에 있게 됩니다. 무언가 잘못되었을 때 운영자가 취할 수 있는 유일한 구제책은 공급업체의 계약상 선의 (contractual goodwill)뿐이며, 이는 대부분의 규제 대상 구매자들이 생각하는 것보다 훨씬 더 취약한 수단입니다.

규제 산업 (regulated industry)의 경우, 이는 구조적인 결격 사유입니다. 국방 계약업체, 임상 연구 프로그램, 건전성감독청 (Prudential Regulation Authority)의 규제를 받는 금융 기관, 국부 펀드 배분가, 또는 국가 핵심 인프라 (critical-national-infrastructure) 운영자의 운영 데이터는 운영자가 작성하지 않은 보관 정책을 가진 해외 호스팅 모델로 법적으로 유출될 수 없습니다.

가계의 경우, 이는 점진적인 감시입니다. 월 20파운드로 시작한 채팅 구독은 모든 개인적인 질문, 모든 가정 내 걱정, 모든 건강 문제, 모든 관계 문제, 모든 재정적 결정의 기록이 되어, 공급업체의 보관 정책에 따라 공급업체의 데이터 저장소에 머물며, 공급업체가 허용하는 누구에게나 접근 가능한 상태가 됩니다.

주권 국가에게 이는 카테고리-7 (category-7) 급의 리스크입니다. 외국에 호스팅된 모델에 국가 기밀 자료를 두는 것은 국가 안보 인증 기관(national-security accreditor)이 수용할 수 있는 리스크가 아닙니다. 인증 기관은 인증서를 발급하지 않을 것입니다.

5억 달러가 청구된 그 한 달은 하나의 비용을 치렀습니다. 그리고 그것은 조용히 훨씬 더 큰 두 번째 비용을 청구했습니다. 그 두 번째 비용이 바로 헤드라인을 장식한 핵심이었습니다.

구독 모델은 폐기되고 있으며, 이를 대체하는 계량 방식은 더 나쁘다

진지한 구매자라면 5억 달러가 청구된 그 한 달을 일회성 사고가 아니라, 클라우드-AI (cloud-AI) 벤더의 가격 책정이 향후 어디로 향할지에 대한 예고편으로 읽어야 합니다. 구독 모델 (subscription model)은 언제나 기저에 깔린 추론 비용 (inference cost) 위에 얹혀진 마케팅 계층이었습니다. 그것은 연구소(lab)가 자본 투입을 통한 성장 단계에서 감당할 수 있는 고정된 월간 금액으로 일반 가정과 소규모 운영자를 포섭하기 위해 존재했습니다. 그 단계가 끝나가고 있습니다.

연구소들에게는 이제 산술적으로 허용 가능한 두 가지 미래가 남아 있습니다. 두 가지 모두 현재보다 더 나쁩니다.

첫 번째는 구독을 조이는 것입니다. Microsoft가 내부 Claude Code 라이선스에 대해 엔지니어당 제한을 두는 것이 바로 이것입니다. Anthropic이 Claude Code 티어 내에 주간 Sonnet 사용량 제한 (caps)을 도입한 것도 이것입니다. 두 가지 모두 동일한 조치이며, 동일한 수축입니다. 정액제 티어는 브랜드로서 살아남겠지만, 그 안에서 운영자가 수행할 수 있는 작업량은 매 분기 줄어듭니다. 모든 것에 대해 월 20파운드를 지불하던 가정은 더 적은 서비스를 받기 위해 월 30파운드를 지불하게 됩니다. 단일 티어에서 전체 워크플로 (workflow)를 운영하던 소규모 운영자는 해당 티어가 한 달 중 첫 일주일 분량만을 커버한다는 사실을 깨닫게 됩니다.

두 번째는 구독 모델을 완전히 폐기하고, 사용량 기반의 애플리케이션 프로그래밍 인터페이스 (API)를 통해 기초가 되는 추론 (inference) 비용을 실제 한계 비용 (marginal cost)에 맞춰 책정하는 것입니다. 이것은 지난 6개월 동안 무역 전문지들이 조용히 추적해 온 미래입니다. 이 논리는 합리적입니다. 프런티어급 (frontier-class) 추론의 토큰 한 개가 추가될 때 발생하는 한계 비용은 실제 비용이며, 이는 연구소(lab)가 클러스터 (cluster)를 유지하기 위해 지불하는 돈입니다. 정액제 구독은 이러한 경제 구조와 구조적 불일치를 보입니다. 사용량 기반 API가 정직하다는 것이 그들의 주장입니다.

정직할지는 모르겠습니다. 하지만 저렴하지는 않습니다. 5억 달러를 기록한 한 달의 청구서는 실제 기업이 추론을 소비하는 규모에서 사용량 기반 API가 작동했을 때의 모습이었습니다. 해당 기업은 악의적이지 않았습니다. 사용량 제한 (usage cap)을 놓친 것 외에는 부주의하지도 않았습니다. 그 기업은 단지 일반적인 엔지니어링 조직을 일반적인 모델 API에 대해 일반적인 사용 프로필 (usage profile)로 운영했을 뿐입니다. 도착한 청구서는 미터기 (meter)가 생성한 그대로의 금액이었습니다.

이 청구서를 본격적인 클라우드 AI 소비가 향하는 방향으로 확장해 보십시오. 50명의 엔지니어로 구성된 연구 부서가 각각 하루에 1,000만 개의 토큰을 소비하고 토큰 100만 개당 비용이 5달러라면, 한 팀당 하루에 25,000달러, 한 달에 750,000달러가 소요됩니다. 이러한 팀을 10개 보유한 기업은 한 부서당 한 달에 750만 달러를 지불합니다. 규제 대상 은행이나 국가 방위 공급업체 규모인, 이러한 부서를 10개 보유한 기업은 다단계 에이전트 작업 (multi-step agentic work), 긴 문맥 추론 (long-context reasoning), 또는 대규모 문서 처리 (large document processing)와 같이 진정으로 토큰 집약적인 작업을 수행하기도 전에, AI 항목으로만 한 달에 7,500만 달러, 연간 9억 달러를 지불하게 됩니다. 5억 달러를 기록한 한 달은 예외적인 사례가 아니었습니다. 그것은 모든 클라우드 AI 소비 기업이 밀려가고 있는 곳을 보여주는 초기 신호였습니다.

이러한 전환의 가계(household) 측면은 쉬운 문제가 아니라 더 어려운 문제입니다. 정액제 구독(flat-fee subscription) 계층에서 밀려나 등록된 신용카드를 통한 종량제(metered access)로 강제 전환된 가계는 구조적으로 더 불리한 상황에 놓입니다. 구독제는 그 경제성이 무너졌을지언정, 최소한 최악의 경우 청구 금액을 구독 가격으로 제한합니다. 반면 등록된 신용카드는 청구 금액을 신용 한도까지 제한할 뿐입니다. 노트북에서 제어되지 않는 에이전트(runaway agent)를 켜둔 채 잠든 가계는, 아침에 일어나 에이전트의 밤샘 호기심 때문에 신용카드가 결제된 사실을 발견하게 됩니다. 제어되지 않는 에이전트 루프(runaway agent loops)로 인한 가계의 신용카드 청구서에 관한 헤드라인은 이미 나타나기 시작했습니다.

종량제 미래에는 그 누구도 보호해 줄 정액제 계층이 없습니다. 오직 신용카드와 계량기(meter), 그리고 운영자가 대시보드에 설정해 두는 것을 기억한 한도(cap)만이 존재할 뿐입니다. 5억 달러를 기록한 한 달은, 가계 버전이 더 작은 규모로, 더 자주, 그리고 그 비용을 감당할 여력이 적은 사람들에게 발생시키려는 것과 동일한 실패 모드(failure mode)의 기업용 버전입니다.

이것이 바로 프리홀드(freehold)에 긴급함이 부여되는 이유입니다. 프리홀드는 이러한 전환 속에서 살아남는 유일한 가격 형태인데, 왜냐하면 프리홀드에는 계량기(meter)가 없기 때문입니다. 운영자는 하드웨어에 대해 단 한 번만 비용을 지불합니다. 추론(inference)은 해당 하드웨어에서 발생합니다. 어떤 규모에서도 토큰당 비용(per-token bill)은 발생하지 않습니다. 책상 위에 Castor를 둔 가계는 잠들기 전에 한도를 설정하는 것을 기억할 필요가 없습니다. 랙(rack)에 Prometheus를 설치한 기업은 5억 달러짜리 송장을 생성하지 않는데, 생성할 송장 자체가 없기 때문입니다.

오늘 프리홀드를 구매하는 운영자는 곧 닥쳐올 계량기(meter)로부터의 보호를 구매하는 것입니다. 계량기가 도착하기를 기다리는 운영자는 연구소(lab)가 그날 정한 요율에 따라 계량기 비용을 지불하게 됩니다.

클라우드 벤더는 어떤 감사 추적(audit trail)을 생성하는가?

벤더에게 운영자를 대신하여 모델이 내린 모든 결정에 대해, 운영자의 규제 기관이 독립적으로 재생(replay)할 수 있고, 벤더의 협조 없이도 검증 가능하며, 운영자의 키를 서명 루트(signing root)로 사용하는 암호학적으로 서명된 감사 추적(audit trail)을 요구하십시오. 벤더는 이를 생성할 수 없습니다. 벤더가 이를 생성할 수 없는 이유는 암호학적 프리미티브(cryptographic primitive)가 기질(substrate)에 포함되어 있지 않기 때문입니다.

벤더는 서버 로그를 생성할 수 있습니다. 벤더는 결제 기록을 생성할 수 있습니다. 벤더는 정제된 메트릭(metrics)을 생성할 수 있습니다. 하지만 벤더는 커밋 시점에 작성되고, 운영자가 실행하는 검증자에 의해 재생 가능하며, 당시 시행 중이던 정책에 따라 운영자가 보유한 키로 서명된 모든 결정의 인과적 유향 비순환 그래프(causal directed acyclic graph)를 생성할 수 없습니다. 그것이 바로 주권적 감사 추적(sovereign audit trail)의 모습입니다. 클라우드 벤더의 기질(substrate)은 이를 담아낼 수 없습니다.

이것이 바로 Mickai 기질(substrate)이 해결하기 위해 설계된 감사 추적 문제입니다. Mickai 주권 지능 운영체제(Sovereign Intelligence Operating System)가 취하는 모든 작업은 오픈 감사 기록(Open Audit Record)에 기록되며, 커밋 시점에 FIPS 204 ML-DSA-65에 따라 서명됩니다. 이는 오프라인 검증자에 의해 엔드 투 엔드(end-to-end)로 추적 가능하며, 작업이 커밋될 당시 시행 중이던 정책에 따라 재생할 수 있습니다. 벤더는 키를 가지고 있지 않기 때문에 이력을 수정할 수 없습니다. 운영자는 시스템이 무엇을 했는지 증명할 수 있습니다. 규제 기관은 운영자가 증명하는 내용을 검증할 수 있습니다.

이것이 바로 시대가 요구하는 기질(substrate)의 변화입니다. 클라우드-AI 체제는 이를 제공할 수 없습니다. Mickai 기질(substrate)은 이를 제공할 수 있으며, 현재 영국 지식재산권청(UK Intellectual Property Office)에 공개 기록으로 등록되어 있습니다.

한 문장으로 요약한 주권적 해답

클라우드-AI 구독을 대체하는 것은, 이동을 정당화할 만큼 충분히 하중을 견디는(load-bearing) 핵심적인 컴퓨팅 요소가 되었을 때 다른 모든 컴퓨팅 요소들을 대체했던 것과 동일한 것입니다. 운영자가 하드웨어를 소유합니다. 주권적 지능 운영체제 (Sovereign Intelligence Operating System, SIOS)가 사전 설치되어 있습니다. 두뇌의 협동체 (cooperative of brains)가 로컬에서 실행됩니다. 감사 기록 (audit record)은 현장에서 서명됩니다. 컨텍스트 (context)를 위한 구독은 없습니다. 사용량 (usage)을 위한 구독도 없습니다. 첫날 지불하는 가격이 평생 지불하는 가격입니다.

이는 임차권 (leasehold)을 대체하는 자유보유권 (freehold) 방식입니다. 메인프레임을 워크스테이션으로, 워크스테이션을 노트북으로, 그리고 워크로드가 이를 정당화할 만큼 충분히 핵심적일 때마다 호스팅 서비스 (hosted services)를 셀프 호스팅 (self-hosted) 대안으로 전환했던 것과 동일한 변화입니다. 생성형 AI (Generative AI)는 이제 그만큼 충분히 핵심적인 역할을 수행하고 있습니다.

Mickai SIOS란 무엇인가

Mickai는 애플리케이션도 프로그램도 아닌, 주권적 지능 운영체제 (Sovereign Intelligence Operating System)입니다. 이는 작업 아래에 놓인 기질 (substrate)입니다. 운영자가 제어하는 하드웨어 위에서, 운영자가 보유한 키를 사용하여, 시스템이 수행하는 모든 것에 대해 완전하고 암호학적으로 검증 가능한 기록과 함께 프런티어급 (frontier-class) 인공지능을 완전히 실행합니다. 이는 설립자인 Micky Irons에 의해 사적으로 보유되며, 그는 약 1,535개의 청구항(claims)을 포함하여 57개의 영국 출원서로 구성된 특허 집합체의 명시된 발명가로서, 영국 식재산권청 (UK IPO) 공개 등록부의 GB2607309.8 이후 번호로 등록되어 있습니다.

SIOS 계층은 다음을 포함합니다:

5개의 하위 시스템으로 구성된 26개의 두뇌 협동조합입니다. PALANTIR는 전략적 추론 (strategic reasoning)을 수행합니다. SENTINEL은 보안 경계 (security perimeter)를 유지합니다. GABRIEL은 모든 외부 메시지를 초안 작성하고 봉인합니다. ZEUS는 제안된 조치에 대해 법률 및 판례 (case law)를 검토합니다. MICHAEL은 국방 운영자를 위한 교리 (doctrine) 및 승인 제한 자료 (clearance-gated material)를 처리합니다. ATHENA는 시스템이 실행하기 전에 어떤 일을 수행해야 하는지 여부를 묻습니다. ATLAS는 국경과 관할권 (jurisdictions)에 대해 추론합니다. PHOENIX는 임상적 추론 (clinical reasoning)을 수행합니다. MAXIMUS는 훈련 주기화 (training periodisation) 및 생체 역학 (biomechanics)을 처리합니다. SALVATOR는 인도주의적 트리아지 (humanitarian triage)를 수행합니다. KARP는 서명된 분석 보고서를 생성합니다. JAXON은 코드를 작성합니다. RAIDEN은 실시간 신호 파이프라인 (real-time signal pipelines)을 실행합니다. QUANTUM은 증명 포함 유도 (proof-carrying derivations)를 생성합니다. 그리고 나머지 26개는 각각 카탈로그화되고, 서명되었으며, 배포된 고유의 도메인, 지식 베이스 (knowledge base), 그리고 툴링 스택 (tooling stack)을 보유하고 있습니다.