Open weights 모델이 조용히 좁혀지고 있으며, 이는 문제입니다

LLM (Large Language Model) 세계에서는 어느 정도 경쟁력 있는 open weights (개방형 가중치) 모델이 존재할 것이라는 점이 어느 정도 당연하게 여겨져 왔습니다. 하지만 저는 이것이 더 이상 좋은 가정이 아니라고 생각합니다.

LLM의 짧은 역사

LLM의 비교적 짧은 역사 속에는 두 가지[1] 유형의 LLM이 있었습니다. 바로 closed (폐쇄형) 모델과 "open weights (개방형 가중치)" 모델입니다. Closed 모델에는 (이름에도 불구하고!) OpenAI의 거의 모든 모델이 포함되며, open weights 모델은 다른 연구소들에서 출시됩니다. 유명한 사례로 Llama 시리즈 모델들이 open weights 모델이었으나, 최근에는 MiniMax, Z.ai, DeepSeek, Qwen (Alibaba)과 같은 중국 연구소들이 선도적인 open weights 모델을 출시하고 있으며, Google의 Gemma 시리즈와 OpenAI의 gpt-oss 모델들은 일반적으로 중국 모델들보다 다소 뒤처지는 위치에 있습니다.

Open weights 모델은 누구나 자신의 하드웨어에서 모델을 *실행(run)*할 수 있게 해줍니다. 일반적으로 실행할 가치가 있는 모델들은 매우 강력한 하드웨어를 요구했지만, 더 작은 모델들이 훨씬 더 유용해짐에 따라 이 상황은 빠르게 변하고 있습니다.

OpenAI/Anthropic/Google로 연결되는 API를 통하는 대신, 이러한 모델들을 로컬에서 실행할 수 있다는 점에는 세 가지 주요 장점이 있습니다.

첫째, 개인정보 보호(privacy)와 컴플라이언스(compliance)입니다. 만약 (매우) 민감한 데이터를 보유하고 있다면, 이를 API를 통해 frontier (최첨단) 연구소의 데이터 센터로 보내는 것은 어렵거나 불가능합니다. 모델을 'on prem (온프레미스)'에서 실행할 수 있다는 것은 데이터가 귀하의 네트워크를 벗어날 필요가 없음을 의미합니다.

둘째, 더 많은 유연성을 제공합니다. 이러한 모델들을 fine tuning (미세 조정)의 기반으로 사용하거나, 귀하의 정확한 하드웨어 표준에 맞춰 모델을 quantise (양자화, 대략적으로 압축)할 수 있습니다.

마지막으로, 제가 이 글에서 집중적으로 다룰 부분은 비용입니다. 이들은 frontier 모델들보다 훨씬 더 저렴할 수 있습니다. 당연히 자신의 하드웨어에서 실행하는 경우, 하드웨어의 capex (자본 지출) 비용과 전기 및 운영 비용만 걱정하면 됩니다. 하지만 더 중요한 점은, 수십 개의 기업이 귀하를 대신해 호스팅 방식으로 이 모델들을 실행해 줄 것이며, 일반적으로 토큰당 비용이 frontier 모델의 10% 미만이라는 것입니다.

Open weight 모델이 매우 중요한 이유

경제학의 경쟁 시장 이론 (contestable markets theory)을 느슨하게 빌려오자면, 독점적(또는 과점적) 시장에서도 저렴하고 신뢰할 수 있는 대안이 존재할 때는 기존 기업들이 경쟁적으로 행동하는 경향이 있습니다. 이 이론이 완벽하게 들어맞는 것은 아닙니다. 이 이론은 엄격하게 매몰 비용 (sunk costs)이 거의 제로에 가깝다고 가정하는데, 이는 프런티어 (frontier) 모델 학습과는 분명히 정반대되는 상황이기 때문입니다. 하지만 그 기저의 메커니즘은 유효합니다. 위협은 '잠재적'입니다. 소비자가 전환할 수 있는 선택지가 존재한다는 사실 자체가 가격 책정을 규율합니다.

본질적으로, 저는 Open weights 모델이 프런티어 연구소들에 상당한 하방 가격 압력을 제공한다고 믿습니다. 이것이 절대적인 것은 아닙니다. 사람들은 더 높은 품질의 모델을 사용하기 위해, 그리고 OpenRouter를 통한 저렴한 추론 제공업체 대신 조 단위 달러 규모의 기업과 추론 계약을 맺음으로써 얻는 이점을 위해 (훨씬) 더 많은 비용을 지불할 것이 분명하기 때문입니다.[2] OpenAI 등은 기밀 유지와 같은 사항에 대해 서비스 수준 협약 (SLA) 및 법적 구속력이 있는 약속을 제공합니다.

하지만 제 관점에서는, 기존의 과점적 시장 행태가 고개를 들기 매우 어려울 정도로 충분한 하방 압력을 제공한다고 봅니다. 만약 프런티어 연구소들이 (물론 우연히겠지만) 하룻밤 사이에 가격을 5배 인상하기로 결정한다면, 엄청난 수의 사람들이 특히 요구 사항이 덜 까다로운 사용 사례에 대해서는 Open weights 모델로 전환할 것입니다.

저는 가격 행동 관점에서 Open weights 모델을 제네릭 의약품 (generic pharmaceuticals, 복제약)과 비슷하다고 생각합니다. 제네릭 의약품을 사용할 수 있게 되면, 거대 제약 회사들은 가격을 제네릭 가격에 훨씬 더 가깝게 낮추고, 가격을 유지하기 위해 제네릭 치료제보다 한 단계 '앞서' 있는 새로운 치료제 개발에 노력을 집중합니다.

Open weights 모델이 없다면, 프런티어 연구소들은 현재보다 훨씬 더 강력한 가격 결정력을 가질 것입니다.

라이선스는 변하고 있다

하지만 Open weights 모델의 가용성이 당연하게 보장되는 것은 아닙니다. 이 모델들은 학습 비용이 많이 들며, 이를 만드는 기업들은 상업적 기업입니다. 아마도 (상당 부분?) 중국 국가의 보조금을 받고 있을 수도 있지만, 이들은 자선 단체가 아닙니다.

실제로 우리는 이러한 모델들의 라이선스 조건이 상당히 엄격해지고 있는 것을 목격했습니다. Meta는 (지금까지는) 그들의 최신 "Muse Spark" 모델들에 대한 오픈 웨이트 (open weights)를 완전히 중단했으며, 모델을 전혀 공개하지 않고 있습니다.

Alibaba는 점점 더 모델을 자사의 API를 통해 먼저 (또는 일부 변형 모델의 경우에만) 출시하고 있습니다. Kimi의 K2.6 라이선스는 저작자 표시 (attribution) 조항을 추가했습니다. 만약 월간 활성 사용자 수 (MAU)가 1억 명을 초과하거나 월 매출이 2,000만 달러를 초과하는 경우, 제품의 UI에 "Kimi K2.6"을 눈에 띄게 표시해야 합니다. 프랑스의 Mistral 또한 상업적 이용에 대해 다양한 라이선스 조건을 부과했습니다.

예외도 있습니다. DeepSeek은 실제로 더 허용적인 (permissive) 방향으로 나아갔지만, 전반적인 추세는 허용 범위가 좁아지는 라이선스 방향(그리고 Meta와 Alibaba 모두 일부 또는 모든 모델의 출시를 중단하는 것)이라고 말하는 것이 타당할 것 같습니다.

다음에는 어떤 일이 일어날까요?

(현재로서는 가설적인) 1년 뒤에 우리는 이전에 오픈 웨이트 (open weights)였던 최고의 모델들 중 대부분 또는 모든 모델이 더 이상 공개되지 않는 상황에 처할 수도 있습니다. 모델들 간의 가격 비교는 분명히 존재하겠지만, 이러한 모델들을 학습시키는 비용과 복잡성이 계속 증가한다면, 결국 소수의 플레이어들—서구의 거대 3대 프런티어 연구소 (frontier labs)와 몇몇 중국 연구소들—만 남게 되거나, 혹은 아마도 국가가 명령한 대로 이들이 하나 또는 두 개의 중국 '슈퍼 연구소 (superlabs)'로 '합병'되는 상황이 올 것이라고 가정하는 것이 합리적입니다. 전략적 산업 분야에서 이러한 종류의 통합 사례는 매우 많습니다. 중국은 철도 (CRRC), 원자력, 항공사, 통신 분야에서 정확히 이와 같은 방식을 취해왔으며, 서구 또한 예외는 아닙니다. 냉전 이후의 통합 과정을 거친 방위 산업체들을 보십시오.

이것이 시사하는 바는 솔직히 우려스럽습니다. AI는 막대한 양의 소비자 잉여 (Consumer surplus)를 창출합니다. 저는 제가 지불하는 토큰 비용보다 훨씬 더 큰 가치를 돌려받고 있으며, 지금 가격의 10배를 지불하더라도 두 번 생각하지 않고 지불할 용의가 있습니다. 가치가 높은 전문적인 작업이나 에이전트적 (Agentic) 작업의 경우, 제가 지불할 용의가 있는 금액과 실제로 지불하는 금액 사이의 격차는 훨씬 더 큽니다. 그 격차는 오픈 웨이트 (Open-weights)라는 바닥이 없는 과점 체제 (Oligopoly)가 가로챌 수 있는 전리품입니다.

이러한 세상에서 경제 이론은 권력과 경제적 부가 소수의 기업으로 역사적으로 집중될 것임을 가리킵니다. 즉, 연구소(Labs)들이 그 소비자 잉여를 자신들의 마진 (Margin)으로 직접 추출하기 시작할 것입니다. 그리고 소수의 기업이 형성하는 과점 체제와 거대한 진입 장벽 (새로운 모델을 위한 자본 지출 (Capex))이 결합되면, 가격 경쟁은 제한적일 가능성이 높습니다.

마찬가지로, 이러한 디스토피아적 비전이 부당할 수도 있습니다. 하드웨어가 점점 더 빨라짐에 따라, "충분히 괜찮은" 모델을 훈련하는 것이 시간이 지남에 따라 실제로 더 쉬워질 수도 있기 때문입니다. 또한 하드웨어 제조업체가 소수에 불과함에도 불구하고, 우리는 AI 하드웨어 분야에서 치열한 경쟁을 목격하고 있습니다. 지식 증류 (Distillation) — 프런티어 (Frontier) 모델의 출력을 사용하여 더 작은 모델을 훈련하는 것 — 가 때때로 완화 장치로 언급되기도 하지만, 이 역시 애초에 강력한 베이스 모델 (Base model)에 접근할 수 있는지 여부에 달려 있으며, 이것이 바로 여기서 위기에 처한 바로 그 요소입니다.

경쟁적인 오픈 웨이트 생태계는 전체 AI 경제를 떠받치는 조용한 지지 기반 (Load-bearing assumption)이었습니다. 이것이 침식되고 있다는 사실과 그것이 광범위한 경제에 미칠 영향은 매우 막대하므로 주의를 기울일 가치가 있습니다.

기술적으로 세 가지 — 오픈 웨이트 모델은 오직 최종 '모델'만을 공개합니다. 다른 카테고리는 "완전 공개 (Fully open)" 또는 "재현 가능 (Reproducible)"이라고 불리며, 여기에는 모든 훈련 데이터와 관련 훈련 프로세스 문서가 포함됩니다. 이는 아마도 ~와 가장 유사할 것입니다

open source 우리가 소프트웨어에서 알고 있는 방식 ↩︎OpenRouter는 'API의 API (API of APIs)'를 제공하며, 이는 특정 모델에 대해 가장 저렴하거나 사용 가능한 추론 제공자 (inference provider)에게 요청을 라우팅합니다. 이는 한 제공자에게 문제가 발생할 경우 즉시 다른 제공자로 전환되므로 신뢰성을 (대폭) 향상시키는 데 도움이 됩니다. 마찬가지로 더 저렴한 제공자가 있다면 그쪽으로 전환되는데, 이는 정말로 Milton Friedman의 꿈과도 같습니다 ↩︎

Insights

Open weights 모델이 조용히 좁혀지고 있으며, 이는 문제입니다

요약

핵심 포인트

LLM의 짧은 역사

Open weight 모델이 매우 중요한 이유

라이선스는 변하고 있다

다음에는 어떤 일이 일어날까요?

댓글

Visa의 Open USD 추진, Circle의 스테이블코인 해자(Moat)를 압박하다

도구 설명 스캔에 대한 조언: 페이로드를 다른 곳에 숨기다

AI 시대를 위한 관측 가능성(Observability) 설계 — 애플리케이션 / 인프라 / CI / LLM, 각각의 형태에 맞게 (Part

AI API 비용을 95% 절감한 방법: 실제 수치 공개

Visa의 Open USD 추진, Circle의 스테이블코인 해자(Moat)를 압박하다

도구 설명 스캔에 대한 조언: 페이로드를 다른 곳에 숨기다

AI 시대를 위한 관측 가능성(Observability) 설계 — 애플리케이션 / 인프라 / CI / LLM, 각각의 형태에 맞게 (Part

AI API 비용을 95% 절감한 방법: 실제 수치 공개