본문으로 건너뛰기

© 2026 Molayo

GeekNews헤드라인2026. 05. 18. 20:01

AI 구독은 엔터프라이즈의 시한폭탄

요약

프런티어 모델 제공자들의 높은 구독료와 API 비용 모델이 오픈소스 LLM의 발전과 자체 인프라 구축 추세로 인해 위협받고 있다는 분석입니다. 오픈소스 모델의 성능 향상과 비용 효율성이 높아짐에 따라, 기업들이 고가의 프런티어 모델 대신 자체적인 vLLM 인프라를 구축하려는 움직임이 가속화될 수 있습니다.

핵심 포인트

  • 오픈소스 LLM(Qwen, Gemma, Deepseek 등)의 발전으로 인해 프런티어 모델의 시장 지배력이 약화될 가능성이 있음
  • 기업들은 비용 절감을 위해 프런티어 모델 구독 대신 자체적인 vLLM 인프라 구현을 고려하기 시작함
  • 프런티어 모델 제공자들은 높은 마진을 유지해야 하지만, 경쟁 심화와 오픈소스의 추격으로 인해 가치가 빠르게 하락할 수 있음
  • 하드웨어 요구량과 확장 법칙의 한계로 인해 로컬 모델이 프런티어 모델을 완전히 대체할지에 대해서는 논쟁이 존재함

비싸도 쓰겠지 싶으니 LLM Provider들이 값을 올리는 것일 텐데요. GLM, qwen, deepseek 같은 오픈소스 LLM이 앞으로 어떻게 될지 궁금하네요. 사람들이 이 값을 내고 프런티어 모델을 써야 하나, 차라리 자체 vLLM 인프라를 구현하는 수고를 들이더라도 오픈소스를 쓰는 게 맞나 계산을 하기 시작할 텐데요.

모든 AI 구독은 프런티어 모델 제공자에게 시한폭탄 같음
몇 년 안에 오늘날의 프런티어 모델만큼 좋은 로컬 모델을 거의 비용 부담 없이 돌리게 될 것이고, 프런티어 회사들의 기업 시장 기반은 무너질 것임

“몇 년 안에 오늘날의 프런티어 모델만큼 좋은 로컬 모델을 돌린다”는 근거가 뭔지 모르겠음 메모리 요구량만 봐도 엄청나고, 앞으로 한동안은 공유된 전용 호스팅 하드웨어를 높은 가동률로 쓰는 쪽이 훨씬 비용 효율적일 것임

다르게 말하면 프런티어 모델은 시장 경쟁 때문에 매우 빠르게 가치가 떨어지는 자산임
서로와 오픈 가중치 모델보다 앞서려면 계속 좋아져야 하므로, 오히려 시한폭탄의 반대에 가까움
현재 수준의 추론 토큰은 계속 더 싸질 것이고, 로컬이 최종 상태일지는 하드웨어 요구가 높아서 모르겠지만 경쟁은 이윤율을 0에 가깝게 밀어붙이는 경향이 있음
이 주제에 대한 긴 논의: https://corecursive.com/the-pre-training-wall-and-the-treadm...

지난 한 달 동안 Qwen, Gemma, Deepseek를 LiteLLM 뒤에 붙여 미래가 어떨지 보여주는 작은 데모를 만들었음
토큰 사용량을 모니터링하고, 무식하게 토큰을 많이 쓰는 대신 추론 비용을 낮추고 사내화하려고 적극적으로 움직이는 중임
상사는 아주 만족했고, 이제 더 넓게 배포하고 있음. 이게 미래라고 봄

몇 년 안에 오늘날의 프런티어 모델만큼 좋은 로컬 모델을 돌릴 거라는 말은 매우 의심스러움 확장 법칙도 이미 부담이 커졌고, “지수적”이라는 과장에 넘어가면 안 됨
게다가 실제 경쟁 상대는 2년 뒤의 프런티어 모델임

하드웨어 생산이나 모델 구조에 중요한 돌파구가 없다면 오히려 반대임
1~2년 전보다 지금은 더 크고, 더 비싸고, 더 많은 에너지를 먹는 하드웨어가 필요함

AI 양쪽 진영 글들의 과장된 톤이 너무 피곤함
경제와 토큰 제공자 사업을 잘 아는 사람과 화이트보드 앞에서 “다섯 살에게 설명하듯” 묻고 싶음
토큰 제공자에게는 마진 게임이고 소비자에게는 서비스/제품 품질 게임인지, 품질과 마진의 선이 언젠가 교차한다면 돈이 떨어지기 전에 그 지점에 도달하는 경주인지, 그렇다면 둘 사이의 차이가 아주 컸던 역사적 사례가 있는지 궁금함
LLM은 소비자가 “얼마나 좋아지길 기대하는지”에 사실상 한계가 없다는 점에서 독특해 보이고, 이메일처럼 계산 자원 관점에서 확장하기 쉬운 서비스와는 다름
아주 초보적인 질문이지만, 지속 가능한 사업 모델이 생기기 전에 왜 IPO를 하고 싶어 하는지도 궁금함. 장점이 뭔가?

AI에게 Opus 토큰 생산 비용을 물어보면 하드웨어, 전력, 냉각, 호스팅을 포함해 100만 토큰당 0.216달러라는 답을 받았음
여기 올라온 링크들에 따르면 Anthropic 지출의 약 30%가 추론이고, 나머지 70%는 다음 모델 개발 같은 연구개발임
이를 반영하고 이윤을 붙여 숫자를 단순화하면, 돈을 벌려면 100만 토큰당 1달러 정도에 팔면 됨
현재 API 가격은 100만 토큰당 25달러라 수익성이 있다는 데 의문이 없음
반면 월 200달러 Max 플랜을 극단적으로 쓰면 월 100억 토큰까지 가능하고, 이는 100만 토큰당 0.02달러라 엄청난 손실을 떠안는 셈이며 언젠가는 사라질 것임
다만 월 100달러 Anthropic 플랜으로 월 1억 토큰을 쓰는 정도라면 회사는 돈을 벌고 있음
월 100억 토큰을 쓰려면 아주 긴 시간 일하고 AI 활용에 정말 능숙해야 하는데, 그런 사람은 이미 몇 년 동안 AI를 써 왔고 Opus 전부터도 유용하게 썼을 가능성이 큼
Opus를 잃으면 실망하겠지만, 그런 사용자야말로 덜 강한 모델도 잘 활용할 수 있는 유형이라 몇 년 뒤에는 사내 호스팅 오픈소스 모델로 옮겨도 지금과 같은 100만 토큰당 0.02달러 수준을 낼 수 있음
그래서 글의 비관적 분위기에는 설득되지 않음. 상황은 바뀌겠지만 AI 사용의 끝을 뜻하지는 않음

글의 정서에는 동의하지만, 문체가 너무 LLM스럽게 느껴짐
특히 섹션 구성과 “That is not a rounding error. That is a line item that needs its own budget code.” 같은 펀치라인이 그렇다

Claude가 이런 문장을 정말 많이 만들어냄
꽤 짜증 나고, 같은 프롬프트로 Gemini에서는 잘 못 봤음

이 글은 애초에 누가 쓴 건지 모르겠음
글에 저자 이름이 없음

Pangram은 이 글을 높은 확신도로 100% AI 생성이라고 표시함

Brad Gerstner는 토큰이 손해 보며 팔리는 게 아니라고 확인했음
공식이 API와 구독을 어떻게 나누든, 회사들은 순수 토큰 판매 기준으로는 이익을 내고 있음
급여와 주식 보상까지 포함하면 손실일 수 있지만, 토큰 자체는 지금 수익 상태임

지구에서 가장 강력한 엔진을 단 로켓이 궤도를 벗어난 뒤 엔진을 끄고 “동력 없이 날고 있다”고 말하는 걸 보는 것 같음
지금은 그럴 수 있지만, 여기까지 온 방식은 그게 아님
회수해야 할 투자는 수조 달러인데 매출은 많아야 수십억 달러라, 토큰이 가까운 시일 안에 이익을 낸다는 계산은 맞지 않음

손해 보고 파는 건 아니지만, 현재 손실과 비용을 덮을 만큼 비싸게 파는 것도 아님
손실은 이상한 순환 자금 조달 구조 속에서 돌려막기 되고 있고, 언젠가는 부채 위기로 무너질 가능성이 큼

다시 말해 AI 회사들은 비용 차감 전 이익이 양수임

Claude Code나 Codex 토큰도 그럴지는 모르겠음
그쪽은 크게 보조금을 받고 있다고 생각하지만, 실제 가치를 느끼는 건 그것들뿐임

“AI” 전체의 문제는 없어도 살기 쉽다는 점임
AI 회사도 알고, 사용자도 알고, 가장 AI 에이전트에 우호적인 관리자도 알고 있음
지금 당장 전 세계에서 AI를 전부 제거한다고 상상하면 결과는 그냥 평소대로의 업무임
이 글은 그 점을 충분히 강조하지 않음. PR 검토를 실제 엔지니어에게 맡겨야 하는 날이 무섭다는 식인가?

새로운 기술 도입 초기에는 항상 그렇지 않나 싶음
기술이 더 깊게 통합될수록 점점 덜 사실이 됨
전기 모터가 나온 지 몇 년 안 됐을 때도 같은 말을 할 수 있었고, 그냥 증기로 돌아가면 됐을 것임
하지만 지금 전기 모터 없이 살려고 하면 사회가 붕괴함
질문은 지금 없어도 되는지가 아니라, 완전히 통합된 뒤인 5~10년 후에도 없어도 되는지임

그래서 더 강하게 밀어붙이는 것일 가능성이 큼
정직한 매출을 만들기 위해서가 아니라, AI 제품을 너무 깊게 박아 넣어서 “그냥 AI를 빼자”가 선택지로 보이지 않게 만들려는 것임
유지 비용이 계속 높아져 항공사식 정부 구제금융 수준을 넘어서더라도 말임
거짓 약속으로 팔리는 새로운 부의 추출 중개층임

JavaScript를 쓰는 사람이라면 당연히 그럴 것임
적어도 JavaScript를 작성하기 위해서는 AI 없이 못 살겠음

아주 평범하고 일반적인 작업에까지 AI 도구를 쓰라고 권하는 걸 보면 늘 이상함
가끔 써주지 않으면 죽는 반려동물처럼 취급하는 느낌임

이 글은 틀렸음. 이런 구독은 기업에 제공되지 않는 게 아님
회사들은 API 가격에 훨씬 가까운 금액을 내고 있음
전략은 개인 구독에서 무한 토큰에 익숙하게 만든 뒤, 그 행동이 직장으로 옮겨가길 기대하는 것임

제공됨
팀이나 엔터프라이즈 좌석은 소비자 가격보다 비싸지만, 사용량 한도가 초기화되는 고정 가격임
월 20/100/200달러 플랜에 해당하는 좌석을 멤버에게 배정할 수 있고, 전부 종량제로도 가능함
구매 방식은 여러 가지임

구독은 기업에도 확실히 제공됨
동등한 소비자 플랜에 해당하는 종량제 플랜도 있음

기업용 구독을 왜 이야기하는지 헷갈렸음
내가 다니는 회사는 API 사용량 기준으로 청구됨

이런 문단들을 보면 AI가 뽑아낸 글에 더 가까워 보임
“전반적으로 패턴은 동일하다. 경제성이 아니라 도입을 위한 가격 책정. 조직을 묶어둔다. AI를 모든 팀의 일상 업무에서 하중을 지탱하는 부분으로 만든다. 청구서는 나중에 걱정한다.”

그뿐 아니라 글에서 호들갑 떠는 API 요금 규모도 여전히 비교적 사소함
월 1만 달러가 아무것도 아닌 건 아니지만, 그 돈으로 엔지니어 10~20명 팀을 지원한다면 꽤 좋은 레버리지임

원문을 끝까지 읽지는 않았지만, AI가 썼다는 건 알아볼 수 있었음 OpenRouter를 AI 제공 원가의 기준점으로 쓸 수 있을지도 모름
Claude보다 가성비가 좋다는 말을 계속 듣는데, 그렇다면 Anthropic이 어떤 이유로 특히 비효율적이거나 추론에서 이익을 내고 있다는 뜻으로 보임
학습에서는 돈을 잃을 수 있지만, 그건 선도 연구소로 남기 위한 비용일 가능성이 큼
어느 한 회사가 부채 등으로 무너지면 기업들은 그냥 갈아타면 되지 않나 싶음

“It’s not X. It’s Y.” 같은 문구나 “load-bearing”을 은유로 쓰는 걸 한 번만 더 보면 토할 것 같음

그런 표현을 꽤 많이 뽑아봤고, 짧은 목록이 아님
“보조금 시대는 우아하게 끝나고 있지 않다. 곳곳에서 균열을 드러내고 있다.”
“질문은 좋은 거래였는지가 아니다. 그 거래가 얼마나 오래 버티느냐다.”
“동시에 세네 개의 코딩 에이전트를 돌리는 개발자는 채팅 대화의 3배나 4배 토큰을 쓰는 게 아니다. 한 자릿수 차원이 아니라 한 자릿수 이상 더 쓴다.”
“이것들은 더 이상 실험이 아니다. 하중을 지탱하는 워크플로다.”
“그건 반올림 오차가 아니다. 별도 예산 코드가 필요한 항목이다.”

큰 가격 조정이 오면, 무료나 월 20달러 구독으로 소셜 미디어 댓글을 생성하던 많은 사람들이 실제 비용을 보고 다시 직접 쓰게 될지도 모름
적어도 그렇게 기대할 수는 있음

“the unlock”이라고 표현하는 것도 마찬가지로 싫음

이 글은 초반은 괜찮았음
데이터가 있고 논리도 그럴듯했는데, 중간쯤 가자마자 트렌드 예시, 또 다른 예시, 세 번째 예시, “그건 단순히 X가 아니라 Y다”가 튀어나옴
잘 쓴 글을 읽다가 출처 링크를 눌렀는데 릭롤을 당한 것만큼 거슬림

엔터프라이즈 고객이 월 20달러짜리 Claude Pro 구독을 쓰는 게 아님
우리 회사는 개발자에게 월 약 1천 달러어치 사용 한도를 제공하고, 내가 보기엔 API 비용 대비 절감은 많아야 30% 정도임
미친 보조금 수준은 아님
다른 직무는 월 50달러만 허용되는 경우가 많고, 그 사람들은 계속 한도를 다 씀 GitHub Copilot은 비즈니스와 엔터프라이즈 좌석에서 이런 방식을 써 왔지만 곧 한계에 부딪힐 것임
6월 이후 소비자 Pro와 Pro+ 계정을 재정렬하면 빠르게 따라올 거라고 봄
OpenAI는 고객을 묶어두려고 토큰을 퍼붓는 것 같아서, IPO 이후 OpenAI 쪽의 가격·조건 급변이 가장 걱정됨
Anthropic은 이미 이 부분에서 책임 있게 움직이고 있고, GitHub Copilot도 앞으로 몇 달 안에 과도한 보조금을 바로잡으려는 중임

GitHub Copilot만 정말 말도 안 되는 보조금을 줬음
토큰이 아니라 “요청” 단위로 과금했기 때문임
3센트짜리 요청 하나가 토큰 기준으로는 20달러 이상을 태울 수도 있었고, 그 방식은 이번 달에 끝남
나도 GHCP로 큰 작업 덩어리를 처리해 와서 걱정했지만, 새로 나온 청구 추정기를 보니 API 가격 기준으로 월 150~200달러 정도였음
월 20달러 구독에 대한 보조금이긴 해도 미친 수준은 아님
에이전트식 코딩 도구를 책임 있게 많이 쓰면 API 가격 기준으로 대략 월 200달러 선에 놓일 가능성이 큼
그 가격에서도 제공자가 돈을 번다면, 서구권에서 개발자를 고용하는 기업 입장에서는 절약되는 시간을 고려할 때 받아들이기 어렵지 않음
진짜 위험은 개인 프로젝트를 하는 바이브 코더들에게 있음
보조금 붙은 플랜을 남용해 거대한 앱을 만드는 시대는 끝나고 있음

개발자를 대체한다면 월 20달러나 100달러보다 비싼 게 말이 됨
LLM 회사들의 진짜 문제는 코딩 외 영역에서 아직 가치를 보여주지 못했다는 점임
그게 없으면 그냥 코딩 도구로 격하될 것임
그래서 지금 서두르는 것이고, 어떤 업무 흐름을 더 자동화할 수 있는지가 핵심임
서류 작업은 전부 자동화할 수 있을지도 모름
다른 영역들이 개발되면 가격 모델을 바꿀 것임

AI 자동 생성 콘텐츠

본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0