본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 26. 23:33

Altman의 저렴한 토큰 역설

요약

Sam Altman이 주장한 AI 비용의 급격한 하락과 실제 시장의 양극화 현상을 분석합니다. 일반 모델의 가격은 하락하는 반면, GPT-4.5와 o1-pro 같은 고성능 프런티어 모델은 높은 연산 비용으로 인해 가격이 상승하는 역설적 상황을 다룹니다.

핵심 포인트

  • 고정된 성능 수준의 모델 비용은 매년 약 10배씩 급락함
  • GPT-4o 등 실무용 모델은 지속적으로 저렴해지는 추세
  • GPT-4.5, o1-pro 등 고지능 추론 모델은 오히려 가격 상승
  • 모델의 지능과 추론 복잡도에 따른 가격 양극화 발생

2025년 2월, OpenAI의 CEO Sam Altman은 “세 가지 관찰(Three Observations)”이라는 제목의 짧은 블로그 게시물을 발표했습니다. 그는 특정 수준의 AI를 사용하는 비용이 12개월마다 약 10배씩 감소하며, 이는 무어의 법칙(Moore’s Law, 18개월마다 2배)보다 훨씬 빠른 속도라고 주장했습니다. 그는 GPT-4(2023년 초)에서 GPT-4o(2024년 중반)로 넘어오며 토큰당 가격이 150배 하락한 것을 증거로 제시하며 이와 같이 말했습니다.

하지만 그의 게시물이 올라온 지 불과 몇 달 만에 새로운 트렌드가 나타났습니다. AI 비용이 더 이상 균일하게 하락하지 않고 있습니다. 일상적인 모델들은 급격히 저렴해진 반면, 프런티어 모델(Frontier models)인 GPT-4.5와 o1-pro는 이전의 곡선을 깨뜨리는 가격 인상을 보였습니다. 현재 상황을 팩트 체크하고, 어떻게 이 두 가지 현상이 동시에 발생할 수 있는지 설명해 보겠습니다.

Sam Altman의 예측 vs 현실

reality

Altman의 관찰은 모든 모델이 영원히 저렴해진다는 것이 아니었습니다. 그는 고정된 능력 수준(fixed level of capability)에 대해서는 비용이 급락한다고 언급했습니다. 하지만 더 높은 지능을 요구하거나, 더 오래 추론하고, 더 복잡한 작업을 처리하거나, 새로운 벤치마크를 달성하는 모델의 경우 가격이 실제로 상승할 수 있습니다.

2025년 2월 이후, OpenAI는 다음을 출시했습니다:

  • GPT-4.5 (2025년 2월 27일) — 훨씬 높은 지능을 갖췄지만, 연산 비용(compute cost) 또한 훨씬 높은 “연구 프리뷰(research preview)”.
  • o1-pro (2025년 3월 20일) — 전문가를 위한 초고성능 추론 모델(ultra-reasoning model)로, 프리미엄 가격이 책정됨.

quiet

동시에, OpenAI는 2025년 중반에 GPT-4o의 가격을 조용히 인하하여, 실무용 모델(workhorse model)을 그 어느 때보다 저렴하게 만들었습니다.

팩트 체크: 시간에 따른 토큰 비용 (2023–2025)

아래 표는 주요 모델에 대한 OpenAI API의 공식 가격(백만 토큰당)을 보여주며, 이전 유사 모델 대비 백분율 변화를 포함하고 있습니다.

table-tokens

suspecious

  • 주류 모델(mainstream models)의 대대적인 디플레이션(deflation), 예: GPT-4o mini는 GPT-3.5 Turbo보다 96% 저렴함
  • 최첨단 지능(frontier intelligence)의 급격한 인플레이션: o1-pro는 기존 GPT-4보다 출력 토큰당 비용이 10배 더 높음
  • GPT-4o에서 GPT-4.5로의 백분율 증가: 출력 가격이 약 900% 더 높음
  • GPT-4.5에서 o1-pro로: 추가로 +300%

왜 이런 차이가 발생하는가?

두 가지 힘이 작용하고 있습니다:

“충분히 좋은(good enough)” AI의 범용화(Commoditization) - GPT-4o와 mini는 엔지니어링 최적화(engineering optimizations), 증류(distillation), 그리고 경쟁(Google의 Gemini, Anthropic의 Claude, DeepSeek 등)의 혜택을 받습니다. 이들의 가격은 예측된 대로 하락합니다.

지능을 확장(Scaling)하는 것은 비용이 많이 듭니다 — GPT-4.5와 o1-pro는 테스트 시간 연산(test-time compute, 모델이 더 오래 “생각”하는 방식) 및 방대한 파라미터 수(parameter counts)와 같은 기술을 사용합니다. 각 토큰은 훨씬 더 많은 FLOPs를 필요로 하며, OpenAI는 이에 맞춰 가격을 책정합니다.

Altman 본인이 “세 가지 관찰(Three Observations)”에서 (아직 2025년 가격을 알지 못했을 때) 썼듯이: “특정 수준의 AI를 사용하는 비용은 12개월마다 약 10배씩 떨어진다”라고 했습니다. 하지만 그는 사람들이 원하는 AI의 수준 또한 계속 높아지고 있다는 점을 언급했습니다. 더 높은 성능에 대한 그러한 수요가 프리미엄 티어(premium tiers)를 설명해 줍니다.

이것이 개발자와 기업에게 무엇을 의미하는가?

95%의 작업(챗봇, 요약, 분류, RAG)에 대해서는 비용이 급락하고 있습니다. 이제 GPT‑4o를 백만 토큰당 2.50/2.50/10에 실행할 수 있으며, 이는 2024년의 많은 특화 모델(specialized models)보다 저렴합니다.

최첨단 추론(고급 수학, 코드 생성, 다단계 계획)의 경우에는 사치스러운 가격을 지불해야 합니다. 하지만 그러한 작업들은 이전 모델들로는 어떤 가격을 지불하더라도 불가능했습니다.

요약하자면: 특정 지능 수준에 대한 AI의 무어의 법칙(Moore’s Law)은 여전히 건재합니다. 하지만 다음 단계의 지능을 원한다면, 그 수준 또한 12~18개월 후에 범용화(commoditized)될 때까지는 기꺼이 비용을 지불할 준비를 해야 합니다.

또한, 저는 예측을 좋아하지 않지만, 이 미친듯한 수요를 감당할 스마트한 에너지와 서버를 구축하는 데는 여전히 시간이 필요합니다. 아마 5년 정도는 걸릴지도 모릅니다.

References

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0