Altman의 저렴한 토큰 역설

요약

Sam Altman이 주장한 AI 비용의 급격한 하락과 실제 시장의 양극화 현상을 분석합니다. 일반 모델의 가격은 하락하는 반면, GPT-4.5와 o1-pro 같은 고성능 프런티어 모델은 높은 연산 비용으로 인해 가격이 상승하는 역설적 상황을 다룹니다.

핵심 포인트

고정된 성능 수준의 모델 비용은 매년 약 10배씩 급락함
GPT-4o 등 실무용 모델은 지속적으로 저렴해지는 추세
GPT-4.5, o1-pro 등 고지능 추론 모델은 오히려 가격 상승
모델의 지능과 추론 복잡도에 따른 가격 양극화 발생

2025년 2월, OpenAI의 CEO Sam Altman은 “세 가지 관찰(Three Observations)”이라는 제목의 짧은 블로그 게시물을 발표했습니다. 그는 특정 수준의 AI를 사용하는 비용이 12개월마다 약 10배씩 감소하며, 이는 무어의 법칙(Moore’s Law, 18개월마다 2배)보다 훨씬 빠른 속도라고 주장했습니다. 그는 GPT-4(2023년 초)에서 GPT-4o(2024년 중반)로 넘어오며 토큰당 가격이 150배 하락한 것을 증거로 제시하며 이와 같이 말했습니다.

하지만 그의 게시물이 올라온 지 불과 몇 달 만에 새로운 트렌드가 나타났습니다. AI 비용이 더 이상 균일하게 하락하지 않고 있습니다. 일상적인 모델들은 급격히 저렴해진 반면, 프런티어 모델(Frontier models)인 GPT-4.5와 o1-pro는 이전의 곡선을 깨뜨리는 가격 인상을 보였습니다. 현재 상황을 팩트 체크하고, 어떻게 이 두 가지 현상이 동시에 발생할 수 있는지 설명해 보겠습니다.

Sam Altman의 예측 vs 현실

Altman의 관찰은 모든 모델이 영원히 저렴해진다는 것이 아니었습니다. 그는 고정된 능력 수준(fixed level of capability)에 대해서는 비용이 급락한다고 언급했습니다. 하지만 더 높은 지능을 요구하거나, 더 오래 추론하고, 더 복잡한 작업을 처리하거나, 새로운 벤치마크를 달성하는 모델의 경우 가격이 실제로 상승할 수 있습니다.

2025년 2월 이후, OpenAI는 다음을 출시했습니다:

GPT-4.5 (2025년 2월 27일) — 훨씬 높은 지능을 갖췄지만, 연산 비용(compute cost) 또한 훨씬 높은 “연구 프리뷰(research preview)”.
o1-pro (2025년 3월 20일) — 전문가를 위한 초고성능 추론 모델(ultra-reasoning model)로, 프리미엄 가격이 책정됨.

동시에, OpenAI는 2025년 중반에 GPT-4o의 가격을 조용히 인하하여, 실무용 모델(workhorse model)을 그 어느 때보다 저렴하게 만들었습니다.

팩트 체크: 시간에 따른 토큰 비용 (2023–2025)

아래 표는 주요 모델에 대한 OpenAI API의 공식 가격(백만 토큰당)을 보여주며, 이전 유사 모델 대비 백분율 변화를 포함하고 있습니다.

주류 모델(mainstream models)의 대대적인 디플레이션(deflation), 예: GPT-4o mini는 GPT-3.5 Turbo보다 96% 저렴함
최첨단 지능(frontier intelligence)의 급격한 인플레이션: o1-pro는 기존 GPT-4보다 출력 토큰당 비용이 10배 더 높음
GPT-4o에서 GPT-4.5로의 백분율 증가: 출력 가격이 약 900% 더 높음
GPT-4.5에서 o1-pro로: 추가로 +300%

왜 이런 차이가 발생하는가?

두 가지 힘이 작용하고 있습니다:

“충분히 좋은(good enough)” AI의 범용화(Commoditization) - GPT-4o와 mini는 엔지니어링 최적화(engineering optimizations), 증류(distillation), 그리고 경쟁(Google의 Gemini, Anthropic의 Claude, DeepSeek 등)의 혜택을 받습니다. 이들의 가격은 예측된 대로 하락합니다.

지능을 확장(Scaling)하는 것은 비용이 많이 듭니다 — GPT-4.5와 o1-pro는 테스트 시간 연산(test-time compute, 모델이 더 오래 “생각”하는 방식) 및 방대한 파라미터 수(parameter counts)와 같은 기술을 사용합니다. 각 토큰은 훨씬 더 많은 FLOPs를 필요로 하며, OpenAI는 이에 맞춰 가격을 책정합니다.

Altman 본인이 “세 가지 관찰(Three Observations)”에서 (아직 2025년 가격을 알지 못했을 때) 썼듯이: “특정 수준의 AI를 사용하는 비용은 12개월마다 약 10배씩 떨어진다”라고 했습니다. 하지만 그는 사람들이 원하는 AI의 수준 또한 계속 높아지고 있다는 점을 언급했습니다. 더 높은 성능에 대한 그러한 수요가 프리미엄 티어(premium tiers)를 설명해 줍니다.

이것이 개발자와 기업에게 무엇을 의미하는가?

95%의 작업(챗봇, 요약, 분류, RAG)에 대해서는 비용이 급락하고 있습니다. 이제 GPT‑4o를 백만 토큰당 2.50/2.50/10에 실행할 수 있으며, 이는 2024년의 많은 특화 모델(specialized models)보다 저렴합니다.

최첨단 추론(고급 수학, 코드 생성, 다단계 계획)의 경우에는 사치스러운 가격을 지불해야 합니다. 하지만 그러한 작업들은 이전 모델들로는 어떤 가격을 지불하더라도 불가능했습니다.

요약하자면: 특정 지능 수준에 대한 AI의 무어의 법칙(Moore’s Law)은 여전히 건재합니다. 하지만 다음 단계의 지능을 원한다면, 그 수준 또한 12~18개월 후에 범용화(commoditized)될 때까지는 기꺼이 비용을 지불할 준비를 해야 합니다.

또한, 저는 예측을 좋아하지 않지만, 이 미친듯한 수요를 감당할 스마트한 에너지와 서버를 구축하는 데는 여전히 시간이 필요합니다. 아마 5년 정도는 걸릴지도 모릅니다.

References

Sam Altman, “Three Observations” (February 9, 2025) — https://blog.samaltman.com/three-observations
OpenAI API pricing history (archived) — https://openai.com/api/pricing/
OpenAI announcement: GPT‑4.5 (Feb 27, 2025) — https://openai.com/index/introducing-gpt-4-5/
OpenAI announcement: o1‑pro (Mar 20, 2025) — https://openai.com/index/o1-pro/
OpenAI pricing update for GPT‑4o (mid‑2025, observed via API changelog)

AI 자동 생성 콘텐츠

원문 바로가기