주말 동안 30개 AI API를 가격별로 분석한 결과 — 충격적인 내용 - Insights | Molayo

자, 제가 경험한 일은 이렇습니다. 주말 동안 30개의 AI API를 가격별로 분석했는데, 그 결과가 저를 충격에 빠뜨렸거든요.

3주 전 저는 코딩 부트캠프를 마쳤습니다. 정말 들떠 있었죠. 아이디어도 있었고, GitHub 포트폴리오도 있었지만, 실제로 AI 모델을 제 앱에 연결하는 데 얼마나 비용이 들지 전혀 감이 오지 않았습니다.

그래서 챗봇을 만들었습니다. 배포했고, 흥분했죠. 그리고 청구서를 확인했습니다. 거의 울 뻔했어요.

그 주말의 탐색 과정은 모든 신규 개발자가 알아야 할 무언가로 변했고, 그래서 제가 잊어버리기 전에 기록으로 남기려 합니다. 저처럼 이제 막 시작하는 분들에게는 이 글이 수백 달러를 절약해 줄 수도 있을 거예요.

내가 뭘 하고 있는지 전혀 알지 못했다는 것을 깨달은 순간

부트캠프에 대해 말씀드리자면, 그들은 React를 가르치고, Node를 가르치고, fetch 호출을 하는 방법을 가르칩니다. 하지만 그들이 제대로 다루지 않는 것은 토큰당 비용을 청구하는 API를 만났을 때 무슨 일이 벌어지는가입니다. 그리고 '테스트 스크립트'가 종료 조건(stop condition)을 추가하는 것을 잊어서 갑자기 40,000개의 토큰을 생성할 수 있다는 것입니다.

저는 본질적으로 '안녕하세요 세계(hello world)' 수준의 챗봇에 대해 GPT-4o 가격을 지불하고 있었습니다. 같은 작업을 수행할 수 있는 더 저렴한 모델이 있다는 것을 전혀 몰랐습니다. 저는 그저 '좋은 AI = 비싼 AI'라고 가정했을 뿐입니다.

저는 틀렸었습니다. 너무나도 많이요.

가격 책정(pricing)을 파고들기 시작하면서, Global API 플랫폼에서 백만 개의 출력 토큰당 단돈 $0.01로 괜찮은 모델들을 얻을 수 있다는 것을 발견했습니다. 다시 한번 말씀드리자면 — 1센트입니다. 백만 개 토큰당요. 저는 그게 가능하다는 걸 전혀 몰랐습니다.

제가 찾은 가장 저렴한 모델들 (그리고 그것들이 존재하는 이유)

가장 저렴한 등급에 완전히 충격을 받았습니다. 이 모델들은 백만 개의 토큰당 거의 비용이 들지 않습니다:

Qwen3-8B: 출력 토큰당 $0.01, 입력 토큰당 $0.01
GLM-4-9B: $0.01 / $0.01
Qwen2.5-7B: $0.01 / $0.01
GLM-4.5-Air: $0.01 / $0.07
Qwen3.5-4B: $0.05 / $0.05

참고로, 이것은 수천 번의 대화가 될 수 있는 것에 대해 단 하나의 껌(gumball) 가격 정도입니다. 처음에는 제 두뇌가 그걸 계산할 수가 없었습니다.

조금 더 높은 수준이지만, 여전히 터무니없이 저렴합니다:

Hunyuan-Lite: $0.10 / $0.39
Qwen2.5-14B: $0.10 / $0.05
Step-3.5-Flash: $0.15 / $0.13
Qwen3.5-27B: $0.19 / $0.33
ByteDance-Seed-OSS: $0.20 / $0.04
Hunyuan-Standard: $0.20 / $0.09
Hunyuan-Pro: $0.20 / $0.09
ERNIE-Speed-128K: $0.20 / $0.00 (네, 입력은 무료입니다)
Qwen3-14B: $0.24 / $0.20

일부 모델이 입력 토큰(input tokens)에 대해 말 그대로 $0.00를 부과하는 것을 처음 보았을 때, 저는 세 번이나 다시 확인해야 했습니다. 오타가 아닙니다. 특정 모델에서는 입력 측이 무료일 수 있으며, 모델이 출력(output)을 생성할 때만 비용을 지불하면 됩니다.

나를 입이 벌어지게 만든 모델

목록의 바로 중간에 위치한 모델은 DeepSeek V4 Flash입니다. 이 모델은 128K 컨텍스트 윈도우(context window)를 가지며, 출력 토큰 100만 개당 $0.25, 입력 토큰 100만 개당 $0.18의 비용이 듭니다.

왜 이 모델이 저를 경악하게 만들었을까요? AI 세계에서 이 가격은 기본적으로 기적이기 때문입니다. DeepSeek V4 Flash는 (벤치마크가 시사하는 바에 따르면) GPT-4o에 근접한 품질을 제공하면서도 비용은 아주 일부분에 불과합니다. 무엇과 비교하느냐에 따라 10배에서 40배까지 더 저렴합니다.

저는 부트캠프 졸업생입니다. 제 앱은 기본적인 채팅과 문서 요약(document summarization) 기능을 수행합니다. 저에게는 $3.50짜리 모델이 필요하지 않습니다. 빠르고, 신뢰할 수 있으며, 저렴한 것이 필요합니다. DeepSeek V4 Flash는 이 모든 조건을 충족합니다.

약간 더 큰 작업 부하(workloads)를 위해서는 다음 모델들도 훌륭한 선택입니다:

Qwen3-32B: $0.28 / $0.18
Hunyuan-TurboS: $0.28 / $0.14
Qwen2.5-72B: $0.40 / $0.20
DeepSeek-V3.2: $0.38 / $0.35

존재조차 몰랐던 계층

이번 주말 전까지 저는 그저 "저렴한 AI"와 "비싼 AI"만 있다고 생각했습니다. 알고 보니 제가 완전히 놓치고 있었던 거대한 중간 지대가 존재했습니다.

중급 모델 (출력 토큰 100만 개당 약 $0.30에서 $0.80 사이):

Doubao-Seed-Lite: $0.40 / $0.10
Ling-Flash-2.0: $0.50 / $0.18
Qwen3-VL-32B: $0.52 / $0.26 (시각 기능 지원!)
Qwen3-Omni-30B: $0.52 / $0.30 (멀티모달 (Multimodal) 지원!)
GLM-4-32B: $0.56 / $0.26
Hunyuan-Turbo: $0.57 / $0.18
GLM-4.6V: $0.80 / $0.39 (또 다른 시각 모델)
Doubao-Seed-1.6: $0.80 / $0.05
DeepSeek V4 Pro: $0.78 / $0.57

이 가격대에서 시각 (Vision) 및 멀티모달 (Multimodal) 모델이 존재한다는 사실에 충격을 받았습니다. 전혀 몰랐던 사실입니다. 저는 이미지를 "볼" 수 있는 모델이라면 엄청나게 비쌀 것이라고만 생각했습니다.

토큰 100만 개당 $0.52인 Qwen3-VL-32B는 그 성능을 고려하면 솔직히 범죄 수준으로 저렴합니다. 예산이 한정된 상태에서 이미지 기반 앱을 구축하고 있다면, 바로 이 모델이 정답입니다.

실제로 강력한 성능이 필요할 때

때로는 정말 강력한 성능이 필요할 때가 있습니다. 복잡한 추론 (Reasoning), 기업급 신뢰성, 어려운 문제를 해결할 수 있는 사고 모델 (Thinking models) 등이 필요할 때 말이죠. 그럴 때는 출력 토큰 100만 개당 $0.80에서 $3.50 사이의 프리미엄 계층 (Premium tier)이 등장합니다.

정점에 있는 모델들은 다음과 같습니다:

DeepSeek-R1
Kimi K2.5
Kimi K2.6
Qwen3.5-397B

이들은 최첨단 "사고 (Thinking)" 모델들입니다. 저렴하지는 않지만, 서구권 제공업체들이 부과하는 비용과 비교하면 말도 안 되게 비싼 수준도 아닙니다.

하지만 대부분의 부트캠프 수준 프로젝트라면? 아마 이런 모델들은 필요하지 않을 것입니다. 저는 이번 주말에 $0.30 미만의 모델들만 사용하여 세 개의 앱을 만들었고, 모두 훌륭하게 작동했습니다.

내가 발견한 멋진 기술: 스마트 라우팅 (Smart Routing)

이 부분은 정말 놀라웠습니다. Global API에는 각 쿼리에 대해 최적의 모델을 자동으로 선택해 주는 "GA 라우팅 (GA Routing)"이라는 것이 있습니다. 두 가지 옵션이 눈에 띄었습니다:

Ga-Economy: $0.13 / $0.18 — 기본적으로 저가형 스마트 라우터 (Smart router)
Ga-Standard: $0.20 / $0.36 — 중급형 스마트 라우터 (Smart router)

어떤 모델을 사용할지 고민할 필요가 없습니다. 라우터가 알아서 판단하니까요. 모델 선택에 대한 박사 학위가 없는 저 같은 사람에게 이것은 엄청난 혜택입니다. 설정해 두면 신경 쓸 필요가 없습니다.

나의 첫 번째 Python 테스트 (실제로 작동했다)

저도 직접 해봐야 했습니다. 제가 가장 먼저 한 일은 다음과 같으며, 다른 초보 개발자들도 이것이 얼마나 간단한지 알 수 있도록 공유합니다. 베이스 URL(Base URL)은 global-apis.com/v1입니다. 이는 최소한의 변경만으로 표준 OpenAI 클라이언트 라이브러리 (client library)를 사용할 수 있음을 의미합니다.

from openai import OpenAI

client = OpenAI(
...

정말 이게 전부입니다. 이 스크립트를 실행했고, 깔끔한 설명을 받았으며, 거의 환호성을 지를 뻔했습니다. 100만 토큰당 0.25달러인 모델이 실제 제 강사보다 API를 더 잘 설명할 수 있다는 사실은 겸허해지면서도 흥미로웠습니다.

나의 실제 워크로드(Workload)를 처리하는 저렴한 모델

저는 친구의 빵집을 위한 고객 지원 챗봇을 만들었습니다. 대단한 것은 아닙니다. 주문을 받고, 메뉴 질문에 답하며, 간단한 불만 사항을 처리합니다. 제가 실제로 배포한 코드는 다음과 같습니다.

from openai import OpenAI

client = OpenAI(
...

Qwen3-32B의 비용은 출력 토큰 100만 개당 0.28달러입니다. 빵집은 아마 하루에 100개의 메시지를 받을 것이고, 응답당 평균 150토큰 정도라고 가정해 봅시다. 이는 하루에 15,000토큰입니다. 100만 토큰당 0.28달러일 때, 저의 월간 비용은 대략 0.13달러입니다.

13센트입니다. 챗봇을 운영하는 데 드는 비용이 말이죠. 이렇게 저렴할 수 있다는 것을 전혀 몰랐습니다.

가격 전략에 대해 배운 점

이것은 제가 부트캠프(bootcamp) 기간 동안 누군가 말해줬으면 좋았을 부분입니다. 모든 AI 작업에 플래그십 모델 (flagship model)이 필요한 것은 아닙니다.

만약 다음과 같은 작업을 한다면:

단순 질의응답 (Q&A) → Qwen3-8B 또는 GLM-4-9B 사용 ($0.01/M)
일반적인 채팅 → DeepSeek V4 Flash 사용 ($0.25/M)
문서 분석 (Document analysis) → Qwen3-32B 사용 ($0.28/M)
이미지 작업 (Image tasks) → Qwen3-VL-32B 사용 ($0.52/M)
복잡한 추론 (Complex reasoning) → DeepSeek V4 Pro ($0.78/M) 또는 프리미엄 티어 (premium tier) 사용

현명한 방법은 저렴하게 시작하여 앱의 실제 요구 사항을 테스트하고, 품질이 충분하지 않을 때만 업그레이드하는 것입니다. 저는 매번 가장 비싼 옵션을 기본값으로 설정했다는 이유만으로 부트캠프 동안 테스트 호출 비용으로 아마 50달러 정도를 낭비했을 것입니다.

저처럼 되지 마세요. 저보다 더 똑똑해지세요.

여전히 입이 떡 벌어지는 가격 차이

제가 정말로 이 사실을 극복할 수 없기 때문에, 관점을 명확히 해보겠습니다.

동일한 플랫폼 (Global API). 동일한 종류의 작업. 가장 저렴한 모델과 가장 비싼 모델 사이의 가격 차이는 출력 토큰 100만 개당 $0.01에서 $3.50 사이입니다.

이는 350배의 차이입니다.

적은 예산을 가진 신입 개발자에게 이 격차는 "자유롭게 실험할 수 있다"와 "API 호출 하나하나가 두렵다" 사이의 차이입니다. 저는 제가 어느 쪽에 있고 싶은지 알고 있습니다.

동료 부트캠프 졸업생들을 위한 저의 솔직한 권장 사항

만약 이 글을 읽고 있는 당신도 막 부트캠프를 졸업한 상태라면, 제 조언은 다음과 같습니다:

첫 프로토타입(Prototype) 제작에는 $0.01 모델로 시작하세요. 돈을 낭비하지 않고도 기초를 배울 수 있습니다.
실제 품질이 필요해지면 DeepSeek V4 Flash ($0.25/M)로 넘어가세요. 이곳이 가장 적절한 지점(Sweet spot)입니다.
플랫폼이 대신 선택해주길 원한다면 GA 라우팅(Routing) 모델을 사용하세요.
프리미엄 모델($2-$3.50/M)은 실제로 그것들이 필요하다는 것을 증명했을 때만 사용하세요.

저렴한 모델로 시작해서 단계적으로 올라갔기 때문에, 주말 내내 진행한 테스트 비용은 $2도 채 들지 않았습니다. 그것은 실제로 감당할 수 있는 수준의 교육입니다.

직접 시도해보세요

이 내용 중 유용한 것이 있다면 (그리고 초보자분들에게 정말 유용하기를 바랍니다), Global API를 확인해보세요. 그들의 가격 데이터는 검증되고 업데이트되며, API는 OpenAI의 클라이언트 라이브러리(Client library)와 호환됩니다. 즉, 부트캠프에서 OpenAI SDK를 배웠다면 이미 사용법을 알고 있는 셈입니다.

기본 URL(Base URL)은 global-apis.com/v1 입니다. 이것으로 교체하고, 모델 이름을 deepseek-v4-flash나 qwen3-32b 같은 것으로 바꾸기만 하면 바로 시작할 수 있습니다.

이것이 당신의 인생을 바꿀 것이라고 말하는 것은 아닙니다. 하지만 이것은 저의 주말을 바꾸었고, 아마도 AI 앱을 구축하는 저의 방식 전체를 바꾸어 놓았을 것입니다. 이제 막 시작하는 단계에서 "API 비용이 두렵다"에서 "걱정 없이 실험할 수 있다"로 넘어가는 것은 엄청난 변화입니다.

즐거운 코딩 되시길 바라며, 당신의 API 비용이 언제나 당신에게 유리하기를 바랍니다.

주말 동안 30개 AI API를 가격별로 분석한 결과 — 충격적인 내용

요약

핵심 포인트