DeepSeek V4 가 17 배 저렴해져서 클라우드와 로컬 실행의 실제 비용 분석을 시작했습니다

DeepSeek V4 가 GPT-5.2 과 동등한 성능을 제공하면서도 17 배 저렴한 가격을 제시하는 이 포스트가 생각하게 했습니다. 프론티어 클라우드 모델이 동일한 품질에 대해 그렇게 비싸다면, 일상 작업의 몇 퍼센트가 실제로 클라우드를 필요로 하는지 궁금해졌습니다.

10 일 동안 일반적인 코딩 워크플로우를 실행했습니다. 모든 작업을 기록했습니다: 어떤 작업이었는지, 입력/출력 토큰 수, 로컬 Qwen 3.6 27B (3090) 이 이를 수행할 수 있었는지 여부입니다. 벤치마크를 사용하지 않고 150 개의 임의 샘플 작업을 두 곳에서 재실행했습니다.

결과:

파일 읽기, 프로젝트 스캔, "이 코드를 설명해줘": 로컬은 클라우드와 97% 일치했습니다. 이는 작업량의 35%였습니다. 여기서 클라우드를 사용하는 것은 돈을 낭비하는 것입니다.
테스트 작성, 보일러플레이트, 단일 파일 수정: 로컬은 88% 일치했습니다. 다른 30% 의 작업입니다. 12%의 오류는 리뷰에서 잡을 수 있는 에지 케이스였습니다.
멀티 파일 컨텍스트를 가진 디버깅: 로컬은 61%로 감소했습니다. 클라우드가 더 좋지만 17 배 저렴한 가격만큼 나은 것은 아닙니다. 작업량의 약 20%입니다.
아키텍처 결정, 5 개 이상의 파일에 걸친 복잡한 리팩토링: 로컬은 29%였습니다. 클라우드가 실제로 필요했습니다. 작업량의 15% 만이었습니다.

따라서 일상 코딩 작업의 65% 는 전기 비용으로 작동하는 모델과 동일하게 실행됩니다. 다른 20% 는 가끔 오류를 허용할 정도로 충분히 좋습니다. 실제 클라우드 가격을 정당화하는 것은 15% 만입니다.

작업 유형에 따라 라우팅을 시작했습니다. 첫 두 버킷은 로컬, 마지막 두 버킷은 클라우드입니다. API 비용은 월 $85 에서 약 $22 로 줄었고 3090 은 이미 아무것도 채굴하지 않고 있었습니다.

DeepSeek 포스트는 가격 차이가 비현실적이라는 것이 맞지만, 더 큰 통찰은 대부분의 사람들이 우리가 하는 일의 대부분을 위해 클라우드가 필요하지 않다는 것입니다. 우리는 너무 게으르다 보니 이를 측정하지 않습니다.

Insights

DeepSeek V4 가 17 배 저렴해져서 클라우드와 로컬 실행의 실제 비용 분석을 시작했습니다

요약

핵심 포인트

댓글

Prometheus는 통합 지식 그래프 (Unified Knowledge Graphs)와 멀티 에이전트 시스템 (Multi-agent

Asus ProArt PA32UCDMR 32인치 4K 전문가용 OLED 모니터 리뷰: 정밀함, 속도, 그리고 유연성

모건스탠리, 韓 주식 비중 확대로 상향…"코스피 9,000 다시 간다"

SEC 조사 속 Trump Media의 Truth API 데이터 피드 출시

Prometheus는 통합 지식 그래프 (Unified Knowledge Graphs)와 멀티 에이전트 시스템 (Multi-agent

Asus ProArt PA32UCDMR 32인치 4K 전문가용 OLED 모니터 리뷰: 정밀함, 속도, 그리고 유연성

모건스탠리, 韓 주식 비중 확대로 상향…"코스피 9,000 다시 간다"

SEC 조사 속 Trump Media의 Truth API 데이터 피드 출시