본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 23. 20:37

Microsoft, 비용 절감을 위해 무제한 Copilot 토큰 중단 및 DeepSeek V4 도입

요약

Microsoft가 추론 비용 절감을 위해 Copilot Cowork의 요금제를 무제한 방식에서 사용량 기반으로 전환하고 DeepSeek V4를 도입합니다. 이는 OpenAI 독점 구조에서 벗어나 비용 효율성을 극대화하려는 전략적 변화입니다.

핵심 포인트

  • Copilot Cowork 요금제를 좌석당 정액제에서 토큰당 요금제로 전환
  • DeepSeek V4 채택을 통해 추론 비용 약 40% 절감 기대
  • DeepSeek V4는 낮은 KV 캐시 사용량과 높은 컨텍스트 효율성 보유
  • Microsoft는 2026년까지 AI 인프라에 500억 달러 이상 투자 계획

Microsoft는 추론 비용을 약 40% 절감하기 위해 Copilot Cowork를 사용량 기반 요금제로 전환하고 DeepSeek V4를 채택했습니다. 이번 조치는 자사 AI를 위해 OpenAI에만 독점적으로 의존하던 Microsoft의 행보에 변화를 주는 것입니다.

Microsoft는 2026년 6월, Copilot Cowork를 무제한 토큰 방식에서 좌석당 미터링(per-seat metering) 방식으로 교체하며 사용량 기반 요금제로 전환했습니다. 무제한 추론에 따른 내부 비용이 지속 불가능하다는 것이 증명된 이후, 이 회사는 비용 효율적인 오픈 소스 대안으로 DeepSeek V4를 채택했습니다 Pandaily 참조.

주요 사실 (Key facts)

  • Copilot Cowork는 2026년 6월에 좌석당 30달러의 정액제에서 토큰당 요금제로 전환되었습니다.
  • DeepSeek V4는 FlashMemory를 사용하여 KV 캐시(KV cache)를 90% 적게 사용하면서 500K 컨텍스트(context)를 달성합니다.
  • Microsoft는 2026년까지 AI 인프라에 500억 달러 이상을 투입하기로 약속했습니다.
  • DeepSeek는 첫 외부 투자 라운드에서 500억 달러의 기업 가치로 74억 달러를 조달했습니다.
  • DeepSeek V4의 비용은 입력 토큰 1K당 $0.002, 출력 토큰 1K당 $0.008입니다.

M365 전반에 내장된 기업용 AI 어시스턴트인 Microsoft의 Copilot Cowork는 이제 정액제 좌석 요금 대신 소비된 토큰당 요금을 부과합니다. 2026년 6월부터 시행되는 이 변경 사항은 Microsoft의 대형 고객들에게 무제한 요금제를 유지하기 어렵게 만든 수개월간의 추론 비용 상승에 따른 결과입니다.

핵심 요약 (Key Takeaways)

  • Microsoft는 추론 비용을 약 40% 절감하기 위해 Copilot Cowork를 사용량 기반 요금제로 전환하고 DeepSeek V4를 채택했습니다.
  • 이번 조치는 자사 AI를 위해 OpenAI에만 독점적으로 의존하던 Microsoft의 행보에 변화를 주는 것입니다.

DeepSeek V4가 선정된 이유 (Why DeepSeek V4 Won the Bid)

🎉 Day-0 support for @deepseek_ai V4 Pro and Flash on vLLM — a new ...

DeepSeek V4는 토큰당 비용 (cost-per-token) 측면에서 폐쇄형 모델 (proprietary models)들을 한 자릿수 차이로 압도한 후 Microsoft의 프로덕션 환경에 도입되었습니다. DeepSeek의 6월 9일 기술 공개 자료에 따르면, 이 모델은 FlashMemory를 사용하여 KV 캐시 (KV cache)를 90% 적게 사용하면서도 500K 컨텍스트 (context)를 달성합니다. 6월 15일에 공개된 Microsoft의 인프라 투자 약속 — 2026년까지 500억 달러 이상 — 로 인해 효율성은 타협할 수 없는 요소가 되었습니다.

DeepSeek의 오픈 웨이트 (open-weight) 라이선스는 Microsoft가 토큰당 로열티 없이 자체 호스팅 및 미세 조정 (fine-tuning)을 할 수 있게 해주며, 이는 OpenAI의 GPT-4나 Anthropic의 Claude로는 불가능한 구조입니다. 또한 이번 조치는 당사의 지식 그래프 (knowledge graph)에 따르면, 130억 달러 이상의 최대 투자처인 OpenAI에 대한 Microsoft의 의존도를 낮춥니다.

가격 체계의 변화

Copilot Cowork는 이제 토큰 볼륨 (token volume)에 따라 과금되며, DeepSeek V4의 엔터프라이즈 티어 (enterprise tiers)는 입력 토큰 1K당 $0.002, 출력 토큰 1K당 $0.008부터 시작합니다. 기존의 무제한 플랜은 사용자당 월 $30였습니다. Pandaily와 공유된 Microsoft의 내부 추정치에 따르면, 매일 1억 개의 토큰을 생성하는 10,000명 규모의 배포 환경에서 새 모델을 사용할 경우 비용이 약 40% 절감됩니다.

Microsoft의 이러한 움직임은 정액제에서 사용량 기반 (consumption-based) AI 가격 책정으로 전환되는 광범위한 업계의 피벗 (pivot)을 반영합니다. OpenAI는 2026년 3월에 사용량 티어를 도입했으며, Anthropic이 5월에 그 뒤를 따랐습니다.

경쟁적 함의

DeepSeek의 선정은 Microsoft가 자사 제품의 기본 추론 엔진 (inference engine)으로 OpenAI가 아닌 모델을 배포한 첫 사례입니다. 이 연구소는 6월 18일, 설립자 Liang Wenfeng의 29억 달러 기여를 포함한 첫 외부 펀딩 라운드를 통해 500억 달러의 기업 가치로 74억 달러를 조달했습니다.

Microsoft는 6월 3일에 공개된, 35B 활성 파라미터 (active parameters)를 보유하고 AIME 2025에서 97%를 기록한 자체 추론 모델인 MAI-Thinking-1에 계속 투자하고 있습니다. 하지만 비용에 민감한 엔터프라이즈 워크로드 (enterprise workloads)의 경우, 이제 DeepSeek V4가 그 부담을 담당합니다.

관전 포인트

Copilot Cowork의 매출 구성과 가격 변경에 따른 고객 이탈 (churn)이 공개될 예정인 Microsoft의 2026 회계연도 4분기 실적 발표(7월 말 예상)를 주목하십시오. 또한 DeepSeek V4가 Azure OpenAI Service의 퍼스트 파티 (first-party) 제공 서비스로 확장되는지 여부도 모니터링해야 합니다.

출처: pandaily.com

원래 발행일: gentic.news

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0