밑바닥부터 잠식당하다
요약
중국의 Z.ai가 오픈 가중치 모델인 GLM-5.2를 출시하며 오픈 모델 시장의 판도를 흔들고 있습니다. 이 모델은 성능 면에서 오픈 모델 중 1위, 전체 4위를 기록하며 폐쇄형 모델과의 격차를 좁히고 있습니다.
핵심 포인트
- Z.ai의 GLM-5.2는 7,500억 파라미터와 100만 토큰 컨텍스트를 지원함
- 오픈 가중치 모델 중 1위, 전체 순위 4위로 강력한 성능 입증
- 서구권 폐쇄형 모델 대비 약 1/6 수준의 저렴한 비용 구현
- 중국 오픈 모델들이 전 세계 오픈 모델 토큰 공급의 대다수를 차지하는 추세
6월 17일, 미국 이사회에 있는 대부분의 사람들이 여전히 발음조차 제대로 못 하는 베이징의 한 기업이 지구상에서 가장 뛰어난 오픈 모델 (open model)을 출시했지만, 거의 메인 페이지를 장식하지 못했습니다. Zhipu에서 이름을 바꾼 Z.ai는 약 7,500억 개의 파라미터 (parameter)와 100만 토큰의 컨텍스트 윈도우 (context window)를 가진 GLM-5.2를 MIT 라이선스로 출시했습니다. 이는 누구의 허락도 구하지 않고, 누구에게도 통행료를 지불하지 않고도 가중치 (weights)를 다운로드하여 자신의 하드웨어에서 실행하고, 수정하며, 이를 기반으로 제품을 출시할 수 있음을 의미합니다. 독립 벤치마커인 Artificial Analysis는 이 모델을 오픈 가중치 모델 중 1위, 전체 순위에서는 4위로 평가했습니다. 이는 폐쇄형 서구권 프런티어 (frontier) 모델들에 이은 순위이며, 바로 위 모델 가격의 약 6분의 1 수준으로 구현되었습니다. 이제 중국의 오픈 모델들이 오픈 리더보드 (open leaderboards)의 상위 슬롯 대부분을 차지하고 있으며, 전 세계 오픈 모델 토큰의 대다수를 공급하고 있습니다.
6주 전, 저는 Anthropic의 Mythos 프리뷰가 1억 달러의 크레딧이 부여된 11개의 지정된 조직에게만 제공되는 것에 대해 The Frontier Became a Club이라는 글을 썼습니다. 그 포스트는 시장의 최상위권이 스스로를 격리시키고 있다는 내용이었고, 그것은 정확했습니다. 진정으로 가장 어려운 추론 (reasoning)은 여전히 폐쇄형 연구소 (closed labs) 뒤에 존재하며, 인덱스 상위권에는 여전히 서구권 모델이 자리 잡고 있고, 능력 벤치마크 (capability benchmark)에서의 4점 차이는 실질적인 4점의 차이입니다. 이 '클럽'의 말이 맞습니다. 최정상급의 성능은 여전히 중요합니다.
모두가 최상위권을 지켜보는 동안, 바닥이 움직였습니다. 그리고 이 모든 것의 향방이 결정되는 곳은 언제나 바로 그 바닥입니다.
아무도 원하지 않았던 철근
1969년, Nucor라는 회사가 사우스캐롤라이나주 달링턴에 제철소를 건설했는데, 이곳은 미국 철강 거물들이 약간 우습게 여겼던 방식을 택했습니다. 그들은 전기로 (electric furnace)에서 고철을 녹여 철근 (rebar)을 만들었는데, 이는 콘크리트 속에 묻혀 아무도 볼 수 없고 금속학적 성질 (metallurgy)을 확인하지도 않는 저렴한 보강재였습니다. 이는 철강 사업에서 최하위 계층 (garbage tier)이었습니다. 낮은 마진, 낮은 지위, 모든 것이 낮았습니다. US Steel과 Bethlehem은 이를 기꺼이 내버려 두었는데, 그들은 고부가가치 제품인 구조용 빔 (structural beams)과 자동차 문이나 가전제품에 들어가는 판재 (sheet steel) 등 실제로 우수한 제강 기술이 필요한 상위 계층을 점유하고 있었기 때문입니다. 신생 기업들에게 철근 시장을 양보하는 것은 당연한 결정이었습니다. 카탈로그에서 가장 질 낮은 제품을 두고 왜 싸우겠습니까?
그래서 미니밀 (mini-mills)들이 철근을 가져갔습니다. 그러고 나서 철근으로 번 돈을 바탕으로, 그들은 조금 더 나아가 앵글 철 (angle iron)과 상업용 바 (merchant bar) 시장까지 차지했습니다. 일관 제철소 (integrated mills)들은 다시 사다리 위쪽으로 후퇴했고, 그 과정은 매번 합리적인 움직임이었습니다. 왜냐하면 그들이 포기한 각 단계는 유지하고 있는 단계보다 마진이 더 낮았기 때문입니다. 그러다 1989년, Nucor는 인디애나주 크로포즈빌에 공장을 열어 박판 주조 (thin-slab casting) 방식을 이용해 판재 (flat-rolled sheet)를 생산하기 시작했습니다. 이는 제철업의 왕관 (crown jewel)이자, 거물들이 신생 기업들은 결코 건드릴 수 없을 것이라고 스스로 단언했던 제품이었습니다. 2001년 무렵 Bethlehem Steel은 파산 상태에 이르렀습니다. 일관 제철소들은 후퇴하는 모든 단계에서 품질에 대해 옳았습니다. 그들의 철강은 각 단계마다 실제로 더 우수했습니다. 하지만 "충분히 괜찮으면서 가격은 6분의 1인" 제품이 사다리 꼭대기까지 타고 올라와 더 이상 후퇴할 높은 칸이 남지 않게 된 바로 그 순간까지 말입니다. 이것은 비즈니스 역사에서 가장 철저하게 기록된 패턴이며, 여전히 기존 기업들을 매번 속이고 있습니다. 왜냐하면 저가 시장을 포기하려는 개별적인 결정 하나하나가 고립된 상태로 보면 매우 영리해 보이기 때문입니다.
Open weights (개방형 가중치)는 철근과 같습니다. 인덱스(index) 상에서 프런티어(frontier) 모델보다 4단계 뒤처져 있고, 무료로 다운로드할 수 있으며, 비용은 6분의 1 수준이고, 당신이 통제하는 건물 안에서 실행됩니다. 기업들이 실제로 이 모델들로 수행하는 압도적인 다수의 작업—즉, 프런티어급 수학이 아니라 분류 (classification), 추출 (extraction), 요약 (summarization), 라우팅 (routing), 그리고 실제 생산 작업을 구성하는 만 가지의 지루한 작업들—에 있어서, "6분의 1의 비용으로 충분히 괜찮고 내 장비에서 직접 실행할 수 있다"는 것은 타협이 아닙니다. 그것은 승리하는 입찰가입니다. 폐쇄형 연구소 (closed labs)들은 진정으로 가장 어려운 계층을 보유하고 있으며, 그들이 그것을 가졌다는 점은 맞습니다. 하지만 그들은 그 아래의 모든 것의 가격이, MIT 라이선스에 동의하는 비용만으로 가중치를 라이선스하는 베이징의 한 기업에 의해 결정되는 것을 지켜보고 있습니다.
해자(Moat)가 사라진 곳
여기에 리더보드(leaderboard)가 측정하지 못하는 부분, 즉 게임의 전체 판도가 있습니다. "Open-weight model (개방형 가중치 모델)"에서 중요한 단어는 "model (모델)"이 아닙니다. 바로 "open (개방)"입니다. 폐쇄형 프런티어 모델은 의존성 (dependency)입니다. 당신은 그것을 임대하며, 그것의 가격 책정, 출시 일정, 콘텐츠 정책, 그리고 관할권(jurisdiction)에 종속됩니다. 이는 Apple이 Siri를 경쟁사의 Gemini에 연결했을 때 제가 설명했던 바로 그 속박이며, 사고하는 부분을 임대하는 상황에서 벗어날 방법을 증명할 수 없었습니다. 당신이 직접 실행하는 개방형 가중치 모델은 그것과 구조적으로 정반대입니다. 아무도 당신에게 가격을 다시 매길 수 없고, 아무도 당신의 발밑에서 모델을 지원 중단(deprecate)할 수 없으며, 당신이 그 모델을 기반으로 구축한 이후에 모델이 무엇을 말하고 무엇을 말하지 않을지를 아무도 변경할 수 없습니다.
이는 모델 자체가 자유롭고, 개방적이며, 충분히 훌륭해지는 순간, 레버리지(leverage)가 더 이상 모델에 머물지 않음을 의미합니다. 레버리지는 리더보드(leaderboard)가 결코 측정할 수 없는 두 가지 요소, 즉 '당신이 그것을 어디에서 실행하는가'와 '당신이 무엇을 데이터로 공급하는가'로 이동합니다. 만약 가중치(weights)가 어디에나 배치할 수 있는 범용 제품(commodity)이 된다면, 전체적인 경쟁의 핵심은 당신의 데이터를 모델 쪽으로 보내는 대신, 모델을 당신의 데이터 옆에 둘 수 있느냐의 문제가 됩니다. 해자(moat)는 모델에서 빠져나가 데이터 평면(data plane), 지역성(locality), 그리고 당신의 거의 무료에 가까운 지능이 로컬 캐시(local cache)에서 실행될지 아니면 중앙 클러스터로 왕복하며 데이터 송출 비용(egress fees)을 발생시킬지를 결정하는 지루한 인프라(infrastructure)로 모여듭니다. 베이징(Beijing)은 모델을 저렴한 부분으로 만듦으로써 업계에 호의를 베풀었습니다. 진짜 비싼 부분은 아무도 벤치마킹(benchmarking)하지 않는 부분입니다.
통합 제철소들은 최고의 철강이 생존을 결정하는 요소가 아니게 된 날까지 미국에서 최고의 철강을 계속 만들어냈습니다. 범용 제품 계층(commodity tier)이 당신을 대신해 결정하기 전에, 당신의 레버리지가 실제로 어디에 있는지 파악하십시오.
지능형 데이터 파이프라인(intelligent data pipelines)이 어떻게 AI 비용을 절감할 수 있는지 알고 싶으신가요? Expanso를 확인해 보세요. 아니면 하지 마세요. 제가 당신에게 무엇을 하라고 말할 처지는 아니니까요.
참고: 저는 현재 머신러닝(machine learning)을 위한 데이터 준비의 실제 세계적 과제에 대해, 운영, 컴플라이언스(compliance), 그리고 비용에 초점을 맞추어 관찰한 내용을 바탕으로 책을 쓰고 있습니다. 여러분의 의견을 듣고 싶습니다!
원문은 Eaten From the Bottom에 게시되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기