역사상 가장 짧은 체인: 기술에서 수익까지 단 하루 만에

얼마 전, 우리 팀은 추론 엔진 (inference engine) 최적화 작업을 진행하고 있었습니다.

우리가 정확히 무엇을 연구했는지는 중요하지 않습니다. 그것은 지루하고 화려하지 않은 작업 중 하나였습니다. 거의 3주 동안 프로파일러 (profiler)를 응시하며 스케줄링 (scheduling)과 VRAM에서 점진적인 이득을 짜내고, 마침내 처리량 (throughput)을 몇 포인트 개선하는 작업이었죠.

몇 포인트가 무엇을 할 수 있을까요? 제가 초보였을 때는 거의 아무것도 할 수 없었습니다. 하지만 이번에는 달랐습니다. 어느 날 아침 우리는 그것을 메인 (main) 브랜치에 병합하고 점진적으로 배포했습니다. 다음 날 대시보드를 열었을 때, 그 몇 포인트는 이미 실제 돈으로 변해 있었습니다. 동일한 카드, 동일한 모델, 동일한 고객—토큰당 비용 (cost per token)은 몇 포인트 떨어졌고, 매출 총이익 (gross margin)은 몇 포인트 넓어졌습니다. 라이브가 된 날부터 장부에 나타나기 시작했습니다.

팀 내 2000년 이후에 태어난 어떤 아이의 머릿속에서 나온 아이디어로부터 장부상의 수익에 이르기까지, 저수준 최적화 (low-level optimization)가 단 하룻밤 사이에 이루어진 것입니다.

5년 전이라면 상상도 할 수 없었을 일입니다.

짧은 체인, 짧은 수명

최근 친구들과 이야기할 때마다 대화는 계속해서 같은 생각으로 돌아옵니다. 우리는 특이한 시대에 발을 들여놓았다는 것입니다.

무엇이 특이할까요? 검색을 해보면 기술적 리더십 (technical leadership)이 이토록 빠르게 상업적 영향력, 경쟁 우위, 또는 직접적인 수익으로 전환된 다른 시기를 찾기 어려울 것입니다. 얼마나 짧냐고요? 오늘날의 모델 기업은 기본적으로 한 가지 일만 하면 됩니다. 충분히 똑똑한 모델을 훈련시키고, 배포하고, 토큰을 위한 컴퓨팅 자원을 제공하며, 어쩌면 오픈 소스 (open-source)로 공개하는 것입니다. 나머지—영향력, 매출, 기업 가치—는 스스로, 빠르게 성장합니다.

함정은 이 체인의 반대편도 똑같이 짧다는 것입니다. 각 세대가 주목받는 시간은 3개월에서 6개월로 압축되어 있으며, 이는 낙관적인 수치입니다. 종종 모델은 한 달에서 세 달 만에 뜨거운 화제에서 완전한 침묵으로 넘어갑니다.

지난 6개월 동안 바람이 얼마나 빠르게 바뀌었는가

지난 11월, Google은 Gemini 3를 출시하며 리더보드 (leaderboards)를 초토화했습니다. 심지어 OpenAI는 내부적으로 "코드 레드 (Code Red)"를 선포하기까지 했습니다. 당시에는 어떤 단체 채팅방을 열어도 화면이 Gemini를 찬양하는 메시지로 가득했습니다. 하지만 6개월이 지난 지금, 대화의 주제는 이미 옮겨갔습니다. Gemini가 실패하고 있다는 뜻은 아닙니다. 사용자 수는 여전히 늘고 있으니까요. 다만 이 트랙에 대한 관심은 약 3개월 정도만 유지될 뿐입니다.

조금 더 거슬러 올라가 봅시다. Claude Opus 4.6이 출시되었을 때, 내부 관계자와 외부인 모두 "이것이 세상을 바꿀 물건이다"라고 생각했습니다. 당시에는 정말로 경쟁자들을 압도했습니다. 그러다 4.7, 4.8 등이 차례로 등장했고, 찬사와 비판이 그 뒤를 바로 따랐습니다.

중국에서의 가장 명확한 사례는 Z.ai입니다. 1년 전만 해도 이들의 위치는 위태로웠으며, 경주에서 탈락할 것처럼 보였습니다. 그러다 GLM-4.5, 4.6, 4.7이 연달아 출시되었고, 이어서 올해 초 GLM-5, 5.1, 5.2가 나왔습니다. 3개월 만에 3개의 버전이 나온 것입니다. 상황은 완전히 뒤집혔습니다. 홍콩 IPO (기업공개) 이후 6개월 만에 주가는 약 8배 상승했으며, 시가총액은 6,000억 HKD를 돌파했습니다. 기술적 반전이 주가에 그대로 반영된 것입니다.

MiniMax는 정반대의 사례입니다. IPO 당시 이들의 가격 책정과 기업 가치는 Z.ai와 비슷한 수준이었습니다. 상장 첫날 주가는 두 배로 뛰었고, 시가총액은 잠시 130억 달러를 넘어섰으며, 3월의 급등기에는 홍콩에 상장된 Baidu의 주가를 잠시 앞지르기도 했습니다. 하지만 바람은 그만큼 빠르게 바뀌었습니다. M2.7과 M3 세대는 기대감을 불러일으키지 못했고, 시장의 기대치는 즉시 할인되었으며, 시가총액은 정점에서 급격히 하락했습니다. 그들이 당신을 열광시키는 속도만큼이나, 그들이 당신을 버리는 속도도 빠릅니다.

모든 소음이 지나간 후, 관심은 코딩 (coding)과 멀티모달리티 (multimodality)라는 두 가지로 수렴되었습니다. 사용자, 수익 구조, 해자 (moats)와 같은 전통적인 가치 평가 논리는 기본적으로 여기서 통하지 않습니다. 모두가 실제로 묻고 있는 질문은 단 하나입니다. "당신의 현재 모델 세대가 충분히 강력한가?"

내 업무 분야에서, 이 체인은 과거에 공포스러울 정도로 길었습니다

"기술이 며칠 만에 돈으로 변한다"는 스릴은, 과거에 그것이 얼마나 고통스러웠는지 제가 정확히 알고 있기 때문에 존재합니다.

저는 인프라(infra)를 다루며, 인프라와 밀접하게 연관된 일을 합니다. 과거에는 추론 효율성(inference efficiency)을 15% 개선하는 클러스터 수준의 혁신을 이루더라도, 그 15%를 상업적 이점으로 전환하는 과정은 포기하고 싶을 정도로 어려웠습니다.

왜 그렇게 어려웠을까요? 그 15%에 대해 직접적으로 가격을 책정할 수 없기 때문입니다. 고객에게 "이 장비는 원래 100만 달러였는데, 이제 15% 더 빨라졌으니 115만 달러에 팔겠습니다"라고 말할 수는 없습니다. 고객들은 그런 방식으로 계산하지 않습니다. 그들은 당신을 자신들의 총소유비용 (TCO, Total Cost of Ownership) 모델과 리스크 구조로 끌어들여 흥정할 것입니다. 어떻게 그것이 15%라는 것을 증명할 것인지, 실제로는 5%가 아닐지, 누가 안정성을 보장할 것인지, 공급망 변동성(supply chain volatility)은 누가 감당할 것인지 등을 따져 묻습니다.

따라서 저수준 최적화 (low-level optimization)가 고객이 실제로 비용을 지불하는 단계에 도달하기까지는 긴 주기, 복잡한 공급망, 그리고 거대한 비즈니스 팀이라는 장벽이 가로막고 있습니다. 기술을 수익과 규모로 전환하기 위해서는 상업 체인의 저 멀리 끝단에서 느릿느릿 움직이는 조직 전체를 유지해야 합니다. 하위 계층에서의 미세한 조정이 시장으로부터 다시 피드백을 받기까지는 영겁의 시간이 걸립니다.

설상가상으로, 모델의 수명은 짧습니다. 특정 모델 세대를 최적화하기 위해 몇 달 동안 고군분투하지만, 작업이 끝날 때쯤이면 그 모델의 전성기는 이미 지나가 버립니다. 투자는 아직 손익분기점을 넘지 못했는데, 목표는 이미 사라져 버린 것입니다. 그래서 추론 인프라 (inference infra)는 어정쩡한 위치에 처해 있었습니다. 모두가 앞으로 중요해질 것이라고 믿었지만, 지금 당장 명확한 비즈니스 모델을 제시할 수 있는 사람은 아무도 없었습니다.

토큰은 선물(Futures)이 아니라 현물(Spot Goods)이다

AI 코딩이 토큰 수요를 촉발하면서, 체인의 모든 여유분을 짜내어 마치 비현실적으로 느껴질 정도가 되었습니다.

핵심은 토큰의 특성에 있습니다. 토큰은 일일 용량(daily capacity)에 대해 현물(spot)로 결제됩니다. 오늘 설계하고, 내일 생산하며, 모레 배송하는 전통적인 재화와 달리, 토큰은 '지금 당장의 컴퓨팅'이며 결과는 몇 초 내에 전송됩니다. 이 단 하나의 특성이 모든 규칙을 새로 썼습니다.

그 3주간의 연구를 통해 얻은 몇 가지 성과들은 서비스가 출시되는 순간부터 정산되기 시작합니다. 즉, 다음 날부터 일일 생산량에서 짜낸 추가 용량(capacity)은 추가적인 매출 총이익 (gross margin) 및 경쟁 우위로 직접 예약됩니다. 다음 회계 연년을 기다릴 필요도, 누군가의 총소유비용 (TCO) 모델에 진입할 필요도, 그것이 얼마나 가치 있는지 증명하기 위해 팀을 유지할 필요도 없습니다. 용량은 늘어났고, 실제 토큰당 비용 (cost per token)은 하락했으며, 그날 바로 장부 상태가 좋아졌습니다.

그리고 이는 거의 마찰 없이 복제됩니다. 이러한 종류의 최적화는 지역을 차별하지 않습니다. 동일한 유형의 컴퓨팅, 동일한 모델, 동일한 고객을 대상으로 합니다. 기본적으로 매우 빠르게 확산되는 직접적인 포팅 (port)과 같습니다.

일 단위로 측정했을 때, 저수준의 기술적 개선이 중간의 길고 무거운 시스템 전체를 건너뛰고 상업적 수익으로 직접 전환됩니다. 이것은 아마도 역사상 기술에서 수익으로 이어지는 가장 짧은 체인일 것입니다.

이것은 젊은 세대의 시대이다

제가 계속 생각하고 있으며, 점점 더 흥미롭게 느끼는 또 다른 점이 있습니다. 바로 최전선에서 이 일을 수행하는 사람들이 대부분 20대 초반의 젊은이들이라는 사실입니다.

이 시대는 그들에게 유난히 친절합니다. 왜냐하면 이 시대의 판단 기준은 잔혹할 정도로 객관적이기 때문입니다: 효율성이 올랐는가 떨어졌는가, 정확도가 변했는가. 결과물을 테이블 위에 올려놓으면 단 한 번의 테스트로 결정되며, "연륜"이나 "인맥"이 끼어들 여지가 거의 없습니다. 베테랑의 승인을 받을 필요도 없고, 사람을 읽거나 정치질을 잘할 필요도 없습니다. 업계의 선배 심판들이 당신을 승인하느냐는 여기서는 중요하지 않습니다. 실질적인 것을 만들어내면, 그것은 생산 효율성이라는 이름으로 명확하게 기록됩니다.

20대 청년은 단 한 번의 기술적 돌파구로 수억 달러, 심지어 수십억 달러의 가치를 창출할 수 있습니다. 결과를 즉시 확인할 수 있을 만큼 빠르고, 누구나 검증할 수 있을 만큼 확실합니다. 전체 체인은 더 이상 "당신이 자격이 있는지 판단하는 것"만을 유일한 업무로 하는 수많은 사람들로 채워질 필요가 없습니다.

마치며

우리가 맞이한 시대는 글로벌하며, 그 템포(tempo)는 무서울 정도로 짧고, 앞으로 더욱 잔혹해질 가능성이 높습니다.

하지만 이 시대는 당신을 심사하는 것만이 유일한 업무인 사람들뿐만 아니라, 길고 무거운 중간 계층(middle layers) 또한 진정으로 삭제해 버렸습니다. 남은 것은 기술적 혁신(technological innovation)과 그것을 만들어내는 사람뿐입니다.

중간 단계의 사람들이 적어질수록, 실제로 일을 수행하는 사람들의 가치는 더욱 높아집니다.

참고 문헌 (References)

Google, "Introducing Gemini 3", 2025-11-18, https://blog.google/products/gemini/gemini-3/
Fortune, "Sam Altman declares 'Code Red' as Gemini 3 surges", 2025-12-02, https://fortune.com/2025/12/02/sam-altman-declares-code-red-google-gemini-ceo-sundar-pichai/
OpenAI, "Codex is becoming a productivity tool for everyone" (주간 활성 사용자 수 500만 명 돌파, 2월 이후 6배 성장), 2026-06-02, https://openai.com/index/codex-for-knowledge-work/
OpenAI, "Codex for (almost) everything" (주간 활성 사용자 300만 명 돌파), 2026-04-16, https://openai.com/index/codex-for-almost-everything/
OpenAI, "ChatGPT — Release Notes" (GPT-5.4 / 5.5 릴리스 노트), 2026-06-17 접속, https://help.openai.com/en/articles/6825453-chatgpt-release-notes
Securities Times, "'Global Large Model First Stock' Z.ai Exceeds 57 Billion HKD Market Cap on IPO Day", 2026-01, https://www.stcn.com/article/detail/3580246.html
Finet.com.cn, "[IPO Tracking] Z.ai (02513.HK) High Growth Ignites Hong Kong Stocks, Shares Rise 31% to New High", 2026-04, https://www.finet.com.cn/news/69cc927d2308294c69bf7bec.html

Z.ai는 2025년 12월 22일, "Z.ai Releases GLM-4.7"이라는 제목으로 PR Newswire를 통해 발표했습니다. [https://www.prnewswire.com/news-releases/zai-releases-glm-4-7-designed-for-real-world-development-environments-cementing-itself-as-chinas-openai-302649821.html]
9. MarkTechPost는 2026년 6월 14일, "Z.ai Launches GLM-5.2 With a Usable 1M-Token Context"라는 제목으로 보도했습니다. [https://www.marktechpost.com/2026/06/14/z-ai-launches-glm-5-2-with-a-usable-1m-token-context-two-thinking-effort-levels-and-no-benchmarks-at-launch/]
10. 로이터(Reuters)는 2026년 1월 9일, "MiniMax doubles in value in Hong Kong debut"라는 제목으로 보도했습니다. [https://www.reuters.com/world/asia-pacific/china-ai-firm-minimax-set-surge-hong-kong-debut-2026-01-09/]
11. 시큐리티 타임즈(Securities Times)는 2026년 3월 11일, "Stock Price Surges 51% in Two Days, MiniMax Market Cap Successively Surpasses Three Internet Giants"라는 제목으로 보도했습니다. [https://www.stcn.com/article/detail/3670887.html]
12. MiniMax는 2026년 2월에 "MiniMax-M2.5"를 공개했으며, SWE-bench에서 80.2의 점수를 기록했습니다. [https://github.com/MiniMax-AI/MiniMax-M2.5]