Anthropic과 OpenAI가 제품-시장 적합성을 찾았다고 생각한다
요약
Anthropic과 OpenAI의 막대한 인프라 투자 비용 회수를 위한 시장 요구량과 실제 생산성 향상 사이의 괴리를 분석합니다. 학습 비용과 추론 비용의 구조적 차이, 그리고 AI 도입이 실제 기업 운영 효율로 이어지지 않는 현 상황에 대해 비판적인 시각을 제시합니다.
핵심 포인트
- 막대한 하드웨어 투자 회수를 위해 천문학적인 토큰 수요가 필요함
- AI 도입을 통한 실제 생산성 향상이 기대치에 미치지 못할 위험 존재
- 학습 비용과 추론 비용 중 어느 쪽이 더 큰지에 대한 불확실성
- 소규모 기업에서도 로컬 하드웨어를 통한 AI 운영이 가능해질 전망
앞으로 5년 안에 5조10조 달러를 회수해야 하고, 못 하면 하드웨어 증설분을 감가상각하기 시작할 것임40% 오른다고들 함. 지출 20% 증가로 속도 20% 향상이라면 연간 1조 달러 지출을 정당화하기 어려움
이는 토큰 지출로 매년 1조 달러 이상이 필요하다는 뜻임. 전 세계 지식 노동자 2억 명, 개발자 3천만 명을 기준으로 하면 모든 지식 노동자 급여의 5%, 개발자라면 20%가 토큰으로 들어가야 하는 세계임
주변에서는 이런 도구로 회사가 실제로 신경 쓰는 업무에서 속도가 20
아직 거기까지 가지 못했음. 지금은 과대광고 주기의 상승 구간이고, 개발자가 중요한 일에서 2배, 5배, 10배 생산적이 되게 만들지 못하면 좋게 흘러가지 않을 듯함
몇 가지 생각이 있음. 공개된 정보만 보면 추론 비용과 학습 비용의 관계가 서로 충돌함
데이터센터에 관여하는 전기 엔지니어들은 학습 실행 중 전력 사용 급증을 설계의 주요 요인처럼 말하지만, 비용 최적 스케일링을 다루는 논문들은 추론 시 계산량을 큰 요인으로 확신 있게 다룸
학습이 상각 후에도 추론보다 훨씬 계산 집약적이라는 쪽의 근거로는, 계산 자원 접근에 제약이 큰 중국 제공업체들이 더 낮은 가격으로 거의 무제한에 가까운 토큰을 제공하지만 모델 성능은 떨어진다는 점이 있음. 미국 업체들이 해외 업체가 감당하지 못한 상각 학습 비용 때문에 추론 비용을 20~30배 부풀리고 있다는 해석이면 말이 됨
학습 비용이 추론보다 훨씬 크다면, 이들은 일반적인 한계비용 0 경쟁 모델보다 훨씬 심한 죄수의 딜레마에 있음. 반대로 추론 비용이 더 크다면, 일부 사상가들이 말하듯 유틸리티 같은 사업이라는 분석이 맞을 수 있음. CEO들이 그렇게 말할 유인은 매우 큼. 대안인 죄수의 딜레마가 드러나면 투자가 매우 빠르게 멈출 테니까
사실에 조금이라도 닿아 있는 건 시설 엔지니어들의 소문뿐이고, 나머지는 고수준 분석과 비밀스러운 사업에 대한 탁상 경영에 가까움. 이게 현재 이해 수준을 보여줌
상각된 자본 지출과 운영 비용의 비율조차 모르면 외부 투자자 분석은 불가능함. 사무실 화분과 실내 화분 회계를 아무리 세분화해도, 사업의 가장 큰 부분이 영업비밀로 가려져 있으면 의미가 없음
연매출 1억 5천만 달러, 순이익률 9%짜리 아주 작은 회사에서 일하는데, 우리에겐 충분히 좋기 때문에 로컬 모델을 돌리려고 하드웨어에 10만 달러를 쓰는 걸 이미 검토 중임
AI 서비스형 지출 예상치는 1년도 안 돼 그 비용을 넘길 것임
몇 년 안에 아주 작은 회사도 감당 가능한 가격으로 대부분의 일에 충분한 최전선급 모델을 돌릴 하드웨어가 나올 것 같음
각자 관찰은 다르겠지만, 내 관찰도 크게 다르진 않음. 다만 그건 아래에서 위로 보는 관점임. 이 시점이면 위에서 아래로도 보여야 하지 않나 싶음
잠재력 단계를 넘어 의미 있는 생산성 향상으로 들어섰다면 왜 고객 쪽 수치에는 안 나타날까?
더 나은 소프트웨어 도입 때문에 지난 3개월 동안 Delta Airlines가 운영 효율을 크게 개선하지 못한 이유는 뭘까?
진짜 궁금함. 단절이 보임
1990년대 말2000년대 초 대학생 때 계량경제학 교수가 했던 말을 뚜렷이 기억함12시간 영화를 볼 거라고 답했다는 결론이 나왔음. 불가능한 수치였음
케이블 TV와 Pay Per View가 나왔을 때, 영화 무제한 접근권이 있으면 사람들이 영화를 얼마나 볼지 연구가 있었고, 그 결과가 이 사업을 뒷받침할 인프라를 모두 깔아야 한다는 증거처럼 떠돌았음. 그런데 통계학자들이 데이터를 더 분석해보니 사람들은 매일, 주 7일, 하루 10
지금도 비슷한 배를 탄 느낌임. 일부는 모두가 최대 토큰을 쓸 것이고, 하드웨어·소프트웨어·설계·시장 압력 개선에도 토큰 가격은 절대 싸지지 않을 것이라고 가정함
고려할 요인 하나는 앞으로 5년 동안 기준 인구가 그대로 남아 있지 않다는 점임
개발자 도구의 매 세대는 절대적인 코드 처리량을 늘리면서 새로운 개발자 계층과 사용자를 만들어왔음
첫 컴파일러부터 프레임워크 시대를 거쳐 지금까지 늘 그랬고, 개발자가 되기 위해 필요한 숙련도는 내려갔음. 80년대 중후반에는 석사·박사급 컴퓨터과학자가 애플리케이션을 쓸 수 있었지만, 이후 학부생과 IT 엔지니어로 내려왔고 컴퓨터과학 이론은 대체로 선택 사항이 됐으며, 이후 약간의 훈련을 받은 대졸자까지 내려왔고, 2022년 전 retool 같은 노코드/로코드 도구를 거쳐 v0/Replit 같은 에이전트 코드 생성 서비스로 더 내려가는 중임
다음 세대 개발자는 이전 세대처럼 애플리케이션과 아키텍처를 만들지 않을 것임. 여기 대부분도 pg가 이 플랫폼을 만들 때의 품질 수준으로 만들지는 않지만, 사용자가 가치를 찾을 수 있으면 상관없음. 이미 수많은 중간 품질의 기업용 애플리케이션이 그걸 증명함
결국 2억/3천만 숫자는 그대로 남지 않는다는 게 이 사업들의 논리임. 그 변화가 자본 지출을 정당화할 만큼 충분히 크고 빠를지는 나도 아니라고 봄. 다만 Web 1, Web 2.0, SaaS, 모바일 혁명도 새 사용자와 개발자 계층을 꽤 빨리 만들었으니 완전히 비현실적이진 않음
[1] HN은 커스텀 Lisp 구현이라는 강한 이상치지만, 이전 시대에는 선택은 더 온건해도 탄탄한 아키텍처로 쓰인 예가 많았고, 그런 숙련도는 오늘날 창업자 세대에서 찾기 어려울 수 있음
이 분석은 혼란스러움. 코딩 쪽 제품-시장 적합성(PMF) 은 아마 작년에 이미 도달했을 가능성이 큼. 수익성은 별개의 문제이고 아직 모름
글은 둘을 섞으면서도 강한 경제적 논거나 설득력 있는 숫자를 제시하지 않음. Uber 사례가 왜 관련 있는지도 모르겠음. Uber COO도 적어도 투자수익률 관점에서는 결과가 보이지 않는다고 분명히 말했음
내 생각에는 제품은 몇 달 전부터 코딩에 매우 유용했음. 하지만 어떤 비용에서도 유용한 건 절대 아님
혼란스러운 점은 사람들이 궤적을 무시하는 듯하다는 것임. 어쩌면 가장 중요한 부분인데 묻혀 있음
Simon이 말했듯 “충분히 좋은” 코딩 에이전트가 나온 지 6개월밖에 안 됐고, 그건 눈 깜짝할 시간임. 그런데 우리 회사에서 내 업무는 완전히 바뀌었고 거의 꿈같음
그리고 그건 변곡점 하나일 뿐임. 이미 여러 변곡점이 있었고 더 많은 변곡점이 앞에 있음. 오늘 당장 터무니없는 기업 지출에도 투자수익률이 양수가 아닐 수 있다는 말에는 설득될 수 있지만, 몇 달 뒤, 더 나아가 몇 년 뒤 올 것에 대비해 지금 길을 닦는 건 충분히 합리적임
PMF는 “있는지 확실하지 않으면 없는 것”처럼 이상하게 정의되는 개념임
시간을 들여 써보고 이해한 사람들에게는 몇 달 전부터 분명 유용했지만, 이제 그 지식이 지갑을 쥔 사람들에게까지 퍼져서 단순한 유행이나 과대광고가 아니라고 확신하게 됐고, 그래서 PMF를 “주장”할 수 있게 된 듯함
다만 “저 사람들이 PMF를 가졌다”고 말하는 건 이상하다는 데 동의함. 보통은 자기 제품에 대해 정의하는 개념임
맞음. 비용도 경제성의 일부임
그래서 여기 많은 사람은 논의에 끼지 않는 편이 나음. 이들은 이점만 반복하고 비용과 그 비용이 회사의 재무 상태에 어떤 영향을 주는지 식별하고 설명하지 않음
글은 “좋다”라는 단어에 너무 많은 무게를 싣고 있어서 분석을 의심하게 만듦
“2025년 11월을 11월 변곡점이라고 부른 이유는 GPT-5.1과 Opus 4.5가 각자의 코딩 에이전트 하네스와 결합해 좋아졌기 때문이다. 유용한 작업을 안정적으로 해낼 만큼 좋아져서, 우리는 지난 6개월 동안 에이전트 시스템에 적응해왔다”
논리적인 글이어야 하는 게 아님. 이건 LLM 전도 블로그에 가깝고, 업계에 우호적이지 않은 비판적 분석은 거의 없음
다른 글을 읽어봐도 회의론은 별로 없고, 얼마나 대단한지 홍보하는 내용이 많음
GLM-5.1이 비슷하게 좋고 오픈소스이며 훨씬 싸다면 OpenAI와 Anthropic은 고객을 어떻게 붙잡을 계획일까?
사업 모델이 작동할 것 같지 않음. 아주 가까운 친구가 대기업용 자동화 소프트웨어를 실제로 하는데, Claude나 OpenAI를 전혀 쓰지 않음
주로 Cerebras 위의 gpt 120b와 GLM-5.1을 무거운 사고 작업에 쓰고, 여러 작업에는 다른 작은 모델들을 씀. 전부 오픈소스임
이 시스템들은 기업에 매우 유용하고, 아주 안정적이고 빠른 완전 자동 파이프라인을 돌릴 수 있음
이 주제로 자주 이야기하는데, 우리 둘 다 Claude와 OpenAI로 무거운 에이전트 작업을 하는 기업들은 지난 1년 동안 오픈소스가 얼마나 좋아지고 싸졌는지 정확히 모르는 것 같다고 봄
그러면 기존 기업과 개발자들이 따라잡으면 Claude와 OpenAI는 비용을 회수할 수 없지 않을까?
GLM-5.1은 같은 수준이 아님. Claude Code의 Opus와는 상대가 안 됨. 직접 써보면 됨. 오픈소스 모델은 적어도 1년쯤 뒤처져 있음
사업 모델이 안 보인다는 데 동의함. Porter의 5요인 관점에서는 악몽임
이 공간에서 엄청나게 많은 기업이 경쟁할 것이고, 자본 집약적이라는 점 때문에 어느 정도 해자는 있겠지만, 그래도 사실상 무한한 경쟁자가 있을 것임
소비자에게는 좋음
코딩에는 항상 해당 분야 최고의 모델을 써야지, 1년 전으로 돌아가면 최고였을 모델을 쓰는 게 아님. GLM 5.1이 딱 그런 위치임
GLM의 가격 대비 성능이 충분해서 번역 사이트에 쓰는 큰 팬으로서 하는 말임
지금 돈 대부분은 코딩에 있음. OpenAI와 Anthropic이 최첨단 오픈소스 모델보다 6개월만 앞서 있어도 기업과 개발자 시장 대부분을 가져갈 수 있음
코딩 보조용으로 OpenRouter를 통해 여러 대형 오픈 모델을 OpenCode에서 써봤는데, 모두 Claude Opus에 비해 꽤 별로였음
오픈 모델에서 더 많은 가치를 얻으려면 어떻게 다뤄야 하는지 힌트를 줄 수 있을까?
오픈 모델이 1년쯤 뒤처진다는 흔한 말에는 동의함. 그런데 약 1년 전에 최첨단 모델이 극도로 유용해지는 마법 같은 일이 있었음. 이 논리라면 곧 오픈 모델도 잘 작동해야 하지만, 지구가 한 바퀴 더 도는 걸 기다리는 것 이상의 뭔가가 있는 것 같아 걱정됨
참고로 내 용도는 코딩 보조임. 다른 목적에서는 오픈 모델이 훌륭할 수 있음
“최전선 모델만큼 좋다”는 이 모델들을 돌리려면 5천~1만 달러는 써야 하지 않나?
직접 코딩 모델을 돌리는 투자수익률에 대해 설득력 있는 분석을 본 적이 없음. 월 20달러나 200달러 플랜과 비교하면 특히 그렇고
“200달러로 2,180.16달러어치 토큰”이라는 표현은 이상함 토큰에는 내재 비용이나 가치가 없음. 2,180.16달러어치 토큰을 썼다고 말하는 건 영업사원이 19.99달러짜리 냄비 세트가 10억 달러어치라고 설득하는 걸 믿는 것과 비슷함
편향된 정보원을 평가할 때 비판적 사고를 창밖으로 던지는 모습이 우스움
여기서 무엇에 반박하는지 잘 모르겠음
나는 200달러를 썼음. API 가격으로 냈다면 2,180.16달러였을 것임. 글은 기업 고객이 API 가격을 낸다는 내용이고, 내가 그런 회사에 고용돼 있었다면 회사에 2,180.16달러 비용을 발생시켰을 거라는 뜻임
내가 놓친 게 뭘까?
토큰에는 분명 계산 가능한 내재 비용이 있음. 생산의 한계비용, 즉 추론 비용이 있고, 그 토큰을 만들어내는 모델에 들어간 상각 연구개발 비용도 있음
가치를 계산하기는 어렵지만, 다행히 시장 가격 메커니즘은 바로 그 목적을 위해 존재함. 사람들이 지불하려는 가격보다 더 나은 숫자는 없음
그러니 기업 플랜에서는 2,180.16달러를 쓰게 된다는 말임. 본인은 그만큼 내지 않지만 기업은 냄
내 프로젝트 기준의 대략적인 계산으로는 OpenRouter에서 토큰당 지불하는 방식이, 같은 오픈 가중치 모델을 임대 GPU에서 돌리는 것과 경쟁 가능하거나 더 쌀 때도 있음
토큰당 가격은 폐쇄형 최전선 모델과 오픈 가중치 모델 모두 비슷한 범위, 즉 백만 토큰당 센트~달러 수준임. 내게는 이 가격이 어느 정도 현실에 기반해 있다는 신호로 보임
조금만 비판적으로 생각하면 그 문장은 “현재 API 가격 기준 2,180달러어치 토큰”으로 읽힘
당연히 내재 비용이 있음. 바닥은 전기요금임. 편향된 정보원을 평가할 때 비판적 사고를 버리는 모습이 정말 우스움
진짜 타이밍은 지금 강한 신규 사업 수요가 부족하고, 충분한 기술 자산을 축적했기 때문에 일이 점점 증분 작업이 되어가고 있다는 데 있음
방대한 과거 작업 위에 안정적인 기능을 쌓을 수 있다는 뜻이고, AI가 특히 빛나는 지점임. 그래서 AI가 있든 없든, 대부분의 일이 기능 하나 추가, 버그 하나 수정, 설정 조금 조정 같은 증분 작업이라면 회사들은 소프트웨어 엔지니어를 덜 뽑았을 것임. AI는 그 압박을 가속했을 뿐임
반대로 20년 전에 같은 AI가 있었다고 상상해보면 다름. 사람들이 아직 JAX-RS를 이해하려고 하던 때 AI가 Jersey를 정말 쓸 수 있었을까? React가 막 발명됐을 때 React에 대한 모든 질문에 답할 수 있었을까? 퍼블릭 클라우드 인프라나 이른바 빅데이터 플랫폼 전체를 구축하는 데 사람을 10분의 1로 줄일 수 있었을까? 당시에는 빠르게 진화 중이라 수많은 가능성을 탐색할 엔지니어가 많이 필요했을 것임. AI로 머신러닝 생태계를 10분의 1 인력으로 만들 수 있었을지도 매우 의심스러움. 20년 전에는 R이 대세였고 Python 생태계는 전혀 성숙하지 않았음. 모바일 컴퓨팅도 마찬가지로, 모든 모바일 앱과 기반 인프라를 만드는 사람을 AI가 10분의 1로 줄였을까?
“AI가 React에 대한 모든 질문에 답할 수 있었을까?”에는 문맥 내 학습(ICL) 때문에 가능하다고 봄
“퍼블릭 클라우드 인프라나 빅데이터 플랫폼을 10분의 1 인력으로 만들 수 있었을까?”에는 아니라고 봄. 핵심 문제는 못 풀고, 규모가 커지면 엉망을 만듦
증분 작업에 대해서는 맞음. 다만 역사적으로 대부분의 일은 증분 작업이었고, 연구개발 직무는 소수였다고 봄
인정할 건 인정해야 함. 이 전체는 역사상 가장 위대한 사기극임
AI에는 쓸모 있는 용례가 있지만 현재 가격으로는 아님. GPT-2 때부터 꽤 많은 헤비 유저와 함께 AI를 써왔음. 모든 사용자가 같은 이야기를 함. 호기심, 놀라움, 과대광고, 혐오, 깨달음. 기업은 보통 조금 늦고 지금은 과대광고 주기에 있음. 바로 그 지점에서 모든 계약을 팔고 IPO를 하는 것임
정말 VC의 교과서 같은 움직임
오해하지 말아야 할 건 AI에 유용한 사례는 있다는 점임. 다만 그들이 원하는 방식은 아님. 블록체인과 꽤 비슷함. 탈중앙화 화폐라는 아이디어는 존재할 권리가 있음. 다른 코인 99%는 아님
AI는 더 빠르지만 여전히 덜 정확한 검색 엔진임. 버그 찾기에는 훌륭하고 러버덕 디버깅에도 좋음
사기극이라고 부르는 이유는 마케팅과 함께 전 세계 수많은 사람에게 이제 스스로 배우지 않아도 스타트업, 게임, 인프라 등을 만들 수 있다는 인상을 주기 때문임. 그 결과 수백만 개의 방치된 저품질 프로젝트와 제품이 생김. 대다수는 문제를 철저히 해결하는 데 필요한 정신 모델을 한 번도 만들지 못했음. 결국 몇 달과 돈을 낭비하고 토큰만 태움. 이걸 사기극이라고 부름
내가 아는 모든 초기 수용자들은 돈 때문이 아니라 새로운 용례가 없어서 사용량을 크게 줄였음. 새 프로젝트를 탐색할 때는 빠르게 온보딩하고 많이 배운 뒤 문서와 실제 테스트로 넘어가면 됨. 내 사용량은 지난 2년 중 최저임
AI가 내 코드를 건드리게 하지는 않을 것임. 다시 기어올라올까 봐 불안함. 대신 내 코드를 읽고 내가 뭘 잘못했는지 알려주게 해서 스스로를 갈고닦게는 함
오픈소스 솔루션을 포함해 수백 개 회사가 그 정도는 제공할 수 있음
비기술 친구들은 모두 지금 과대광고 주기에 있고, 앞으로 올 흥분과 예측 가능한 좌절을 내게 공유함
어떤 의미에서는 AI가 의식적으로든 무의식적으로든 이렇게 철저하게 VC식으로 활용되어, 전 세계가 지켜보는 가운데 거대한 회사들을 만들어낸 점이 인상적임
원래 주장을 정리해보려는데 도와줄 수 있을까
토큰을 쓰는 코딩 모델의 투자수익률이 양수가 아니라서 사기극이라는 뜻인가? 예를 들어 월 100달러를 받을 만큼 충분한 가치를 만들지 못한다는 의미?
기업 고객은 이걸 볼 만큼 똑똑하지 않다는 뜻인가?
궁극적으로 블록체인식 허상인데 CEO 수익을 극대화하려고 IPO한다는 뜻인가?
내가 제대로 이해한 건가, 아니면 말을 덧씌운 건가?
“사람들에게 이제 스스로 배우지 않아도 자기 스타트업, 게임, 인프라를 만들 수 있다는 인상을 준다”는 부분은 사람들의 믿음과 동기를 단정할 수는 없지만 허수아비치기 아닌가? AI는 사람을 증폭하는 강력한 도구임. “10억 달러 가치의 엔터프라이즈 SaaS 앱 만들어줘”나 “GTA6 만들어줘, 환각하지 말고”라고 프롬프트만 넣을 수는 없음. 하지만 실제로 그런 일이 벌어진다는 인상인가? Dario와 Sam이 “우리 코딩 에이전트 구독을 사면 기술 없이 한 번에 게임을 만들고 부자가 될 수 있다”고 말하고 있나?
AI 에이전트에서 가치를 못 느끼는 건 오늘도 충분히 그럴 수 있음. 괜히 찜찜할 수도 있고. 하지만 블록체인과 동급의 사기극이라고 하는 건 엄청난 신호들과, 이 시스템들이 오늘 무엇을 할 수 있고 올해 말쯤 무엇을 하리라 기대하는지에 대한 실제 대화와 모순된다고 봄
Anthropic은 내가 읽은 바로는 실제로 수익성이 있는 게 아니고, 할인 때문에 잠깐 흑자로 보였던 것 같음. 이 글이 그 주장을 잘 함: https://www.wheresyoured.at/anthropics-profitability-swindle...
현재 가격 인상이 충분한지도 회의적이고, 앞으로 필요할 더 큰 가격 인상을 대부분의 사용자와 기업이 받아들일지도 회의적임. 특히 개인 사용자에게 월 200달러는 이미 엄청 비싼데, 대부분이 월 1,000달러 같은 가격을 낼 것 같지는 않음
LLM 관련 뉴스는 이 회사들이 IPO한 뒤까지 그냥 무시해야 할 것 같음. 긍정 여론을 꾸미는 봇이 많음
좌석당 월 200달러는 아무것도 아님
우리 연구개발 그룹 사람들이 쓰는 3D CAD 라이선스 패키지 하나는 좌석당 월 수천 달러가 듦
소프트웨어 좌석도 이제 사랑받을 때가 됐음
AI 자동 생성 콘텐츠
본 콘텐츠는 RSS: GeekNews (한국어)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기