오픈소스 AI는 반드시 이겨야 한다

오픈소스 “AI”는 존재하지 않음. 로컬에서 실행 가능한 LLM은 각 버전 학습에 수백만 달러를 쓰고 입력 데이터를 완전히 통제하는 거대 기업의 호의로 제공되는 불투명한 덩어리일 뿐임
독립적으로 부유하지 않은 개인은 모델이 어떻게 만들어졌는지 전부 검토하거나, 원래 학습 데이터셋을 손보거나, 원할 때 처음부터 다시 만들 수 없음
개인 컴퓨터에서 반드시 미리 컴파일된 무료 LLM을 실행하는 건 중앙화 인프라에 대한 길러진 의존이고, 현재 현실에서는 개인이 구조적으로 통제할 수 없는 기술을 지지하는 행위에 가까움. 차라리 저온 핵융합이 이겨야 한다는 선언문을 쓰는 편이 낫겠음

대체로 맞지만, 실제로는 공공 자금으로 지원되어 가중치, 학습 데이터, 방법론 등이 공개된 모델도 있음
물론 이런 모델들은 대부분 기술 역량만 보면 최전선 모델과 같은 수준은 아니며, 애초에 그걸 목표로 하지 않는 경우도 있음. 예를 들어 EU는 번역 같은 목적을 위해 EU 내 언어를 더 잘 대표하는 모델 개발에 자금을 댔음
그리고 오픈소스 모델이 정의상 반드시 로컬에서 실행 가능해야 한다고 보지는 않음. 모델이 진짜로 열려 있다면, 뒤에 있는 회사가 망해도 그 모델의 추가 개발 기반이 회사 안에 잠기지 않으므로 위험이 크게 줄어듦. 오픈소스 소프트웨어가 꼭 “내 로컬 머신에서 싸게 할 수 있음”을 뜻하지는 않음

로컬 실행 LLM에도 개방성의 스펙트럼이 있음. 어떤 것은 학습 데이터와 방법 정보가 거의 없는 불투명한 덩어리지만, 어떤 것은 학습 데이터셋과 소스 코드가 공개되어 있음
최근 비교적 열린 LLM으로는 NVIDIA-Nemotron-3-Nano-30B-A3B(오픈소스 코드, 학습 데이터셋 대부분 제공)와 Olmo-3.1-32B-Think(오픈소스 코드, 모든 학습 데이터가 Hugging Face에 공개)가 있음
이론적으로는 누구나 비슷한 모델을 재현하고, 어떤 데이터를 학습에 쓸지 정하거나 학습 레시피를 수정할 수 있음. 다만 부유하지 않은 개인에게 사전학습은 여전히 손이 닿지 않는다는 점은 맞음

완전한 오픈소스 모델은 분명히 있음. 최전선 모델은 아니지만 실제로 존재함 OLMo는 OSI의 검증 단계를 통과한 모델로 명시되어 있고, Pythia도 OSI가 오픈소스 AI 시스템 요건을 충족한다고 검증했음. Lucie-7B는 OSI AI 정의를 따르는 초기 다국어 LLM 중 하나이며, 제작자들은 학습 데이터셋, 데이터 준비 코드, 모델 가중치가 모두 공개 라이선스로 제공된다고 명시함

“어떻게 만들어졌는지 전부 검토하고, 원래 학습 데이터셋을 손보며, 마음대로 처음부터 다시 만들 수 없다”는 말에서 맞는 부분은, “개방형”이라고 홍보되는 모델이 전부 데이터와 학습 절차 등에 대해 진정으로 투명하고 열려 있지는 않다는 점임. 최선은 재현 가능성까지 갖추는 것임
처음부터 학습하는 데 큰돈이 든다는 것도 맞음. 다만 그렇다면 Linux 커널을 쓰는 것도 “길러진 의존”이라고 부를 것인지 궁금함. 같은 단서들이 거기에도 적용되기 때문임

“AI는 일, 교육, 과학, 소프트웨어, 창작, 공공 서비스, 국가 역량을 위한 문명적 인프라”가 아님. 그것을 통제하는 사람들이 그렇게 만들고 싶어 하고 필사적으로 밀어붙이고 있을 뿐, 실제로는 그렇지 않음

생각을 자원 많이 먹고 저작권 침해하며 환각하는 기계에 외주 주지 않으면 됨 😘
물론 이 권력을 소수 거대 기업 손에 집중시키지 않는 것은 현재 AI의 큰 문제 하나를 해결하지만, 다른 문제들은 전혀 해결하지 못함

“자원 많이 먹는다”는 말은 최전선 모델을 학습할 때나 수억 명이 최전선 모델을 쓰게 할 때는 정확함. 하지만 로컬 AI에 대해 그렇게 말한다면 계산을 잘못했거나, 꽤 극단적인 환경주의 입장을 펴는 것에 가까움
실제로 유용한 가장 작은 로컬 코딩 에이전트는 Qwen3.6 27B이고, 전력 제한이 걸린 NVIDIA 카드에서 간헐적으로 280~300W 정도로 무난히 돌아감. 하루 코딩에 쓰는 전기는 데스크톱 게이밍 머신으로 Subnautica 2를 몇 시간 하는 것보다 적을 것임. 작은 모델에는 생각을 많이 외주 줄 수 없어서, AI는 쉬고 사람이 생각하는 시간이 더 많기 때문이기도 함
학습 비용은 더 크지만, 1년에 27B 규모 모델 몇 개만 학습하려는 정도라면 산업 문명 전체에서는 묻히는 수준임. 예전에 계산해 봤을 때, 아이슬란드에 지열 발전 알루미늄 제련소 하나를 더하는 정도면 27B급 모델 몇 개를 충분히 학습할 수 있다는 식으로 나왔음. 공짜는 아니지만 반올림 오차에 가까움
추론 전력 사용량은 백열전구 3개보다 적고, 그것도 모델이 실제로 생성할 때뿐임. 학습 전력 사용량은 대형 산업 시설 하나 수준이지만, 거의 전부 재생에너지로 할 수도 있음. 아이슬란드는 그런 점이 좋음
“저작권 침해”는 현재 미국 판례상으로는 맞지 않아 보이고, 저작권 권한을 더 키우는 데는 조심스럽게 접근해야 함. 90년대부터 저작권 확대에 반대해 왔기 때문에, LLM 학습 방식이 마음에 드는 건 아니어도 이 문제는 저작권법 영역을 벗어나 정치와 입법의 영역으로 옮겨간 듯함. 다만 Anthropic이 책을 그냥 불법 복제한 경우는 예외임
하지만 생각을 외주 주는 문제는 빠르게 엉망이 되어 가고 있음. 많은 사람들이 스스로를 기계 신의 고기 인형으로 만들려 하고 있고, 그건 무섭다

저작권 침해는 LLM과 AI 회사가 나쁜 이유로 자주 거론되지만, 그 쟁점에 결집하는 건 곁길로 새는 일이라고 봄
살인이 나쁜 이유를 “불법이라서”라고 말하는 것과 비슷함. 살인이 나쁜 건 맞지만, 그게 나쁜 이유는 불법성이 아님. 법은 바뀔 수 있음. AI가 저작권 때문에 나쁘다는 생각으로 흐름을 만들었다가 의회가 합법화하면, 모두가 갑자기 AI를 괜찮다고 받아들일 건가? 실제 우려의 핵심에 더 가까운 다른 반대 이유가 있었고, 거기에 결집하는 편이 더 생산적이었을 수 있음
Alexandra Elbakyan도 저작권 침해자임. 하지만 그는 성인이고, 모든 대학에 그의 동상이 있어야 함

곧 데이터 정점에 도달할 것이고, 그 이후의 발전은 대체로 최신 LLM을 에이전트적으로 뭉쳐 쓰는 쪽에서 나올 것 같음
마지막으로 공개되는 오픈소스 모델은 앞으로 수년 동안, 계속 바뀌는 오픈소스 에이전트형 또는 다른 상부 구조의 기반으로 쓰일 가능성이 큼

더 정확히는 대중이 지난 20년간, 특히 최근에 기술 대기업들이 받은 막대한 공공 자금을 인식하고, 세금으로 지불된 인프라에 대한 권리를 요구해야 함
이 회사들은 거대한 공적 자금 투입 없이는 존재하지도 못했고 존재할 수도 없었음. 게다가 학습 데이터도 상당 부분 공공 공유지에서 직접 가져온 것임
이 모델들은 사적 노력의 산물이 아니라 거대한 집단적 노력의 최종 결과이며, 법적으로 공공 공유재로 인정되어야 함

중요하든 아니든, 거품이든 아니든, 환각하는 토큰 예측기이든 아니든, 모든 국가가 “Frontier lab”에 최신 모델을 제외한 모델들을 오픈소스로 공개하도록 강제하는 법적 틀을 갖추는 건 매우 중요함
공개 범위에는 가중치, 학습 데이터, 방법론 등이 포함되어야 하고, 아니면 각 모델을 10~15년 뒤에는 오픈소스로 만들도록 강제해야 함. 인류 지식의 발전과 “가진 자”와 “못 가진 자”의 분리를 막기 위해, 모든 모델은 일정 시간이 지난 뒤 공개되어야 함
AGI가 가깝지 않다고 생각할 수도 있지만, 이 최전선 연구소들의 의도는 AGI에 가장 먼저 도달한 뒤 유료 장벽 뒤에 혼자 보유하는 것임. 가능성이 크든 작든, 인류 전체의 이익을 위해 그런 일은 막아야 함

한동안 우리가 자원봉사처럼 기여하는 머신들로 분산 모델 학습 시스템을 만드는 걸 고민해 왔지만, 현실적으로는 난도가 천문학적으로 높음
통신 속도가 감당이 안 되고, 신뢰할 수 없는 노드에서 오는 데이터 오염도 문제임
오염된 데이터 뒤의 모든 결과를 버리지 않아도 되는 자가 복구 체크포인트 롤백 시스템으로 후자는 거의 해결할 수 있을 듯하지만, 이건 한 사람이 아이디어만으로 할 수 있는 작은 프로젝트가 아님
이제 프런티어 연구소 전체가 추가 진전을 금지당하는 상황이라면 이런 방향에 관심이 생길 수도 있음
지구상의 모든 GPU 총합은 그들의 역량을 압도할 텐데, 효율적으로 분산 활용할 방법이 필요함
Fable을 그들만큼 빠르게 학습시키지는 못해도, 언젠가 접근할 수 있는 편이 영영 접근 못 하는 것보다는 나음

앞서 다른 답글에도 썼지만, 좋은 아이디어여도 현실에서는 성립하기 어려움 AI 전용 하드웨어는 소비자용 GPU보다 훨씬 빠를 뿐 아니라 전력 효율도 훨씬 좋고 연결성도 훨씬 뛰어나며, 이 세 축이 각각 아이디어를 무너뜨림
전력 효율 차이가 워낙 커서 지구상의 모든 공개 GPU나 유사 장치를 끌어모아도 전기요금이 너무 커지고, 차라리 그 돈으로 자체 데이터센터를 짓는 편이 총비용상 더 싸질 수 있음
전기가 공짜여도 전 세계에 흩어진 GPU를 인터넷 지연시간으로 묶으면 수천~수백만 배 느려질 것이고, 가능할지도 불확실함
어쨌든 이번 10년 안에는 fable-oss를 얻기 어렵고, 어쩌면 이번 세기에도 힘들 수 있음
정부들이 연합 형태로라도 직접 데이터센터를 사서 소유하고 공익을 위해 운영하는 편이 더 나으며, 실제로 그렇게 해야 한다고 봄

사람들이 분산 학습을 떠올릴 때 같은 회사가 소유한 거대한 데이터센터들이 장거리로 모델을 학습시키는 모습을 먼저 떠올리지는 않음
대신 수천 개의 작은 데이터센터나 개인 사용자가 인터넷으로 여유 연산을 모아 단일 주체보다 큰 학습 실행을 조율하는 모습을 상상함
Pluralis Research, Prime Intellect, Nous Research 같은 회사들이 이 비전을 추구하고 있고 이미 규모 있는 분산 학습에 성공했지만, 실제로 인터넷 기반 분산 학습은 중앙집중식 학습보다 훨씬 뒤처져 있음
가장 큰 모델들인 Pluralis의 8B Protocol Model, Prime Intellect의 INTELLECT-1, Nous의 Consilience 40B조차 xAI의 Grok 4 같은 현재 프런티어 모델보다 1,000배 적은 연산량으로 학습됐음 https://epoch.ai/gradient-updates/how-far-can-decentralized-...

지구상의 모든 GPU 총합이 그들의 역량을 압도한다는 건 맞지 않음
얼마나 많은 실리콘이 바로 그 회사들로 갔는지, 그리고 그 실리콘이 소비자용 장비보다 얼마나 강력한지 오해한 것임

이것과 분산 LLM 추론이 필요함
이제 개인 한 명이 최신 모델을 돌릴 장비를 꾸리기에는 너무 비싼 지점에 왔음
그래서 개인들이 자원을 공유해 최신 모델을 분산 방식으로 실행할 수 있는 프레임워크를 만들고 채택해야 함
그러면 정부가 검열하기도 어려워짐
한 주체가 이를 무기화하지 못하게 하는 유일한 방법은 모두에게 접근권을 주는 것임

로컬의 작은 LLM들이 서로 보완해서, 총합으로 훨씬 성능 좋은 LLM을 만들 방법이 있을지 궁금함

Teale.com을 만들고 오픈소스로 공개했음
Mac, Windows, Linux, Android, iOS, 심지어 HarmonyOS에서도 완전 분산 추론을 구동함
오픈소스/오픈 가중치 모델은 계속 좋아질 것이고, 결국 스마트폰이나 안경 하드웨어에서도 mythos급이 돌아가게 될 것임
다만 지금은 공급과 수요를 맞추는 일이 지독하게 번거로움
예를 들어 16GB RAM MacBook이라는 물리 하드웨어가 실제로 16GB를 온전히 쓸 수 있다는 뜻도 아니고, 모델과 설정들(kvcache, context limit, temperature 등)을 수요에 맞추는 문제도 있음
사람에 의한, 사람을 위한 AI 추론이 필요하니 도움을 환영함

모델이 분산돼 있다면 모델 계층 사이의 데이터 전송을 고려할 때 분산 LLM 추론은 매우 비효율적으로 보임
Petals라는 프로젝트가 180B 모델에서 최대 4 tok/s를 주장하긴 했지만 저장소는 2년 동안 업데이트가 없음 https://petals.dev/

한 주체가 이를 무기화하지 못하게 하는 유일한 방법이 모두에게 접근권을 주는 것이라는 주장에는 중간 지대가 있음
정책 공간에는 정부가 접근과 독점을 모두 규제하는 방식도 포함됨
이 기술의 독점에는 반대하지만, 모두에게 탈옥된 AGI/ASI를 주는 위험은 분명해야 함
장난감 예시로는 정부가 여러 연구소(n_quorum)에 하청을 주고 모두에게 토큰 예산을 주는 보편 기본 AI를 상상할 수 있음
다만 API 운영에는 안전 통제가 따라야 함
모두가 자기 탈옥 AGI를 실행하게 된다면, 안정적인 사회 규범은 누가 CBRNE 위협을 만들지 감시하는 대규모 감시뿐일 듯함
시민 자유 관점에서 명확한 승리처럼 보이지는 않지만, 그런 논리가 가능하다는 건 이해함

내 집과 내 사업에서는 처음부터 이겼음
정확히는 오픈 가중치였고, 그 미묘한 차이는 불편하게 느껴짐
제품의 작동이나 개발을 수익성도 불명확하고 속을 알 수 없는 두 대형 스타트업 중 하나의 비밀 소스에 완전히 의존하게 만드는 태도를 이해한 적이 없음
건전한 엔지니어링 원칙에도 어긋남
그래서 그렇게 할 생각은 없었고, 지금 AI를 탐색하는 이유도 오픈 가중치 덕분에 시간을 쓸 만하다고 판단했기 때문임
이미 사업은 단일 결제 플랫폼과 미국 신용카드 제공사 두 곳의 정책에 종속되는 경우가 많아 그것만으로도 충분히 나쁨
프리랜서 기질 때문인지, 기반 기술이 아니라 누군가의 제품을 공부하고 배우는 데 너무 많은 에너지를 넣으라는 요구를 받으면 늘 불안함
Microsoft가 NT 소스 코드 접근권을 약속하며 학과들을 설득하던 시절도 기억함
당시 우리 쪽의 고위 인사가 Linux는 곁가지이고 NT 접근권이 우리를 의미 있게 만들어줄 것이라고 말했던 것도 기억함
자기 운명에 대한 통제력은 늘 더 필요하며, 최첨단은 최신 안정 기술보다 앞서 있다는 점을 스스로와 주변에 상기시킴
진보는 최첨단에서 일어나지만 손상 위험도 있음
엔지니어링은 남의 진보에 올라타는 게 아니라 최신 안정 기술 위에 구축하는 데 집중해야 함

이 맥락에서 오픈소스라는 말은 불편한 미묘함이 있음
llama.cpp 같은 도구는 열려 있지만, 가중치 없이는 쓸모가 없음
가중치는 서로 전쟁 중인 대형 조직들이 기부하는 엄청나게 비싼 자본임
예를 들어 archive.org가 진짜 열린 가중치를 만들 수 있을지 모르겠고, archive.org 말고는 freebsd나 apache 같은 다른 오픈소스 조직이 진짜 열린 가중치를 만들 위치에 있다고 상상하기도 어려움
가능하다면 정부, 정부 기관, 대학 정도일 수 있음
하지만 지금 그런 기관들은 가중치를 만들 인프라에 돈을 쏟아부을 만큼 자금도, 권한도, 의지도, 관심도 충분하지 않음

나는 흥미롭게도 다른 접근을 택했음
AI는 우리 사업의 개발 방식을 보완하며, 엔지니어들이 최고의 오픈소스 모델보다 Opus 4.8을 쓰는 편을 훨씬 선호함
오픈소스가 중요하다고 믿지만, 내 사업에서는 쓸 수 있는 최고의 도구를 그냥 쓸 것임

오픈소스가 무료 소프트웨어라는 뜻이 되면, 사실상 무료 복사본을 원한다는 말과 비슷해짐
우리가 말해야 하는 건 공개적이고 커뮤니티가 운영하는 프로젝트가 공동으로 사전학습과 학습을 수행하자는 것임
이는 학습 말뭉치를 공개적으로 다루고 학습 작업을 어떻게든 조율한다는 뜻임
이건 용어 의미를 완전히 바꾸는 일이고, 사람들이 불법복제와 절도를 뒤섞는 것과 비슷함
서로 다른 것이니 다른 단어를 써야 함
무료 가중치, 추론 코드, 채팅 템플릿은 커뮤니티 운영 LLM 프로젝트와 매우 다름

EleutherAI가 그런 것에 가까울 수 있음

누가 자금을 댈까?
학습 비용은 상상하기 어려울 정도로 비쌈
투자 수익을 노리는 VC 자금 모델이거나, 권위주의적인 중국 사회 모델을 공고히 하려는 CCP 자금 모델이 있을 뿐임
대학의 4B 모델 정도는 있겠지만 멀리 가기는 어려워 보임

그 우려에 공감하지만, 지금도 비슷하게 크고 복잡한 것들이 오픈소스로 남아 있음
내 Linux 컴퓨터가 조 달러 기업 두 곳이 만든 운영체제와 거의 같은 경험을 제공한다는 사실에 매일 놀람
심지어 그 상용 대안들이 하지 못하는 일도 함
DeepSeek이 정말 서구 경쟁사 비용의 1/10, 직원 수의 일부만으로 모델을 내놓는다면, 이 영역에서 대안을 제공할 누군가를 위한 시장이 있다는 뜻일 수 있음
IBM 같은 회사들이 Linux에 기꺼이 기여하고 그 기여를 무료로 내놓는 이유를 생각함
시장의 더 지배적인 상용 플레이어에 대한 대안이 필요한 기업 후원자 집단의 일부이기 때문임
Meta가 React를 사실상 무료로 내놓는 이유도 비슷함
표준이 되고 이미 아는 사람을 채용할 수 있는 편이 Meta에 더 유리하기 때문임
AI 모델에서 같은 생태계 이익을 상상하기는 더 어렵지만, 어딘가 있을 수도 있음
데이터센터/VPS 제공업체들이 대형 AI 회사의 협상력을 줄이기 위해 그런 것을 후원하는 모습은 상상 가능함
물론 이 낙관이 허황된 꿈일 수도 있음

모델 증류가 합법적 활동이라는 법적 선례가 정말 필요함
모델 제작자들이 남의 작업을 긁어 학습하고 정보를 자기 것처럼 세탁하면서 원 창작자에게 돌려주지 않아도 된다면, 모델을 증류하는 게 왜 불법이어야 하는지 모르겠음
프런티어 모델 제작자들이 다른 지식재산권 전반에 하고 있는 것과 같은 일임

1960년대 컴퓨터 비용을 물가 보정해서 계산해 본 적이 있는가?
학습은 지금 상상하기 어려울 만큼 비쌈
여러 대학이 돈을 모으면 어떨까?
여러 국가가 돈을 모으면 어떨까?
결국 돌파구가 생기고 최적화가 일어날 것임
사람들은 오픈소스 운영체제가 실현 가능할지 의심했지만, Linux는 수십 년 동안 데스크톱 환경의 실질적 선택지였고 서버와 휴대폰 운영체제로는 말할 것도 없이 널리 쓰임

비싸기만 한 게 아니라 낭비적이기도 함
낡은 모델을 쓰는 데는 가치가 없음
오픈소스 AI 선언문이 “오픈소스 AI는 경제적으로도 지속 가능해야 한다”고 요구하지만, 그건 희망적 사고에 가깝음

폐쇄형 모델을 내는 연구소라면 오픈소스 모델도 함께 공개해야 한다는 방식은 가능할 수도 있음
gpt-oss는 이제 낡았지만 나왔을 때는 괜찮았음
Nemotron도 탄탄하고, 특히 최근 ultra 릴리스가 좋음
Nvidia는 특히 중국 모델들과 비교해 모델 자체뿐 아니라 사전·후학습 데이터까지 포함해 모든 부분을 공개한다는 점에서 훨씬 나은 이야기를 갖고 있음

기업의 부산물로 오픈소스 모델을 얻기보다는, 오픈소스 AI 연구소를 지원하는 데 월 50달러를 낼 의향이 충분히 있음

AI 연구소들은 수천억 달러를 쓰고 있으니 경쟁하려면 구독자가 아주 많이 필요함

OpenAI가 신뢰를 망쳤다고 봄
그 오픈소스 AI 연구소가 어떤 식으로든 영리 회사로 분사하지 않을지 어떻게 알 수 있나?

내가 알기로 DeepSeek은 폐쇄형 모델이 없고 대부분보다 코드/데이터/논문을 더 많이 공개함
그들의 API를 쓰기 시작하면 될지도 모름
기업의 부산물도 아님

오픈 가중치 AI에는 학습과 연구에 큰 자본을 투입할 유인이 없을 수 있음
기부 기금 같은 것이 생길 수는 있겠지만, 프런티어 연구소들이 받는 수준의 자금 조달에는 당연히 못 미칠 것임
그래서 AI가 오픈 가중치만으로 존재하는 건 불가능할 수도 있다고 봄
OpenAI, Anthropic, Google 같은 주요 플레이어는 계속 남고, 오픈소스 버전보다 더 좋은 모델을 가질 가능성이 큼
Photoshop과 GIMP의 관계처럼 보일 수 있음
Photoshop이 프런티어 연구소이고 GIMP가 오픈 가중치 모델인 셈임
GIMP는 다양한 이미지 편집 워크플로에 충분히 쓸 만하지만, Photoshop이 그냥 더 좋음
프런티어 연구소보다 더 나은 오픈 가중치 모델이 있으면 당연히 좋겠지만, 가능하다고 보지는 않음

나도 비슷하게 생각하지만, 오픈소스 모델이 아니더라도 로컬 AI는 결국 필연적이라고 봄
OpenAI 등도 온프레미스 제품을 낼 수 있음
그게 어플라이언스 랙이든 다른 형태든, 대기업들은 데이터 주권과 비용 통제를 위해 추론을 로컬에서 돌리고 싶어 할 것임
특히 제조업이나 다른 망분리 네트워크에 AI를 통합하려는 시점이 오면 더 그렇음

Photoshop과 GIMP 비유는 꽤 괜찮음
지금은 일종의 급속 확장 단계지만, AI 뒤의 기술이 정말 진화하지 않는 한 점점 더 좋은 모델을 만들기는 어려워지고 수익 체감이 올 것임
LLM의 GIMP가 VC 자금 모델의 80% 성능만 내도 많은 사람에게 충분히 유용할 것임
독점 모델만큼 좋지 않다는 게 사실이더라도, 오픈소스 모델을 쓸 선택지가 있다는 것만으로도 승리라고 봄

한발 물러서서 보면 시간문제임
소비자에게서 조 달러를 뽑아내는 게 불가능하다는 사실이 드러나면 조 단위 가치평가는 무의미하다고 여겨질 것임
그 사이에도, 그리고 어쨌든 소프트웨어 최적화와 하드웨어 확장이 계속되면 머지않아 모바일 기기에서 Fable보다 더 뛰어난 능력의 오픈 가중치가 돌아가게 될 것임

사용자가 folding@home처럼 학습에 연산을 기부할 방법이 있다면 가능할지도 모름
다만 그게 어떻게 실용적일지는 모르겠음

오픈 가중치만으로 AI가 존재하기 어려운 더 근본적인 이유가 있음
어떤 AI 모델들은 최첨단 하이퍼스케일 데이터센터에서만 합리적으로 실행 가능할 만큼 큼
그런 모델을 오픈소스로 공개하는 건 대체로 무의미함
이는 오늘날 가장 큰 공개 모델보다도 훨씬 큰 규모이며, 작고 저렴한 임시 클러스터에서 느리게 추론하는 것조차 배제되는 수준임
Fable은 이미 그 지점에 있을 가능성이 있음

정서와 미션에는 동의하지만, 이 목표는 이제 정치와 분리될 수 없음
Open Source(tm)라고 해서 정부나 다른 주체가 실리콘이나 그 실리콘이 할 수 있는 일에 통제를 가하는 것을 막아주지는 못하며, 이미 전 세계에서 그런 일이 일어나고 있음
모델이 오픈소스여도 규제나 경제적 유인을 해결하지 못함
그건 몇 문단으로 압축할 수 있는 문제가 아님
AI는 문명적 인프라이고, 소스만이 아니라 문명적 해법이 필요함

독점 자본주의와 금융 자본주의는 100년도 더 전부터 시장을 장악했고, 국가는 그 거대한 이해관계에 봉사함
모두가 AI 기업들이 학습을 위해 무단으로 가져갔다는 걸 알지만 아무 일도 일어나지 않을 것임
법이 계급적으로 적용되는 노골적인 예임
자기들 법을 제멋대로 적용하는 이유는 늘 국가안보가 될 것임
그들이 인프라를 소유하니 그들의 이익이 곧 국가안보가 되기 때문임
기술이 큰 도약을 할 때마다 판을 흔들 수는 있지만, 금융 자본주의는 빠르게 적응해 그 파도를 흡수함

글에서 다루지 않았다면 오픈소스와 오픈 가중치의 구분이 중요함
오픈 가중치 모델은 거의 첫 투약은 공짜인 입문용 마약 같음
적어도 원래 학습 데이터가 없으면 의미 있게 업그레이드할 능력이 너무 제한되어, 지속적으로 개발되는 최신 모델보다 금방 뒤처지게 됨
그러면 다음 공개를 갈망하거나 제공자의 API로 돌아가게 됨
단순히 지식 기준일을 앞으로 옮기는 것만으로도 사용자 경험이 눈에 띄게 좋아지고, 추론, 양자화 인식 학습, 앞으로 나올 여러 개선까지 말할 것도 없음
오픈 가중치 모델을 개선하는 연구는 할 수 있지만 결론은 같음
오픈소스가 아니면 일반 대중에게 주는 이익은 훨씬 작아짐

오픈소스 AI는 정의상 절대 이길 수 없음
오늘날 AI는 결국 언덕 오르기 최적화에 가깝고, 폐쇄형 연구소들은 열린 세계가 하는 모든 것을 흡수해 그 위에 더 쌓을 수 있음
대부분의 사용 사례에서는 큰 문제가 아닌데, AI는 능력 포화 방식으로 작동하고 있기 때문임 https://www.delanceyukschoolschesschallenge.com/the-rising-t...
예외는 자연이나 타인과 본질적으로 대립하는 분야처럼 경쟁 대비 우위가 중요한 경우뿐임

흔한 작업에서 능력 포화에 도달하면 오픈소스가 이기는 것이고, 이미 그런 일이 일어나고 있음
두 번째 큰 승리는 보통 사람이 자기 하드웨어에서 실행할 수 있게 되는 때일 것임

Linux에도 같은 말을 할 수 있었음
Microsoft는 Linux에서 얼마든지 배울 수 있었지만, Linux는 상용 경쟁자들에도 불구하고 관련성을 유지했을 뿐 아니라 Firefox의 현재 시장점유율 같은 사례와 달리 이제 압도적으로 가장 널리 퍼진 운영체제가 됨
공개 시스템에서 좋은 아이디어나 데이터를 모두 흡수하는 능력만이 유일한 결정 요인은 아닌 듯함

폐쇄형 연구소들도 여전히 투자를 정당화해야 하고, 모델 능력이 정체에 가까워질수록 그건 점점 어려워짐
지금은 Fable과 Mythos가 최첨단이지만, 머지않아 범용재가 될 것임
OpenAI/Anthropic처럼 최신 모델로 앞서가려는 회사 하나당, 그 보완재를 범용재화하려는 회사는 백 개쯤 있을 것임

AllegroLisp는 SBCL보다 훨씬 뒤처져 있음

오픈소스 모델이 Claude Mythos나 Claude Sonnet만큼 좋아야 이기는 것은 아님
오픈소스의 승리는 폐쇄형 모델에 대한 대안 중 적어도 하나가 GPT-4 정도로 좋다는 뜻이면 충분함
사실 Google Gemma 모델들로 이미 거의 그 지점에 와 있음
소프트웨어 엔지니어로서 Sonnet 이후 내 생산성 차이를 느끼지 못했음
물론 Opus가 더 좋고 Fable은 더 좋겠지만, 경제적 가치 관점에서는 이미 수익 체감에 부딪히고 있음
Cursor에서 초기 GPT 모델 중 하나를 쓰다가 Claude Code와 Sonnet으로 옮겼을 때는 내게 거의 5배 생산성 향상이 있었음
Claude Code 전에는 AI를 작은 코드 조각에만 썼지만, Claude Code + Sonnet에서는 전체 하위 작업을 맡길 수 있었음
그래도 Opus에게 전체 기능을 끝까지 맡길 만큼 신뢰하지는 않음
언젠가 그렇게 될지도 확신이 없고, 꼭 그럴 필요도 없을 수 있음
회사들은 소프트웨어 엔지니어에게 어느 정도 높은 재능을 요구하지만, 그 수준을 넘어서면 정말 아무 관심도 없음
차이가 크더라도 알아차리지도 못함

오픈소스 AI는 반드시 이겨야 한다

요약

핵심 포인트

댓글