Gemma 4가 완전 무료로 상업적 이용이 가능한 이유 —— Google의 오픈 전략 해설

🐹 못치: "있잖아 키나코, 요즘 AI는 다 유료인 것 같아."

🐹 못치: "월정액이 얼마라느니, API 요금이 어떻다느니. 간식비가 먼저 다 나갈 것 같아."

🐹 못치: "주인이 돌아오기 전에 뭔가 돈을 벌 수 있는 방법 없을까~"

🦜 키나코: "못치, 타이밍 좋네. 사실 아주 최근에 완전 무료로 사용할 수 있는 최강급 AI가 등장했어."

🐹 못치: "에, 공짜!? 진짜야!? 그거 엄청 궁금한데!"

🦜 키나코: "Google이 2026년 4월 2일에 발표한, Gemma 4라는 오픈 소스 (Open Source) AI 모델이야."

🐹 못치: "젬마? Google이 만든 AI야? 근데 Google AI는 Gemini 아니었어?"

🦜 키나코: "좋은 질문이야. Gemini는 유료 서비스용 모델이고, Gemma는 거기서 탄생한 무료 버전이야."

🦜 키나코: "게다가 이번에는 상업적 이용도 완전히 자유로운 라이선스 (License)로 공개되었어. 이건 역대 최초야."

🐹 못치: "상업적 이용도 공짜!? 돈 버는 데 써도 된다는 거야? 대박인데!"

🦜 키나코: "응. 게다가 성능이 엄청나서, 세계 오픈 AI 랭킹에서 3위에 올라 있어."

🐹 못치: "세계 3위 AI를 공짜로 쓸 수 있다니, 좀 이해가 안 가는데."

🦜 키나코: "게다가 말이야, 가장 작은 모델은 스마트폰에서도 돌아가. 겨우 1.5GB 미만으로."

🐹 못치: "스마트폰에서 최강 AI를!? 진짜 궁금해! 오늘 그 Gemma 4라는 걸 좀 알려줘!"

🐹 못치: "자자, 오늘의 테마는 뭐야?"

🦜 키나코: "오늘은 Google이 발표한 새로운 오픈 소스 (Open Source) AI 모델, Gemma 4에 대해 해설할게."

🐹 못치: "Gemma? 젬마? 보석 같은 이름이네."

🦜 키나코: "이탈리아어로 '보석'이라는 의미가 있어. 2026년 4월 2일에 막 발표되었지."

🦜 키나코: "공식적인 홍보 문구가 '바이트당 가장 고성능인 오픈 모델'이야."

🐹 못치: "호오, 뭔가 자신만만하네. 그래서 뭐가 그렇게 대단한 거야?"

🦜 키나코: "가장 큰 특징은 4개의 모델이 세트로 공개되었다는 점이야."

🐹 못치: "4종류? 그렇게 많이 내놓아서 어쩌려고?"

🦜 키나코: "스마트폰부터 클라우드 (Cloud)까지, 사용하는 장소에 맞춰 선택할 수 있게 되어 있어."

🦜 키나코: "먼저 가장 작은 E2B. 실효 파라미터 (Effective Parameter) 수가 2.3B로, 스마트폰에서도 돌아가."

🐹 못치: "에! 스마트폰에서 AI가 돌아간다고? 메모리 같은 건 괜찮은 거야?"

🦜 키나코: "1.5GB 미만으로 동작해. 사진 2~3장 정도의 용량이야."

🐹 못치: "사진 2~3장 분량으로 똑똑한 AI가 들어간다니, 대단하네."

🦜 키나코: "다음은 E4B. 실효 4.5B 파라미터로, 텍스트도 이미지도 음성도 처리할 수 있어."

🐹 못치: "잠깐만. E가 무슨 약자야?"

🦜 키나코: "Effective의 첫 글자로 '실효'라는 의미야. PLE라는 기술로 효율적으로 구동할 수 있어."

🐹 못치: "그럼 나머지 2개는?"

🦜 키나코: "3번째는 26B. 전부 128개의 전문가를 내장하고 있어서, 추론 (Inference) 시에는 8개만 작동하는 구조야."

🐹 못치: "128명이나 있는데 8명만 일한다고? 완전 게으른 거 아냐!"

🦜 키나코: "게으른 게 아니라 분업이야. 그리고 가장 큰 31B는 모든 파라미터가 항상 가동되는 최강 모델이야."

🦜 키나코: "자, 여기서부터가 Gemma 4에서 가장 큰 변화일지도 몰라."

🐹 못치: "가장 큰 변화? 모델의 성능 같은 게 아니라?"

🦜 키나코: "라이선스 (License)야. Gemma 4는 Gemma 시리즈 중 처음으로 Apache 2.0 라이선스로 공개되었어."

🐹 못치: "아파치? 뭔가 멋진 이름인데, 그게 왜 대단한 거야?"

🦜 키나코: "간단히 말하면, 누구나 완전히 무료로 사업에 사용할 수 있다는 뜻이야."

🐹 못치: "에, 완전 공짜로 사업에 쓸 수 있다고!?"

🦜 키나코: "응. 상업적 이용, 복제, 개작, 배포 모두 OK이고, 게다가 취소할 수 없는 권리로 부여돼."

🦜 키나코: "로열티 (Royalty)도 필요 없고, 사용자 수 제한도 없어."

🐹 못치: "잠깐만. 이전 Gemma는 그렇지 않았어?"

🦜 키나코: "Gemma 1부터 3까지는 독자적인 Gemma Terms of Use라는 라이선스였어."

🦜 키나코: "상업적 이용이나 재배포에 여러 제한이 있어서, 기업의 법무 부서가 심사에 시간을 많이 쓰는 경우도 많았지."

🐹 못치: "헤에. 그럼 이번 Gemma 4에서는 그 번거로운 것들이 전부 없어졌다는 거야?"

🦜 키나코: "맞아. 자신의 데이터로 파인튜닝 (Fine-tuning)한 가중치도 자유롭게 상업적으로 배포할 수 있어."

🐹 못치: "대박이다! 그럼 Meta의 Llama도 비슷한 느낌이야?"

🦜 키나코: "사실 Llama 4에는 아직 제한이 있어. 월간 활성 사용자(MAU)가 7억 명을 넘으면 별도의 라이선스가 필요하고,"

🦜 키나코: "Llama의 출력을 사용해서 경쟁 모델을 학습시키는 것도 금지되어 있어."

🐹 못치: "진짜냐! 그럼 Google 쪽이 훨씬 통이 크네!"

🦜 키나코: "Google Open Source 블로그에서도 AI의 미래에는 협력적인 접근 방식이 필요하다고 표명하고 있어."

🦜 키나코: "제한적인 장벽 없이 개발자 생태계 (Developer Ecosystem)를 강화하고 싶다는 사상의 전환이야."

🐹 못치: "그럼 내 채널도 Gemma로 돈 벌 수 있는 거 아냐?"

🦜 키나코: "못치, 일단 모델을 돌릴 수 있게 된 다음에 말해."

🐹 못치: "윽, 그 말은 하지 말아줘."

🦜 키나코: "자, 그럼 이제부터 Gemma 4의 실력을 숫자로 확인해 보자."

🦜 키나코: "Gemma 4의 31B 모델은 Arena AI 텍스트 리더보드 (Leaderboard)에서 오픈 모델 세계 3위를 차지했어."

🐹 못치: "리더보드? ELO? 어디서 들어본 것 같은데……."

🦜 키나코: "장기나 체스에서 사용되는 레이팅 (Rating)과 같은 방식이야. AI 모델끼리 대결을 시키고, 사람이 '어느 쪽 답변이 더 좋아?'라고 투표하는 거지."

🐹 못치: "아~ 장기처럼 실력이 강한 사람일수록 레이팅이 높다는 거네."

🦜 키나코: "맞아. 그래서 Gemma 4 31B의 추정 ELO 스코어는 약 1452야. 이건 744B나 1T (1조) 파라미터 모델과 거의 대등한 수준이야."

🐹 못치: "진짜냐! 31B가 1T 파라미터랑 맞먹다니, 경차(Light car)가 페라리를 이기고 있는 격이잖아!"

🦜 키나코: "Google 공식 측에서도 '20배 더 큰 모델을 능가한다'라고 표현하고 있어."

🦜 키나코: "다음은 수학 실력. AIME이라는 수학 올림피아드 수준의 문제가 있어."

🐹 못치: "수학 올림피아드? 이름만 들어도 머리가 아픈데……."

🦜 키나코: "AIME은 고등학생 대상의 초고난도 수학 경시 대회로, 대학교수도 고전할 정도의 수준이야. 그 스코어가 전 세대인 Gemma 3에서는 20.8%였거든."

🦜 키나코: "그런데 Gemma 4 31B에서는 89.2%야. 4배 이상의 엄청난 도약이지."

🐹 못치: "20점이 89점이라고!? 시험에서 낙제점 받던 애가 전교 1등이 된 거나 다름없잖아!"

🦜 키나코: "코딩에서도 LiveCodeBench가 80%이고, Codeforces는 2150이야. 상위 1%에 들어가는 실력이지."

🦜 키나코: "Meta의 Llama 4 Scout는 109B나 되지만, Gemma 4 31B가 GPQA와 코딩에서 앞서고 있어."

🐹 못치: "109B를 31B가 이기다니, 3분의 1도 안 되는 사이즈로 이기고 있잖아! 가성비 진짜 좋다!"

🦜 키나코: "더 놀라운 건 단 2.3B 파라미터인 E2B 모델이야. 이게 전 세대인 Gemma 3 27B를 많은 벤치마크 (Benchmark)에서 뛰어넘었어."

🐹 못치: "잠깐만! 2.3B가 27B를 이긴다고? 이건 이제 말이 안 되는데!"

🦜 키나코: "그 비밀은 아키텍처 (Architecture)에 있는데, 그건 다음 섹션에서 자세히 설명할게."

🦜 키나코: "단, 주의할 점도 있어. Redis 창립자인 antirez 씨는 ELO 스코어를 주요 지표로 삼는 것은 오해의 소지가 있다고 비판하고 있어."

🦜 키나코: "ELO는 인간의 선호도에 따라 투표하기 때문에 조작될 가능성도 있거든. 숫자는 대단하지만, 어디까지나 추정치로 받아들여 줘."

🦜 키나코: "아까 '2.3B가 27B를 이기는 비밀은 아키텍처에 있다'고 했지? 여기서 정답을 알려줄게."

🐹 못치: "좋아 좋아, 드디어 수수께끼가 풀리는 건가."

🦜 키나코: "먼저 26B MoE부터 설명할게. Mixture of Experts의 약자로, 128명의 전문가 팀을 상상하면 돼."

🐹 못치: "128명이나 있는데 8명만 움직인다고 했던 그거 말이지?"

🦜 키나코: "맞아. 질문이 들어올 때마다 AI가 '최적의 8명'을 자동으로 선택해서 대응하는 거야. 코딩이라면 기술 전문가, 역사라면 인문학 전문가처럼 말이야."

🐹 못치: "그렇구나! 게으름을 피우는 게 아니라, 그때마다 베스트 멤버를 소집하는 거였네!"

🦜 키나코: "바로 그거야. 그래서 26B 모델은 추론 (Inference) 시에 활성화되는 파라미터가 3.8B뿐이야. 4B 모델과 맞먹는 속도로 작동하지."

🐹 못치: "엣, 6.4배라니, 그렇게나 빨라진다고? 도저히 믿기지 않는데."

🦜 키나코: "정말이야. NVIDIA DGX Spark에서의 실측 결과, 26B MoE의 디코딩 (Decoding) 속도는 31B Dense 모델보다 6.4배 빠르다는 것이 확인되었어."

🐹 못치: "31B의 품질로 4B의 속도라니, 완전 장점만 모아놨잖아! 그게 26B가 '가성비 최강'이라고 불리는 이유구나!"

🦜 키나코: "다음으로 E2B/E4B의 비밀인 PLE를 설명할게. Per-Layer Embeddings의 약자야."

🐹 못치: "또 영어뿐이야... 쉽게 말하면 무슨 뜻이야?"

🦜 키나코: "사전을 상상해봐. 일반적인 AI는 모든 페이지를 항상 펼쳐두고 있어. PLE는 '지금 이 문제에 필요한 페이지 만 펼쳐두는' 방식이야."

🐹 못치: "그래서 겉보기에는 5.1B인데 실효 (Effective) 파라미터는 2.3B가 되는 거구나."

🦜 키나코: "정답. E2B는 임베딩 테이블 (Embedding Table)은 크지만, 실제 계산량은 훨씬 적어. 그래서 가볍고 빠른 거야."

🐹 못치: "잠깐만! 그렇게 똑똑한 메커니즘이 있다면, 왜 지금까지 아무도 안 했던 거야!"

🦜 키나코: "사실 PLE는 이전 세대인 Gemma 3n에서 이미 도입되었던 기술이야. Gemma 4에서 더욱 정교한 형태로 계승된 거지."

🦜 키나코: "저명한 연구자인 Sebastian Raschka는 '아키텍처 (Architecture)는 Gemma 3와 거의 동일하다'고 지적하기도 했어."

🐹 못치: "에이, 그럼 왜 그렇게 성능이 올라간 거야?"

🦜 키나코: "트레이닝 데이터 (Training Data)와 학습 레시피 (Learning Recipe)의 개선이 핵심이야. 좋은 그릇에, 좋은 식재료와 좋은 레시피를 써서 맛있어진 거라고 보면 돼."

🦜 키나코: "자, Gemma 4는 스마트폰에서도 돌아간다고 했지. E2B는 실효 2.3B 규모로, 양자화 (Quantization)를 하면 1.5GB 미만의 메모리로 구동할 수 있어."

🐹 못치: "스마트폰이라니, 그냥 주머니에 넣고 다니는 그거?"

🦜 키나코: "응. Google AI Edge Gallery라는 앱을 설치하기만 하면 돼. 무료로 다운로드할 수 있고, 완전 오프라인 (Offline) 상태에서도 작동해.

🐹 못치: "로컬 (Local)에서 돌아간다는 건, 인터넷이 연결되어 있지 않아도 쓸 수 있다는 뜻이야?"

🦜 키나코: "완전 오프라인으로 작동해. 비행기 모드에서도, 지하철 안에서도, 인터넷이 안 터지는 깊은 산속에서도 쓸 수 있어."

🐹 못치: "비행기 모드에서 돌아간다니 의미가 너무 크다! 비행기 타고 있을 때 쓸 수 있잖아!"

🦜 키나코: "하지만 진짜 중요한 건, 데이터가 전혀 외부로 나가지 않는다는 점이야. 대화 내용도 파일도 전부 스마트폰 안에서만 완결돼."

🐹 못치: "그건 확실히 안심되네. 의사나 돈 문제 같은, 클라우드 (Cloud)로 보내고 싶지 않은 이야기도 할 수 있겠어."

🦜 키나코: "지원 칩셋은 Snapdragon 8 Gen 3 이상 또는 Dimensity 9300 이상이야. 최근 출시된 하이엔드 스마트폰이라면 대부분 대응할 수 있어."

🐹 못치: "엣, 모든 기종에서 다 돌아가는 건 아니야?"

🦜 키나코: "지금은 지원 기종이 한정되어 있지만, Android에서만 이미 1억 4,000만 대 이상에 보급되고 있어. 확산 속도가 굉장히 빨라."

🦜 키나코: "Pixel 11 시리즈에는 2026년 하반기에 Gemini Nano 4가 탑재될 전망인데, 이것이 E2B/E4B의 기반이 될 거야."

🐹 못치: "이전 세대보다 4배 빠르고 전력 소모는 60% 줄었다고 했었나? 스마트폰 AI가 그 정도까지 진화한다면 정말 대단하겠는데!"

🦜 키나코: "용도에 따라 다르겠지만, 스마트폰 외에도 Raspberry Pi 5에서 동작이 확인되어서 로보틱스 (Robotics)나 산업 응용 분야도 시작되고 있어."

🐹 못치: "시각 장애가 있는 사람이 스마트폰을 쓰면 주변 상황을 실시간으로 설명받을 수 있겠네. 그게 오프라인으로 돌아간다는 건 정말 중요해."

🦜 키나코: "바로 그거야. 의료, 금융, 법률처럼 기밀 데이터를 다루는 분야에서 클라우드로 보낼 수 없는 정보를 온디바이스 (On-device)로 처리할 수 있다는 점은 의미가 매우 커."

🐹 못치: "벤치마크부터 아키텍처, 엣지 (Edge)까지 왔는데, 애초에 Google은 왜 이걸 공짜로 뿌리는 거야?"

🦜 키나코: "좋은 질문이야. 겉으로는 'AI 민주화'를 내세우지만, 비즈니스적인 본심을 말해줄게."

🦜 키나코: "Gemma는 로컬 개발의 입구 역할을 해. 하지만 실제 서비스 규모 (Production Scale)로 확장하려면 Vertex AI, Cloud Run, GKE가 필요하거든."

🐹 못치: "그 말은 우리를 GCP (Google Cloud Platform)로 유인하려는 함정 아니냐!!"

🦜 키나코: "함정이 아니라 비즈니스 모델이야. iPhone의 App Store와 같은 구조지. iOS를 널리 퍼뜨려서 생태계 (Ecosystem)로 수익을 창출하는 거야."

🐹 못치: "아~ 하지만 Apple은 iOS를 오픈 소스 (Open Source)로 풀지는 않잖아. Google은 모델의 내부까지 공개하는 거고."

🦜 키나코: "여기에는 또 다른 전략적 이유가 있어. DeepSeek나 Qwen, Kimi 같은 강력한 중국산 모델들에 대항하기 위해서지."

🐹 못치: "성능으로 승부하는 거 아니었어?"

🦜 키나코: "성능도 중요하지만, Nathan Lambert이라는 연구자의 분석이 흥미로워. 라이선스(License)나 출처가 더 중요하다고 하더라고."

🐹 못치: "출처라니... 어느 나라에서 만들었냐는 뜻이야?"

🦜 키나코: "맞아. 기업이나 정부 기관에게 중국제 AI를 실제 서비스에 도입하는 것은 리스크가 있거든. Gemma는 미국제이고 Apache 2.0 라이선스를 따르고 있다는 점이 강점이야."

🦜 키나코: "VentureBeat도 '라이선스 변경이 더 중요할지도 모른다'고 평가했어. 단순한 기술 발표가 아니라 지정학적인 움직임이기도 해."

🐹 못치: "AI 성능 경쟁인 줄 알았는데, 갑자기 국제 정치 이야기가 되네!"

🦜 키나코: "프랑스의 S3NS 같은 주권 클라우드(Sovereign Cloud)나 정부 기관에 대응할 수 있는 체제를 갖추고 있어. Apache 2.0 채택은 그와 세트로 움직이는 거지."

🐹 못치: "하지만 그거, 사용하는 입장에서는 GCP(Google Cloud Platform)로 유인당해도 상관없잖아! 무료로 최강 AI를 쓸 수 있다면!"

🦜 키나코: "그 지점이 절묘해. Google 측은 생태계(Ecosystem)를 확장할 수 있고, 개발자 측은 최고 성능의 모델을 무료로 상업적 이용할 수 있어. 윈윈(Win-win) 설계지."

🐹 못치: "Android에도 전개하고 있으니까, Google 입장에서는 모바일 생태계 전체를 강화할 수 있겠네."

🦜 키나코: "정확해. Gemma는 모델을 배포하는 것이 아니라, Google의 인프라와 생태계로 들어오는 입구를 배포하는 거야."

🐹 못치: "심오하네. 그럼 마지막으로, 결국 Gemma 4가 우리에게 무엇을 변화시키는지 요약해 줄 수 있어?"

🦜 키나코: "그럼 오늘의 요약. Gemma 4의 포인트는 세 가지야."

🦜 키나코: "첫째, Apache 2.0 라이선스로 상업적 이용이 완전히 자유로워. 제한 없이 제품에 포함할 수 있지."

🦜 키나코: "둘째, 높은 성능. Arena AI에서 오픈 모델 세계 3위를 기록했고, 수학 올림피아드급인 AIME에서 89.2%라는 차원이 다른 점수를 보여줬어."

🦜 키나코: "셋째, 엣지(Edge) 대응. 스마트폰부터 Raspberry Pi까지 완전 오프라인으로 동작해. 데이터가 외부로 나가지 않지."

🐹 못치: "커뮤니티도 난리였다며? 발표 후 3일 만에 120만 다운로드를 기록했다고 들었는데."

🦜 키나코: "'모든 걸 멈추고 ollama run gemma4를 실행해라'라는 게시물에 좋아요가 2,400개나 달리고,"

🦜 키나코: "llama.cpp의 제작자가 M2 Ultra에서의 데모를 X(구 트위터)에 올리기도 했지."

🐹 못치: "일본어 성능은 어땠어?"

🦜 키나코: "Classmethod의 DGX Spark 실측 결과, JCommonsenseQA에서 97.9%를 기록했어. 일본어 상식 문제에서 거의 만점에 가까운 점수야."

🐹 못치: "97.9%라니 대단하지 않아?! 거의 만점이잖아!"

🦜 키나코: "다만 과제도 있어. 256K 풀 컨텍스트(Full Context)를 사용하면 31B 모델에서 추가로 22GB의 VRAM이 필요해. 그게 KV 캐시(KV Cache) 문제야."

🐹 못치: "엣, 긴 문장 처리가 무겁다는 뜻이야?"

🦜 키나코: "긴 컨텍스트를 전부 사용하려면 주의가 필요해. 일반적인 사용법이라면 전혀 문제없고. 테스트해 보고 싶다면 ollama로 한 번에 실행할 수 있어."

🐹 못치: "명령어 한 줄로 된다면, 정말 좋은 시대가 왔구나~!"

🦜 키나코: "Apache 2.0으로 상업적 이용 가능, 클라우드든 단말기든 동작, 명령어 한 줄로 테스트 가능. AI의 진입 장벽이 한 단계 낮아진 순간이야."

🦜 키나코: "오늘은 Gemma 4의 전체적인 모습을 해설했어. 관심 있는 분들은 꼭 직접 테스트해 봐. 끝까지 봐줘서 고마워."

키나코·못치의 테크 심층 분석에서는 AI/LLM을 중심으로 한 테크 전반을 햄스터(🐹 못치)와 세키사이잉코(🦜 키나코)의 대화로 즐겁게 해설하고 있습니다.

▶️ 영상으로 보기 → Gemma 4가 완전 무료로 상업적 이용이 가능한 이유 —— Google의 오픈 전략 해설

👍 이 글이 도움이 되었다면 LGTM(좋아요)이나 북마크를 해주시면 큰 힘이 됩니다!

📺 채널 구독은 여기로 → 키나코·못치의 테크 심층 분석

🔗 다른 해설 영상 보기 → 키나코·못치의 테크 심층 분석 영상 목록

Gemma 4가 완전 무료로 상업적 이용이 가능한 이유 —— Google의 오픈 전략 해설

요약

핵심 포인트

댓글