본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 20. 11:12

Gemma 4가 완전 무료로 상업적 이용이 가능한 이유 —— Google의 오픈 전략 해설

요약

Google이 발표한 새로운 오픈 소스 AI 모델 Gemma 4에 대한 해설입니다. Apache 2.0 라이선스를 채택하여 상업적 이용이 완전히 자유로우며, 스마트폰부터 클라우드까지 다양한 환경에 최적화된 4종의 모델 라인업을 제공합니다.

핵심 포인트

  • Apache 2.0 라이선스 적용으로 완전 무료 상업적 이용 가능
  • 스마트폰 구동이 가능한 1.5GB 미만의 초경량 모델 포함
  • E2B, E4B, 26B, 31B 등 용도별 4종 모델 라인업 구성
  • PLE 기술 및 전문가 분업 구조를 통한 높은 효율성 확보

🐹 못치: "있잖아 키나코, 요즘 AI는 다 유료인 것 같아."

🐹 못치: "월정액이 얼마라느니, API 요금이 어떻다느니. 간식비가 먼저 다 나갈 것 같아."

🐹 못치: "주인이 돌아오기 전에 뭔가 돈을 벌 수 있는 방법 없을까~"

🦜 키나코: "못치, 타이밍 좋네. 사실 아주 최근에 완전 무료로 사용할 수 있는 최강급 AI가 등장했어."

🐹 못치: "에, 공짜!? 진짜야!? 그거 엄청 궁금한데!"

🦜 키나코: "Google이 2026년 4월 2일에 발표한, Gemma 4라는 오픈 소스 (Open Source) AI 모델이야."

🐹 못치: "젬마? Google이 만든 AI야? 근데 Google AI는 Gemini 아니었어?"

🦜 키나코: "좋은 질문이야. Gemini는 유료 서비스용 모델이고, Gemma는 거기서 탄생한 무료 버전이야."

🦜 키나코: "게다가 이번에는 상업적 이용도 완전히 자유로운 라이선스 (License)로 공개되었어. 이건 역대 최초야."

🐹 못치: "상업적 이용도 공짜!? 돈 버는 데 써도 된다는 거야? 대박인데!"

🦜 키나코: "응. 게다가 성능이 엄청나서, 세계 오픈 AI 랭킹에서 3위에 올라 있어."

🐹 못치: "세계 3위 AI를 공짜로 쓸 수 있다니, 좀 이해가 안 가는데."

🦜 키나코: "게다가 말이야, 가장 작은 모델은 스마트폰에서도 돌아가. 겨우 1.5GB 미만으로."

🐹 못치: "스마트폰에서 최강 AI를!? 진짜 궁금해! 오늘 그 Gemma 4라는 걸 좀 알려줘!"

🐹 못치: "자자, 오늘의 테마는 뭐야?"

🦜 키나코: "오늘은 Google이 발표한 새로운 오픈 소스 (Open Source) AI 모델, Gemma 4에 대해 해설할게."

🐹 못치: "Gemma? 젬마? 보석 같은 이름이네."

🦜 키나코: "이탈리아어로 '보석'이라는 의미가 있어. 2026년 4월 2일에 막 발표되었지."

🦜 키나코: "공식적인 홍보 문구가 '바이트당 가장 고성능인 오픈 모델'이야."

🐹 못치: "호오, 뭔가 자신만만하네. 그래서 뭐가 그렇게 대단한 거야?"

🦜 키나코: "가장 큰 특징은 4개의 모델이 세트로 공개되었다는 점이야."

🐹 못치: "4종류? 그렇게 많이 내놓아서 어쩌려고?"

🦜 키나코: "스마트폰부터 클라우드 (Cloud)까지, 사용하는 장소에 맞춰 선택할 수 있게 되어 있어."

🦜 키나코: "먼저 가장 작은 E2B. 실효 파라미터 (Effective Parameter) 수가 2.3B로, 스마트폰에서도 돌아가."

🐹 못치: "에! 스마트폰에서 AI가 돌아간다고? 메모리 같은 건 괜찮은 거야?"

🦜 키나코: "1.5GB 미만으로 동작해. 사진 2~3장 정도의 용량이야."

🐹 못치: "사진 2~3장 분량으로 똑똑한 AI가 들어간다니, 대단하네."

🦜 키나코: "다음은 E4B. 실효 4.5B 파라미터로, 텍스트도 이미지도 음성도 처리할 수 있어."

🐹 못치: "잠깐만. E가 무슨 약자야?"

🦜 키나코: "Effective의 첫 글자로 '실효'라는 의미야. PLE라는 기술로 효율적으로 구동할 수 있어."

🐹 못치: "그럼 나머지 2개는?"

🦜 키나코: "3번째는 26B. 전부 128개의 전문가를 내장하고 있어서, 추론 (Inference) 시에는 8개만 작동하는 구조야."

🐹 못치: "128명이나 있는데 8명만 일한다고? 완전 게으른 거 아냐!"

🦜 키나코: "게으른 게 아니라 분업이야. 그리고 가장 큰 31B는 모든 파라미터가 항상 가동되는 최강 모델이야."

🦜 키나코: "자, 여기서부터가 Gemma 4에서 가장 큰 변화일지도 몰라."

🐹 못치: "가장 큰 변화? 모델의 성능 같은 게 아니라?"

🦜 키나코: "라이선스 (License)야. Gemma 4는 Gemma 시리즈 중 처음으로 Apache 2.0 라이선스로 공개되었어."

🐹 못치: "아파치? 뭔가 멋진 이름인데, 그게 왜 대단한 거야?"

🦜 키나코: "간단히 말하면, 누구나 완전히 무료로 사업에 사용할 수 있다는 뜻이야."

🐹 못치: "에, 완전 공짜로 사업에 쓸 수 있다고!?"

🦜 키나코: "응. 상업적 이용, 복제, 개작, 배포 모두 OK이고, 게다가 취소할 수 없는 권리로 부여돼."

🦜 키나코: "로열티 (Royalty)도 필요 없고, 사용자 수 제한도 없어."

🐹 못치: "잠깐만. 이전 Gemma는 그렇지 않았어?"

🦜 키나코: "Gemma 1부터 3까지는 독자적인 Gemma Terms of Use라는 라이선스였어."

🦜 키나코: "상업적 이용이나 재배포에 여러 제한이 있어서, 기업의 법무 부서가 심사에 시간을 많이 쓰는 경우도 많았지."

🐹 못치: "헤에. 그럼 이번 Gemma 4에서는 그 번거로운 것들이 전부 없어졌다는 거야?"

🦜 키나코: "맞아. 자신의 데이터로 파인튜닝 (Fine-tuning)한 가중치도 자유롭게 상업적으로 배포할 수 있어."

🐹 못치: "대박이다! 그럼 Meta의 Llama도 비슷한 느낌이야?"

🦜 키나코: "사실 Llama 4에는 아직 제한이 있어. 월간 활성 사용자(MAU)가 7억 명을 넘으면 별도의 라이선스가 필요하고,"

🦜 키나코: "Llama의 출력을 사용해서 경쟁 모델을 학습시키는 것도 금지되어 있어."

🐹 못치: "진짜냐! 그럼 Google 쪽이 훨씬 통이 크네!"

🦜 키나코: "Google Open Source 블로그에서도 AI의 미래에는 협력적인 접근 방식이 필요하다고 표명하고 있어."

🦜 키나코: "제한적인 장벽 없이 개발자 생태계 (Developer Ecosystem)를 강화하고 싶다는 사상의 전환이야."

🐹 못치: "그럼 내 채널도 Gemma로 돈 벌 수 있는 거 아냐?"

🦜 키나코: "못치, 일단 모델을 돌릴 수 있게 된 다음에 말해."

🐹 못치: "윽, 그 말은 하지 말아줘."

🦜 키나코: "자, 그럼 이제부터 Gemma 4의 실력을 숫자로 확인해 보자."

🦜 키나코: "Gemma 4의 31B 모델은 Arena AI 텍스트 리더보드 (Leaderboard)에서 오픈 모델 세계 3위를 차지했어."

🐹 못치: "리더보드? ELO? 어디서 들어본 것 같은데……."

🦜 키나코: "장기나 체스에서 사용되는 레이팅 (Rating)과 같은 방식이야. AI 모델끼리 대결을 시키고, 사람이 '어느 쪽 답변이 더 좋아?'라고 투표하는 거지."

🐹 못치: "아~ 장기처럼 실력이 강한 사람일수록 레이팅이 높다는 거네."

🦜 키나코: "맞아. 그래서 Gemma 4 31B의 추정 ELO 스코어는 약 1452야. 이건 744B나 1T (1조) 파라미터 모델과 거의 대등한 수준이야."

🐹 못치: "진짜냐! 31B가 1T 파라미터랑 맞먹다니, 경차(Light car)가 페라리를 이기고 있는 격이잖아!"

🦜 키나코: "Google 공식 측에서도 '20배 더 큰 모델을 능가한다'라고 표현하고 있어."

🦜 키나코: "다음은 수학 실력. AIME이라는 수학 올림피아드 수준의 문제가 있어."

🐹 못치: "수학 올림피아드? 이름만 들어도 머리가 아픈데……."

🦜 키나코: "AIME은 고등학생 대상의 초고난도 수학 경시 대회로, 대학교수도 고전할 정도의 수준이야. 그 스코어가 전 세대인 Gemma 3에서는 20.8%였거든."

🦜 키나코: "그런데 Gemma 4 31B에서는 89.2%야. 4배 이상의 엄청난 도약이지."

🐹 못치: "20점이 89점이라고!? 시험에서 낙제점 받던 애가 전교 1등이 된 거나 다름없잖아!"

🦜 키나코: "코딩에서도 LiveCodeBench가 80%이고, Codeforces는 2150이야. 상위 1%에 들어가는 실력이지."

🦜 키나코: "Meta의 Llama 4 Scout는 109B나 되지만, Gemma 4 31B가 GPQA와 코딩에서 앞서고 있어."

🐹 못치: "109B를 31B가 이기다니, 3분의 1도 안 되는 사이즈로 이기고 있잖아! 가성비 진짜 좋다!"

🦜 키나코: "더 놀라운 건 단 2.3B 파라미터인 E2B 모델이야. 이게 전 세대인 Gemma 3 27B를 많은 벤치마크 (Benchmark)에서 뛰어넘었어."

🐹 못치: "잠깐만! 2.3B가 27B를 이긴다고? 이건 이제 말이 안 되는데!"

🦜 키나코: "그 비밀은 아키텍처 (Architecture)에 있는데, 그건 다음 섹션에서 자세히 설명할게."

🦜 키나코: "단, 주의할 점도 있어. Redis 창립자인 antirez 씨는 ELO 스코어를 주요 지표로 삼는 것은 오해의 소지가 있다고 비판하고 있어."

🦜 키나코: "ELO는 인간의 선호도에 따라 투표하기 때문에 조작될 가능성도 있거든. 숫자는 대단하지만, 어디까지나 추정치로 받아들여 줘."

🦜 키나코: "아까 '2.3B가 27B를 이기는 비밀은 아키텍처에 있다'고 했지? 여기서 정답을 알려줄게."

🐹 못치: "좋아 좋아, 드디어 수수께끼가 풀리는 건가."

🦜 키나코: "먼저 26B MoE부터 설명할게. Mixture of Experts의 약자로, 128명의 전문가 팀을 상상하면 돼."

🐹 못치: "128명이나 있는데 8명만 움직인다고 했던 그거 말이지?"

🦜 키나코: "맞아. 질문이 들어올 때마다 AI가 '최적의 8명'을 자동으로 선택해서 대응하는 거야. 코딩이라면 기술 전문가, 역사라면 인문학 전문가처럼 말이야."

🐹 못치: "그렇구나! 게으름을 피우는 게 아니라, 그때마다 베스트 멤버를 소집하는 거였네!"

🦜 키나코: "바로 그거야. 그래서 26B 모델은 추론 (Inference) 시에 활성화되는 파라미터가 3.8B뿐이야. 4B 모델과 맞먹는 속도로 작동하지."

🐹 못치: "엣, 6.4배라니, 그렇게나 빨라진다고? 도저히 믿기지 않는데."

🦜 키나코: "정말이야. NVIDIA DGX Spark에서의 실측 결과, 26B MoE의 디코딩 (Decoding) 속도는 31B Dense 모델보다 6.4배 빠르다는 것이 확인되었어."

🐹 못치: "31B의 품질로 4B의 속도라니, 완전 장점만 모아놨잖아! 그게 26B가 '가성비 최강'이라고 불리는 이유구나!"

🦜 키나코: "다음으로 E2B/E4B의 비밀인 PLE를 설명할게. Per-Layer Embeddings의 약자야."

🐹 못치: "또 영어뿐이야... 쉽게 말하면 무슨 뜻이야?"

🦜 키나코: "사전을 상상해봐. 일반적인 AI는 모든 페이지를 항상 펼쳐두고 있어. PLE는 '지금 이 문제에 필요한 페이지 만 펼쳐두는' 방식이야."

🐹 못치: "그래서 겉보기에는 5.1B인데 실효 (Effective) 파라미터는 2.3B가 되는 거구나."

🦜 키나코: "정답. E2B는 임베딩 테이블 (Embedding Table)은 크지만, 실제 계산량은 훨씬 적어. 그래서 가볍고 빠른 거야."

🐹 못치: "잠깐만! 그렇게 똑똑한 메커니즘이 있다면, 왜 지금까지 아무도 안 했던 거야!"

🦜 키나코: "사실 PLE는 이전 세대인 Gemma 3n에서 이미 도입되었던 기술이야. Gemma 4에서 더욱 정교한 형태로 계승된 거지."

🦜 키나코: "저명한 연구자인 Sebastian Raschka는 '아키텍처 (Architecture)는 Gemma 3와 거의 동일하다'고 지적하기도 했어."

🐹 못치: "에이, 그럼 왜 그렇게 성능이 올라간 거야?"

🦜 키나코: "트레이닝 데이터 (Training Data)와 학습 레시피 (Learning Recipe)의 개선이 핵심이야. 좋은 그릇에, 좋은 식재료와 좋은 레시피를 써서 맛있어진 거라고 보면 돼."

🦜 키나코: "자, Gemma 4는 스마트폰에서도 돌아간다고 했지. E2B는 실효 2.3B 규모로, 양자화 (Quantization)를 하면 1.5GB 미만의 메모리로 구동할 수 있어."

🐹 못치: "스마트폰이라니, 그냥 주머니에 넣고 다니는 그거?"

🦜 키나코: "응. Google AI Edge Gallery라는 앱을 설치하기만 하면 돼. 무료로 다운로드할 수 있고, 완전 오프라인 (Offline) 상태에서도 작동해.

🐹 못치: "로컬 (Local)에서 돌아간다는 건, 인터넷이 연결되어 있지 않아도 쓸 수 있다는 뜻이야?"

🦜 키나코: "완전 오프라인으로 작동해. 비행기 모드에서도, 지하철 안에서도, 인터넷이 안 터지는 깊은 산속에서도 쓸 수 있어."

🐹 못치: "비행기 모드에서 돌아간다니 의미가 너무 크다! 비행기 타고 있을 때 쓸 수 있잖아!"

🦜 키나코: "하지만 진짜 중요한 건, 데이터가 전혀 외부로 나가지 않는다는 점이야. 대화 내용도 파일도 전부 스마트폰 안에서만 완결돼."

🐹 못치: "그건 확실히 안심되네. 의사나 돈 문제 같은, 클라우드 (Cloud)로 보내고 싶지 않은 이야기도 할 수 있겠어."

🦜 키나코: "지원 칩셋은 Snapdragon 8 Gen 3 이상 또는 Dimensity 9300 이상이야. 최근 출시된 하이엔드 스마트폰이라면 대부분 대응할 수 있어."

🐹 못치: "엣, 모든 기종에서 다 돌아가는 건 아니야?"

🦜 키나코: "지금은 지원 기종이 한정되어 있지만, Android에서만 이미 1억 4,000만 대 이상에 보급되고 있어. 확산 속도가 굉장히 빨라."

🦜 키나코: "Pixel 11 시리즈에는 2026년 하반기에 Gemini Nano 4가 탑재될 전망인데, 이것이 E2B/E4B의 기반이 될 거야."

🐹 못치: "이전 세대보다 4배 빠르고 전력 소모는 60% 줄었다고 했었나? 스마트폰 AI가 그 정도까지 진화한다면 정말 대단하겠는데!"

🦜 키나코: "용도에 따라 다르겠지만, 스마트폰 외에도 Raspberry Pi 5에서 동작이 확인되어서 로보틱스 (Robotics)나 산업 응용 분야도 시작되고 있어."

🐹 못치: "시각 장애가 있는 사람이 스마트폰을 쓰면 주변 상황을 실시간으로 설명받을 수 있겠네. 그게 오프라인으로 돌아간다는 건 정말 중요해."

🦜 키나코: "바로 그거야. 의료, 금융, 법률처럼 기밀 데이터를 다루는 분야에서 클라우드로 보낼 수 없는 정보를 온디바이스 (On-device)로 처리할 수 있다는 점은 의미가 매우 커."

🐹 못치: "벤치마크부터 아키텍처, 엣지 (Edge)까지 왔는데, 애초에 Google은 왜 이걸 공짜로 뿌리는 거야?"

🦜 키나코: "좋은 질문이야. 겉으로는 'AI 민주화'를 내세우지만, 비즈니스적인 본심을 말해줄게."

🦜 키나코: "Gemma는 로컬 개발의 입구 역할을 해. 하지만 실제 서비스 규모 (Production Scale)로 확장하려면 Vertex AI, Cloud Run, GKE가 필요하거든."

🐹 못치: "그 말은 우리를 GCP (Google Cloud Platform)로 유인하려는 함정 아니냐!!"

🦜 키나코: "함정이 아니라 비즈니스 모델이야. iPhone의 App Store와 같은 구조지. iOS를 널리 퍼뜨려서 생태계 (Ecosystem)로 수익을 창출하는 거야."

🐹 못치: "아~ 하지만 Apple은 iOS를 오픈 소스 (Open Source)로 풀지는 않잖아. Google은 모델의 내부까지 공개하는 거고."

🦜 키나코: "여기에는 또 다른 전략적 이유가 있어. DeepSeek나 Qwen, Kimi 같은 강력한 중국산 모델들에 대항하기 위해서지."

🐹 못치: "성능으로 승부하는 거 아니었어?"

🦜 키나코: "성능도 중요하지만, Nathan Lambert이라는 연구자의 분석이 흥미로워. 라이선스(License)나 출처가 더 중요하다고 하더라고."

🐹 못치: "출처라니... 어느 나라에서 만들었냐는 뜻이야?"

🦜 키나코: "맞아. 기업이나 정부 기관에게 중국제 AI를 실제 서비스에 도입하는 것은 리스크가 있거든. Gemma는 미국제이고 Apache 2.0 라이선스를 따르고 있다는 점이 강점이야."

🦜 키나코: "VentureBeat도 '라이선스 변경이 더 중요할지도 모른다'고 평가했어. 단순한 기술 발표가 아니라 지정학적인 움직임이기도 해."

🐹 못치: "AI 성능 경쟁인 줄 알았는데, 갑자기 국제 정치 이야기가 되네!"

🦜 키나코: "프랑스의 S3NS 같은 주권 클라우드(Sovereign Cloud)나 정부 기관에 대응할 수 있는 체제를 갖추고 있어. Apache 2.0 채택은 그와 세트로 움직이는 거지."

🐹 못치: "하지만 그거, 사용하는 입장에서는 GCP(Google Cloud Platform)로 유인당해도 상관없잖아! 무료로 최강 AI를 쓸 수 있다면!"

🦜 키나코: "그 지점이 절묘해. Google 측은 생태계(Ecosystem)를 확장할 수 있고, 개발자 측은 최고 성능의 모델을 무료로 상업적 이용할 수 있어. 윈윈(Win-win) 설계지."

🐹 못치: "Android에도 전개하고 있으니까, Google 입장에서는 모바일 생태계 전체를 강화할 수 있겠네."

🦜 키나코: "정확해. Gemma는 모델을 배포하는 것이 아니라, Google의 인프라와 생태계로 들어오는 입구를 배포하는 거야."

🐹 못치: "심오하네. 그럼 마지막으로, 결국 Gemma 4가 우리에게 무엇을 변화시키는지 요약해 줄 수 있어?"

🦜 키나코: "그럼 오늘의 요약. Gemma 4의 포인트는 세 가지야."

🦜 키나코: "첫째, Apache 2.0 라이선스로 상업적 이용이 완전히 자유로워. 제한 없이 제품에 포함할 수 있지."

🦜 키나코: "둘째, 높은 성능. Arena AI에서 오픈 모델 세계 3위를 기록했고, 수학 올림피아드급인 AIME에서 89.2%라는 차원이 다른 점수를 보여줬어."

🦜 키나코: "셋째, 엣지(Edge) 대응. 스마트폰부터 Raspberry Pi까지 완전 오프라인으로 동작해. 데이터가 외부로 나가지 않지."

🐹 못치: "커뮤니티도 난리였다며? 발표 후 3일 만에 120만 다운로드를 기록했다고 들었는데."

🦜 키나코: "'모든 걸 멈추고 ollama run gemma4를 실행해라'라는 게시물에 좋아요가 2,400개나 달리고,"

🦜 키나코: "llama.cpp의 제작자가 M2 Ultra에서의 데모를 X(구 트위터)에 올리기도 했지."

🐹 못치: "일본어 성능은 어땠어?"

🦜 키나코: "Classmethod의 DGX Spark 실측 결과, JCommonsenseQA에서 97.9%를 기록했어. 일본어 상식 문제에서 거의 만점에 가까운 점수야."

🐹 못치: "97.9%라니 대단하지 않아?! 거의 만점이잖아!"

🦜 키나코: "다만 과제도 있어. 256K 풀 컨텍스트(Full Context)를 사용하면 31B 모델에서 추가로 22GB의 VRAM이 필요해. 그게 KV 캐시(KV Cache) 문제야."

🐹 못치: "엣, 긴 문장 처리가 무겁다는 뜻이야?"

🦜 키나코: "긴 컨텍스트를 전부 사용하려면 주의가 필요해. 일반적인 사용법이라면 전혀 문제없고. 테스트해 보고 싶다면 ollama로 한 번에 실행할 수 있어."

🐹 못치: "명령어 한 줄로 된다면, 정말 좋은 시대가 왔구나~!"

🦜 키나코: "Apache 2.0으로 상업적 이용 가능, 클라우드든 단말기든 동작, 명령어 한 줄로 테스트 가능. AI의 진입 장벽이 한 단계 낮아진 순간이야."

🦜 키나코: "오늘은 Gemma 4의 전체적인 모습을 해설했어. 관심 있는 분들은 꼭 직접 테스트해 봐. 끝까지 봐줘서 고마워."

키나코·못치의 테크 심층 분석에서는 AI/LLM을 중심으로 한 테크 전반을 햄스터(🐹 못치)와 세키사이잉코(🦜 키나코)의 대화로 즐겁게 해설하고 있습니다.

▶️ 영상으로 보기 → Gemma 4가 완전 무료로 상업적 이용이 가능한 이유 —— Google의 오픈 전략 해설

👍 이 글이 도움이 되었다면 LGTM(좋아요)이나 북마크를 해주시면 큰 힘이 됩니다!

📺 채널 구독은 여기로 → 키나코·못치의 테크 심층 분석

🔗 다른 해설 영상 보기 → 키나코·못치의 테크 심층 분석 영상 목록

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0