본문으로 건너뛰기

© 2026 Molayo

GH Trending중요릴리즈2026. 04. 24. 13:19

google-gemma/cookbook

요약

본 문서는 Google DeepMind가 개발한 경량의 생성형 AI 오픈 모델, Gemma 패밀리의 종합적인 안내서입니다. Gemma는 Gemini 모델과 동일한 연구 기술을 기반으로 하며, 다양한 사용 사례에 맞춰 여러 버전과 파생 모델(Variants)을 제공합니다. 주요 모델로는 텍스트 생성에 최적화된 기본 Gemma부터, 코딩 특화 CodeGemma, 의료 분야에 강점을 가진 MedGemma, 그리고 이미지 분석이 가능한 PaliGemma 등이 있습니다. 개발자들은 이 가이드북을 통해 각 모델의 특징과 활용 방법을 파악하고,

핵심 포인트

  • **Gemma 3**는 1B부터 27B까지 다양한 파라미터 크기를 가지며, 긴 컨텍스트 창(Longer context window)과 텍스트 및 이미지 입력을 처리할 수 있습니다.
  • **MedGemma**는 의료 텍스트와 이미지를 이해하는 데 특화된 모델로, 4B 멀티모달 버전과 27B 텍스트 전용 버전이 제공되어 헬스케어 AI 개발을 가속화합니다.
  • **PaliGemma**는 Vision Language Model (VLM)로서 이미지에 대한 심층 분석 및 유용한 통찰력을 제공하는 데 사용됩니다.
  • **CodeGemma**와 **FunctionGemma** 등 다양한 변형 모델(Variants)은 각각 코딩 작업, 함수 호출 등에 맞게 파인튜닝되어 특정 도메인에서의 성능을 극대화합니다.

Google Gemma를 위한 가이드 및 예제 모음집입니다.

면책 조항(Disclaimer): Gemma는 Google DeepMind가 개발한 개발자 중심의 모델군(family of developer-focused models)입니다. 이 쿡북은 Google Gemma를 위한 가이드와 예제의 집합체입니다. Gemma는 오픈 모델(open model)이므로, 본 쿡북의 예제를 기반으로 구축할 때 환각 현상(hallucinate)이 발생할 수 있음을 유념해 주십시오.

  • Tutorials: Gemma 모델 및 변형(variants)에 대한 최신 테스트 노트북입니다.
  • Apps: 풀스택 데모(Full-stack demos)와 복잡한 엔드투엔드 사용 사례(complex end-to-end use cases)를 제공합니다.
  • Experiments: TxGemma 및 MedGemma를 포함하여 연구 중심의 모델 노트북입니다.
  • Responsible: 책임감 있는 AI 개발을 위한 노트북입니다.
  • Docs: 핵심 문서, 기능(capabilities), 기술 가이드입니다.
  • Archive: 모든 이전 노트북과 역사적 예제들입니다.

Gemma는 Gemini 모델을 생성하는 데 사용된 동일한 연구 및 기술로 구축된 경량의 생성형 인공지능(AI) 오픈 모델군입니다. Gemma 모델군은 다음을 포함합니다:

  • Gemma
    Gemma 모델군의 핵심 모델입니다.

    • Gemma: 다양한 텍스트 생성 작업에 사용될 수 있으며 특정 사용 사례를 위해 추가로 미세 조정(tuned)할 수 있습니다.
    • Gemma 2: 성능이 더 높고 효율적이며, 2B, 9B, 27B 파라미터 크기로 제공됩니다.
    • Gemma 3: 더 긴 컨텍스트 창(context window)과 텍스트 및 이미지 입력을 처리할 수 있으며, 1B, 4B, 12B, 27B 파라미터 크기로 제공됩니다.
    • Gemma 3n: 저자원 장치(low-resource devices)에서 효율적인 실행을 위해 설계되었습니다. 텍스트, 이미지, 비디오 및 오디오 입력을 처리하며, E2B 및 E4B 파라미터 크기로 제공됩니다.
    • Gemma 4: 추론(reasoning), 에이전트 워크플로우(agentic workflows), 코딩, 멀티모달 이해에 적합하며, E2B, E4B, 26B A4B, 및 31B 파라미터 크기로 제공됩니다.
  • Gemma 변형 (Gemma variants)

    • CodeGemma: 다양한 코딩 작업에 대해 미세 조정되었습니다.
    • DataGemma: AI 환각 현상(AI hallucinations)을 해결하기 위해 Data Commons를 사용하는 데 미세 조정되었습니다.
    • FunctionGemma: 함수 호출(function calling)을 위해 Gemma 3 270M IT 체크포인트에서 미세 조정되었습니다.
    • MedGemma: MedGemma 컬렉션은 Gemma 3을 기반으로 구축된 Google의 가장 강력한 의료 텍스트 및 이미지 이해 오픈 모델들을 포함합니다. 개발자는 MedGemma를 사용하여 헬스케어 기반 AI 애플리케이션 구축을 가속화할 수 있습니다. MedGemma는 두 가지 변형(variants)으로 제공됩니다: 4B 멀티모달 버전과 27B 텍스트 전용 버전입니다.
    • PaliGemma: 이미지에 대한 심층 분석을 수행하고 유용한 통찰력을 제공하는 비전 언어 모델(Vision Language Model, VLM)입니다.
    • PaliGemma 2: Gemma 2 모델의 기능을 통합한 VLM입니다.
    • RecurrentGemma: Griffin에 기반합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 GitHub Trending Jupyter Notebook (weekly)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
8

댓글

0