본문으로 건너뛰기

© 2026 Molayo

GH Trending릴리즈2026. 05. 13. 02:36

google-gemini/cookbook

요약

본 문서는 Google의 최신 AI 모델인 Gemini API를 활용하여 다양한 기능을 구현할 수 있는 포괄적인 학습 리소스(쿠킹북)를 소개합니다. 사용자는 기본적인 시작 가이드부터 웹훅, 배치 처리, 그리고 고급 기능인 이미지 생성(Nano-Banana 2/Pro), 음악 생성(Lyria 3), 그리고 검색 기반 답변 접지(Grounding) 등 최신 기능을 단계별로 학습할 수 있습니다. 특히, 코드 실행, 브라우저 연동, 비디오 및 애니메이션 스토리 생성 등 여러 API를 결합한 엔드투엔드 애플리케이션 구축 방법을 제시하여 Gemini의 강력한 활용 범위를 보여줍니다.

핵심 포인트

  • Gemini API는 기본적인 프롬프팅부터 멀티모달 입력 처리까지 포괄적인 학습 경로(쿠킹북)를 제공합니다.
  • 최신 기능으로는 Nano-Banana 2/Pro를 통한 고품질 이미지 생성, Lyria 3을 이용한 음악 생성, 그리고 Google Search 등 다양한 출처를 활용한 답변 접지(Grounding)가 포함됩니다.
  • 단순 API 호출을 넘어, 코드 실행, 웹훅, 배치 처리, 브라우저 연동 등을 결합하여 복잡하고 실제 작동하는 엔드투엔드 애플리케이션을 구축할 수 있습니다.
  • 사용자는 Google AI Studio에서 API 키를 발급받고, 인증 및 기본 튜토리얼부터 시작하여 점진적으로 기능을 확장해 나가는 것이 권장됩니다.

이 쿠킹북은 Gemini API를 사용하는 구조화된 학습 경로를 제공하며, 실습 튜토리얼과 실제 예제에 중점을 두고 있습니다.

전체 API 문서는 ai.google.dev를 방문해 주세요.

Gemma의 빠른 시작 및 예제는 Gemma cookbook을 확인하세요.

Gemini 3: 최신 세대에 대한 가장 최근 업데이트는 마이그레이션 가이드가 포함된 Get Started와 thinking guides를 확인해 주십시오.

🍌 Nano-Banana 2: 최신 이미지 생성 모델인 Nano-Banana 2로 즐거움을 느껴보세요. 여기에서 512px, thinking, search 및 image grounding과 수많은 예제와 함께 시작할 수 있습니다!

  • Webhooks: Webhooks quickstart를 통해 배치 작업(batch jobs) 및 비디오 생성과 같은 비동기 작업에 대한 실시간 알림을 받으세요. -
    Inference tiers: Inference tiers 가이드에서 Priority 및 Flex 티어를 사용하는 방법을 배워 속도, 비용, 신뢰성 간의 균형을 맞추는 데 도움을 받으세요. -
    🎶 Lyria 3: 음악 구조에 대한 완벽한 제어와 더 많은 기능을 통해 아이디어를 노래로 변환하세요! -
    🍌 Nano-Banana 2 & Pro: Gemini의 네이티브 이미지 생성 기능을 사용하여 높은 일관성으로 이미지를 편집하거나 시각적인 이야기를 생성할 수 있습니다. 고속을 경험하려면 Nano-Banana 2를, 4K 품질을 원하면 Nano-Banana Pro를 사용해 보세요. 둘 다 이제 thinking 및 search grounding과 함께 제공됩니다! -
    File Search: 여러분의 파일에 생성을 접지(ground)하는 방법을 알아보세요.

  • 최근 추가된 가이드:

  • Grounding: Google Search부터 YouTube 및 URL, 그리고 새로운 Maps grounding 도구까지 다양한 도구를 사용하여 Gemini의 답변을 접지(ground)하는 방법을 알아보세요.

  • Batch API: Batch API를 사용하여 대량의 비실시간 요청을 모델로 전송하고 최대 90% 할인을 받으세요.

  • 로그 및 데이터셋: Batch API를 사용하여 수집한 로그를 처리하고 평가하세요.

  • Grounding: Google Search부터 YouTube 및 URL, 그리고 새로운 도구까지 다양한 도구를 사용하여 Gemini의 답변을 접지(ground)하는 방법을 알아보세요.

The quickstarts 섹션에는 Gemini를 시작하고 특정 기능에 대해 학습할 수 있는 단계별 튜토리얼이 포함되어 있습니다.

시작하려면 다음이 필요합니다:

  • Google 계정.
  • API 키 (Google AI Studio에서 생성).

다음부터 시작하는 것을 권장합니다:

  • 인증(Authentication): 액세스를 위해 API 키를 설정하세요.
    시작하기(Get started): 기본 프롬프팅 및 멀티모달 입력을 다루는 Gemini 모델과 Gemini API로 시작해 보세요.

그런 다음, 다른 quickstarts 튜토리얼을 탐색하여 개별 기능에 대해 학습하세요:

  • Live API를 사용하여 시작하기 : 이 포괄적인 개요를 통해 라이브 API의 기능을 시작해 보세요.
  • Veo로 시작하기 : 비디오 생성 기능을 시작해 보세요.
  • Imagen 및 네이티브 이미지 생성으로 시작하기 : 이미지 생성 기능을 시작해 보세요.
  • Grounding : Google Search를 사용하여 근거 기반 응답을 얻으세요.
  • 코드 실행 (Code execution) : 복잡한 작업을 해결하고 심지어 그래프까지 출력하는 Python 코드를 생성하고 실행할 수 있습니다.
  • 그리고 더 많은 기능들

이러한 예제들은 여러 Gemini API 기능이나 3rd-party 도구를 결합하여 더욱 복잡한 애플리케이션을 구축하는 방법을 보여줍니다.

  • 도구로서의 브라우저 (Browser as a tool) : 실시간 및 내부(인트라넷) 웹 상호 작용에 웹 브라우저를 사용합니다.
  • 책 일러스트레이션 제작 (Illustrate a book) : Gemini를 사용하여 오픈 소스 책의 삽화를 만듭니다.
  • 애니메이션 스토리 생성 (Animated Story Generation) : Gemini의 스토리 생성, Imagen, 오디오 합성 기능을 결합하여 애니메이션 비디오를 만듭니다.
  • 실시간 플로팅 및 매핑 (Plotting and mapping Live) : 복잡한 작업을 실시간으로 해결하기 위해 Live API와 *코드 실행(Code execution)*을 혼합합니다.
  • 3D 공간 이해 (3D Spatial understanding) : Gemini의 3D 공간 기능을 사용하여 3D 장면을 이해합니다.
  • Gradio 및 Live API : Gradio를 사용하여 Live API의 자체 인스턴스를 배포합니다.
  • 그리고 정말 많은 기능들

이러한 완전하게 작동하는 엔드투엔드 애플리케이션들은 실제 시나리오에서 Gemini의 강력함을 보여줍니다.

  • Gemini CLI: 터미널에 Gemini의 강력한 기능을 직접 가져오는 오픈 소스 AI 에이전트
  • Gemini API quickstart: Google AI Gemini API를 사용하여 실행되는 Python Flask 앱으로, Gemini의 멀티모달 기능으로 개발을 시작하도록 설계되었습니다.
  • Multimodal Live API Web Console: 웹소켓(websocket)을 통해 멀티모달 Live API를 사용하는 React 기반 스타터 앱
  • Fullstack Langgraph Quickstart: React 프론트엔드와 LangGraph 기반 백엔드 에이전트를 사용하는 풀스택 애플리케이션
  • Google AI Studio Starter Applets: Gemini가 어떻게 상호작용적인 경험을 만드는 데 사용될 수 있는지 시연하는 소형 앱 모음

Gemini API는 REST API입니다. curl과 같은 도구를 사용하여 직접 호출하거나, 공식 SDK 중 하나를 사용할 수 있습니다:

(REST 예제 또는 훌륭한 Postman 워크스페이스 참조), 또는 다음을 수행하세요:

Google AI 개발자 포럼에서 질문하기.

엔터프라이즈 개발자의 경우, Gemini API는 Google Cloud Vertex AI에서도 사용 가능합니다. 예시는 이 리포지토리를 참고하십시오.

기여를 환영합니다! 자세한 내용은 CONTRIBUTING.md를 참조하십시오.

Gemini API로 개발해 주셔서 감사합니다! 여러분이 무엇을 창조할지 기대됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 GitHub Trending Jupyter Notebook (weekly)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0