Windows, Linux, Mac에서 Gemma 4를 설정하는 방법
요약
Windows, Linux, macOS 환경에서 Gemma 4 모델을 실행하기 위한 Ollama 및 llama.cpp 설정 방법을 안내합니다. 각 운영체제별 설치 단계와 GPU 가속(NVIDIA CUDA, AMD ROCm, Apple Metal) 활용법을 다룹니다.
핵심 포인트
- Ollama를 이용한 OS별 간편한 Gemma 4 설치 및 실행 방법
- NVIDIA, AMD, Apple Silicon GPU 가속을 위한 드라이버 설정
- 고성능 추론을 위한 llama.cpp 직접 빌드 및 GGUF 활용법
어떤 모델을 실행하기 전에, 사용 중인 OS에 Ollama (또는 llama.cpp)가 설치되어 있어야 합니다. Ollama는 세 가지 플랫폼 모두에서 가장 간단한 시작점입니다.
Windows
- ollama.com/download에서 설치 프로그램을 다운로드하고
.exe파일을 실행하세요. - 설치 마법웨이저를 따르세요 — Ollama는 시스템 트레이에 추가되며 자동으로 시작됩니다.
- PowerShell 또는 명령 프롬프트(Command Prompt)를 열고 확인하세요:
ollama -v
- 모델을 가져오고(Pull) 실행하세요:
ollama run gemma4:e4b
NVIDIA GPU를 사용 중이라면, Ollama가 자동으로 이를 감지하고 사용할 수 있도록 최신 CUDA 드라이버를 먼저 설치하세요 — PowerShell에서 nvidia-smi로 확인할 수 있습니다.
Linux
- 공식 스크립트를 통해 설치하세요:
curl -fsSL https://ollama.com/install.sh | sh
- 서비스를 시작하세요 (보통 자동으로 시작되지만, 수동으로 실행할 수도 있습니다):
ollama serve
- 설치 및 GPU 감지를 확인하세요:
ollama -v
nvidia-smi # NVIDIA GPU용
- 지속적인 백그라운드 서비스를 위해, 터미널에서
ollama serve를 실행하는 대신 systemd에 등록하세요:
sudo useradd -r -s /bin/false -U -m -d /usr/share/ollama ollama
sudo usermod -a -G ollama $(whoami)
sudo systemctl daemon-reload
...
- 가져오고 실행하세요:
ollama run gemma4:e4b
AMD GPU 사용자는 기본 설치와 함께 추가적인 ROCm 패키지(ollama-linux-amd64-rocm.tar.zst)가 필요합니다.
macOS
- ollama.com/download에서
.dmg를 다운로드하여 열고 Ollama를 응용 프로그램(Applications) 폴더로 드래그하거나, Homebrew를 통해 설치하세요:
brew install ollama
brew services start ollama
- 권한을 부여하기 위해 응용 프로그램에서 Ollama를 한 번 실행하세요. 메뉴 바에서 아이콘을 볼 수 있습니다.
- 확인 및 실행하세요:
ollama --version
ollama run gemma4:e4b
Apple Silicon Mac (M1–M4)은 Metal 가속을 자동으로 사용합니다 — 추가적인 드라이버 설정이 필요하지 않으며, 통합 메모리(Unified Memory)가 편안하게 실행할 수 있는 최대 모델 크기를 결정합니다.
대신 llama.cpp를 선택하는 경우
편의성보다 순수한 추론 속도(Inference speed)가 필요하다면, 어떤 OS에서든 llama.cpp를 직접 빌드하세요:
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
cmake -B build -DGGML_CUDA=ON # Mac에서는 -DGGML_METAL=ON을 사용하고, CPU 전용 Linux/Windows에서는 플래그를 생략하세요
...
이 명령어를 실행하기 전에 Hugging Face의 Gemma 4 컬렉션에서 GGUF 가중치(weights)를 별도로 다운로드하세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기