세 명의 연구자, 하나의 GPU, 2년. RX 580이 어떻게 AI 플랫폼이 되었나

요약

구형 GPU인 AMD RX 580을 활용하여 LLM 추론과 이미지 생성을 구현한 세 연구자의 과정을 다룹니다. Vulkan API와 ggml 엔진을 통해 저사양 하드웨어에서도 AI 모델을 효율적으로 실행할 수 있음을 증명했습니다.

핵심 포인트

RX 580에서 Vulkan을 통해 LLM 추론 성능 4.5배 향상
stable-diffusion.cpp를 활용한 RX 580 기반 이미지 생성 성공
Windows 환경에서의 자동화 및 OpenWebUI 통합 방법 제시
ggml 엔진 기반의 llama.cpp와 stable-diffusion.cpp의 역할

이 기사의 모든 이미지는 RX 580 8GB에서 생성되었습니다. 모두가 AI를 실행할 수 없다고 말했던 바로 그 GPU입니다. 이것은 집단적 지식입니다. 세 명의 독립적인 연구자. 협력 없음. 동일한 GPU. 동일한 결론.

2025년 1월 — Amihart
플랫폼: Debian Linux
게시처: Medium
Amihart는 RX 580에서 Vulkan을 통한 LLM 추론 (Inference)을 가장 먼저 기록했습니다. Debian에서 -DGGML_VULKAN=on 옵션으로 llama.cpp를 컴파일하고, Celeron G6900 CPU 환경에 연결하여 다음과 같이 측정했습니다:

CPU 전용: 5.45 tok/s
RX 580 (Vulkan 경유): 24.56 tok/s

공식적으로 "AI를 지원하지 않는" 하드웨어에서 4.5배의 성능 향상을 이뤄냈습니다. 하지만 당시 상황에 솔직하고 정확한 다음과 같은 문장이 등장했습니다: "안타깝게도 Vulkan이 RX580에서 꽤 괜찮은 성능을 보여주는 것 같지만, Stable Diffusion에서 Vulkan을 작동시킬 수 있는 방법은 알지 못합니다. Stable Diffusion을 사용하려면 ROCm이 필요할 것입니다."

이 문장은 다음 연구자가 답할 질문을 던졌습니다.

2025년 12월 — DH / DadHacks
플랫폼: Linux/Debian
게시처: dadhacks.org
DadHacks는 Amihart가 지적한 한계를 반박했습니다. 이는 비판이 아니라 소프트웨어가 진화했다는 증거였습니다. stable-diffusion.cpp가 성숙해진 것입니다. -DSD_VULKAN=ON (최신 버전의 -DGGML_VULKAN=ON과 동일)을 사용하여 RX 580에서 Vulkan을 통한 이미지 생성이 작동했습니다. VRAM을 초과하는 구성 요소에 대한 CPU 오프로딩 (Offloading)을 포함하여, Q4 양자화 (Quantization)된 FLUX.1 Schnell까지 지원했습니다. Amihart가 1월에 정확히 식별했던 장벽이 12월에는 무너졌습니다.

2026년 — AIVisionsLab
플랫폼: Windows 10 Pro + WSL2
게시처: setup-ia-local-rx580-vulkan.web.app
세 번째 단계는 통합이었습니다. 이전의 두 프로젝트는 모두 Linux에서 실행되었습니다. 그 중 어느 것도 모든 것을 Windows 상의 통합된 일상 사용 시스템으로 연결하지 않았습니다. 어느 것도 실패 사례(DirectML, ROCm, OpenVINO)를 기록하지 않았습니다. 어느 것도 자동화 스크립트를 구축하지 않았습니다. 어느 것도 OpenWebUI를 통합하지 않았습니다.

AIVisionsLab은 그 공백을 채웠습니다:

.bat 자동화를 포함한 전체 Windows 스택
방화벽 관련 참고 사항을 포함한 Docker를 통한 OpenWebUI 통합
이중 아키텍처: 빠른 모델을 위한 GPU Vulkan, FLUX 16GB를 위한 Xeon CPU WSL2
근본 원인 분석 (Root cause analysis)을 통한 모든 실패 사례 기록
결정적인 GGUF 호환성 문제 발견: city96 대 leejet 포맷

각 프로젝트가 답한 질문

프로젝트	질문	답변
Amihart	LLM이 Vulkan RX 580에서 실행될 수 있는가?	예. 24.56 tok/s
DadHacks	Stable Diffusion이 Vulkan RX 580에서 실행될 수 있는가?	예. sd.cpp가 작동함
AIVisionsLab	이 모든 것을 Windows에서 매일 통합하여 실행할 수 있는가?	예. 전체 스택 문서화 완료

공통 분모
세 프로젝트 모두 동일한 엔진으로 수렴합니다: ggml (Georgi Gerganov)
├── llama.cpp → Vulkan을 통한 LLM
└── stable-diffusion.cpp (leejet) → Vulkan을 통한 이미지

ggml은 딥러닝 텐서 연산 (Tensor operations)을 C로 포팅하고 Vulkan 훅 (Hooks)을 노출했습니다. 그 단 하나의 결정이 구형 AMD 하드웨어를 CUDA/ROCm 의존성 함정으로부터 해방시켰습니다.

세 가지 철학, 동일한 결론
Amihart: "이 카드가 얼마나 오래되었든 간에, 기술적으로 AI에 사용하는 것이 가능합니다."
DadHacks: "이 설정은 값비싼 업그레이드나 ROCm과 같은 특수 소프트웨어 스택을 요구하지 않고도 기존 하드웨어 투자를 활용할 수 있는 접근 가능한 경로를 제공합니다."
AIVisionsLab: "상업적인 계획적 구식화 (Planned obsolescence)는 시장의 선택이지, 공학적 장벽이 아닙니다. 구형 하드웨어는 죽지 않습니다. 적절한 소프트웨어에 의해 해방될 뿐입니다."

전체 문서 📖 setup-ia-local-rx580-vulkan.web.app — PT/EN/ES/FR/AR로 제공되는 완전한 가이드
📦 github.com/aivisionslab-studios/rx580-local-ai-guide
🤗 huggingface.co/aivisionslab/ai-local-rx580-stack

AI 자동 생성 콘텐츠

원문 바로가기

세 명의 연구자, 하나의 GPU, 2년. RX 580이 어떻게 AI 플랫폼이 되었나

요약

핵심 포인트

댓글