Open Dungeon: Gemma 4 QAT와 인라인 Uncen-FLUX 이미지를 사용한 로컬 역할극, 8GB RAM(OS)에서 최대

저는 AI Dungeon 같은 것을 원했지만 완전히 로컬이고 실제로 프라이빗해야 했기 때문에 직접 만들었습니다. 내레이터는 Ollama를 통해 Gemma 4 (QAT Q4)이며, 보여줄 만한 장면이 있으면 FLUX를 사용하여 현지에서 그림도 그립니다. API 키도 없고, 클라우드도 없고, 아무것도 기기를 벗어나지 않습니다.
가장 놀라웠던 부분은 다음과 같습니다: 12B 모델을 최대 256k 컨텍스트로 구동해도 여전히 약 7.7GB의 RAM만 차지한다는 것입니다. 이는 Gemma 4가 KV 캐시를 거의 증가시키지 않기 때문입니다. 따라서 내레이터는 기본적으로 전체 이야기를 머릿속에 담아둘 수 있습니다. 스크롤되어 사라지는 이전 장면들은 요약된 실행 요약으로 접혀서, 1장에서 무슨 일이 일어났는지 절대 잊지 않습니다.
예상대로 작동합니다: Do / Say / Story 모드, Continue, Retry, Erase, 모든 줄 편집이 가능합니다. UI에서 원하는 모델을 선택하면 RAM 비용을 미리 보여줍니다.
릴리즈 버전에서는 Mac용 원클릭 빌드가 가능하거나 소스에서 실행할 수 있습니다. MIT 라이선스로 배포하며, 사람들이 이것을 분석하고 빠진 부분이 무엇인지 알려주기를 바랍니다.
https://github.com/newideas99/open-dungeon
제출자: /u/akroletsgo

Insights

Open Dungeon: Gemma 4 QAT와 인라인 Uncen-FLUX 이미지를 사용한 로컬 역할극, 8GB RAM(OS)에서 최대

요약

핵심 포인트

댓글

Olix, 33억 달러 기업 가치로 유럽 최대 규모의 칩 투자 유치

TotalEnergies, Shell 및 KKR과 유럽 재생 에너지 계약 체결

KKR, 역대 최대 규모 인프라 펀드 조성 위해 192억 달러 조달

파일럿 에이전트(Pilot Agent)란 무엇인가? 브라우저, 기계, 워크플로우를 제어하는 AI 에이전트 클래스

Olix, 33억 달러 기업 가치로 유럽 최대 규모의 칩 투자 유치

TotalEnergies, Shell 및 KKR과 유럽 재생 에너지 계약 체결

KKR, 역대 최대 규모 인프라 펀드 조성 위해 192억 달러 조달

파일럿 에이전트(Pilot Agent)란 무엇인가? 브라우저, 기계, 워크플로우를 제어하는 AI 에이전트 클래스