이미지 생성에는 클러스터가 필요했습니다. SANA는 16GB 노트북에서 4096x4096 해상도를 실행합니다.
요약
SANA는 0.6B 파라미터를 가진 경량화된 이미지 생성 모델로, 선형 어텐션과 32배 잠재 압축 기술을 통해 고해상도 생성을 지원합니다. 이를 통해 16GB 메모리 노트북에서도 4096x4096 해상도를 실행할 수 있으며, 4비트 양자화 시 8GB 미만의 환경에서도 구동이 가능합니다.
핵심 포인트
- 0.6B 파라미터의 효율적인 모델 구조
- 선형 어텐션 및 32배 잠재 압축을 통한 고해상도(4096x4096) 지원
- 1024px 해상도 기준 1초 미만의 빠른 생성 속도
- 4비트 양자화 적용 시 8GB 미만 메모리에서도 구동 가능
- 전체 학습 파이프라인을 포함한 오픈 소스 공개
이미지 생성 (Image generation)에는 클러스터가 필요했습니다. SANA는 16GB 노트북에서 4096x4096 해상도를 실행합니다. 0.6B 파라미터 (params).
선형 어텐션 (Linear attention). 32배 잠재 압축 (latent compression). 1024px에서 1초 미만 소요. 4비트 양자화 (4-bit quantization) 적용 시 8GB 미만으로 구동 가능.
전체 학습 파이프라인 (training pipeline)을 포함한 오픈 소스 (Open source).
AI 자동 생성 콘텐츠
본 콘텐츠는 X @githubprojects (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기