cyankiwi/MiniMax-M2.7-AWQ-4bit --host 0.0.0.0 --port 8000 --tensor-parallel-size 2 --gpu-memory-utilization=0.95 --trust-remote-code --kv-cache-dtype fp8_e4m3 --enable-auto-tool-choice --tool-call-parser minimax_m2

전력 소모량 (예상치): 1450W (과대평가했을 수도 있음, 확실하지 않음, 수정을 환영함) 및 Threadripper CPU 를 가정함

Spark 설정

2 대 Asus Ascent GX10
비용: 소유 시 약 $7K (임대 옵션은 제한됨)
전력 소모량: 평균 365W (모델이 준비된 상태에서 대기 시 100W - 개인적으로 이는 매우 나쁘다고 봄) | ed

Insights

MiniMax M2.7 AWQ-4bit 로의 성능 및 에너지 효율성 비교: 2 대 Spark vs 2 대 RTX 6000 (96GB)

요약

핵심 포인트

결과 (c1)

결과 (c2)

RunPod 설정

Spark 설정

댓글

스웨덴 연구 결과: 남성은 외부 채용 제안을 연봉 협상에 활용하지만 여성은 그렇지 않음

Grok 4.5 출시: '최강'을 쫓기보다 가장 비용 효율적인 '프론티어'에 집중

Taiwan Semi가 웨이퍼 제조 가격을 인상합니다. 이것이 TSM 주식에 좋은 소식인 이유

Grok 4.5 출시: 최강이 아닌, 가장 가성비 좋은 프론티어(Frontier)

스웨덴 연구 결과: 남성은 외부 채용 제안을 연봉 협상에 활용하지만 여성은 그렇지 않음

Grok 4.5 출시: '최강'을 쫓기보다 가장 비용 효율적인 '프론티어'에 집중

Taiwan Semi가 웨이퍼 제조 가격을 인상합니다. 이것이 TSM 주식에 좋은 소식인 이유

Grok 4.5 출시: 최강이 아닌, 가장 가성비 좋은 프론티어(Frontier)