HIP: gfx900에서 dense prefill을 위해 hipBLAS 사용, MoE를 위한 MMQ 유지

전반적인 성능 향상:

Qwen3.5 4B: +36.1%
Qwen3.6 27B: +18.9%
Gemma4 12B: +65.1%
전체 평균: ~40%

gfx900 관련 GPU 전용:
Vega GPU, 코드명 vega10, Radeon Vega Frontier Edition, Radeon RX Vega 56/64, Radeon RX Vega 64 Liquid, Radeon Pro Vega 48/56/64/64X, Radeon Pro WX 8200/9100, Radeon Pro V320/V340/SSG, Radeon Instinct MI25 포함
이 정도의 오래된 아키텍처(architecture)와 카드치고는 정말 놀라운 수치입니다. 해당 카드 사용자들에게 매우 좋네요.
/u/pmttyji 제출
[link] [comments]