X요약2026. 05. 27. 01:13

MiniMax가 새로운 sparse attention 아키텍처를 갖춘 M3를 공개했습니다

요약

MiniMax가 새로운 sparse attention 아키텍처를 적용한 M3 모델을 공개했습니다. M3는 1M 토큰 기준 prefilling 속도가 9.7배, decoding 속도가 15.6배 향상되어 이전 모델인 M2를 크게 뛰어넘는 성능을 보여줍니다.

와...

MiniMax가 새로운 sparse attention (희소 어텐션) 아키텍처를 갖춘 M3를 막 공개했습니다.

1M tokens에서 9.7배 빠른 prefilling (사전 채우기)
1M tokens에서 15.6배 빠른 decoding (디코딩)

M2는 이미 최고 수준들과 경쟁하고 있었습니다. M3는 완전히 다른 차원의 단계(tier)로 보입니다.

#MiniMax #M3

AI 자동 생성 콘텐츠