Mistral Medium 출시 예정
요약
Mistral AI가 새로운 'Medium' 규모의 언어 모델 출시를 예고했습니다. 이 Medium 모델은 1280억 개의 파라미터를 가질 예정이며, 아키텍처는 밀집형(dense) 구조이거나 Mistral Small보다 희소도가 낮은 MoE(Mixture of Experts) 구조일 것으로 예상됩니다.
핵심 포인트
- Mistral AI가 'Medium' 모델을 출시할 계획이다.
- 새로운 Medium 모델은 1280억 개의 파라미터를 가질 예정이다.
- 모델 아키텍처는 밀집형(dense)이거나 MoE 구조일 것으로 추정된다.
흥미롭게도, Mistral Small 는 Mistral-Small-4-119B-2603 로 명명되어 있습니다. 그들의 medium 모델은 128B 개의 파라미터를 가질 것입니다. 이는 밀집형(dense) 모델이거나, Mistral Small 보다 희소도가 낮은 MoE(Mixture of Experts) 구조일 것입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기