ServiceNow-AI/SuperApriel-15B-Instruct

모델 크기: 150 억 파라미터
레이어: 각 레이어에 4 가지 미커 변형을 갖춘 48 개의 디코더 레이어
컨텍스트 길이: 262,000 개 위치 (런타임 의존)
언어: 영어 (최적)

**150 억 파라미터 토크인 미커 서퍼네트 (token-mixer supernet)**로, 32K 시퀀스 길이에서 최대 10.7 배의 디코드 처리량을 제공하는 8 개의 최적화된 배포 프레셋이 단일 체킹포인트에서 가능합니다. Apriel-1.6 에서 유래되었으며, 확률적 디стил레이션 (stochastic distillation) 과 표적화된 감독 미세 조정 (targeted supervised fine-tuning) 을 통해 개발되었습니다.