ZAYA1-74B-Preview 출시 및 AMD 기반 사전 학습 성과

모델을 비교하는 것은 어렵습니다. 특히 베이스 (Base) 모델과 완전히 사후 학습 (Post-trained)된 모델을 비교하는 것은 더욱 그렇습니다. 강화학습 (RL)을 위한 핵심 신호는 pass@k입니다. 우리는 pass@1과 pass@4 사이의 큰 격차를 통해 사고의 상당한 다양성을 유지하고 있습니다. 이 격차는 바로 강화학습 (RL)이 구축해 나갈 여유 공간 (Headroom)이며, 우리가 도달하고자 하는 목표 지점에 대한 강력한 신호입니다.

ZAYA1-8B와 마찬가지로, ZAYA1-74B-Preview는 @IBMCloud의 AMD Pensando Pollara 네트워킹과 @AMD의 Instinct MI300X GPU를 사용하여 엔드 투 엔드 (End-to-end)로 사전 학습 (Pretrained)되었습니다.

이전 연구를 바탕으로 한 ZAYA1-74B-Preview는 AMD에서 사전 학습 (Pretraining) 규모를 키우는 것이 실행 가능할 뿐만 아니라 효과적이라는 결정적인 증거입니다.

ZAYA1-74B-Preview는 Apache 2.0 라이선스 하에 공개됩니다.

블로그:
http://zyphra.com/post/zaya1-74b-preview

가중치 (Weights):
http://huggingface.co/Zyphra/ZAYA1-74B-preview

@ZyphraAI는 캘리포니아주 샌프란시스코에 본사를 둔 오픈 초지능 (Superintelligence) 연구 및 제품 기업으로, 개인과 조직이 잠재력을 최대한 발휘할 수 있도록 돕는 인간 정렬 (Human-aligned) AI를 구축하는 것을 사명으로 합니다.

저희와 함께할 분들은 지원해 주세요!

Insights

ZAYA1-74B-Preview 출시 및 AMD 기반 사전 학습 성과

요약

핵심 포인트

댓글

Brownian Bridge Diffusion Models를 위한 Mixture-of-Gaussians 기반 스케줄 설계

Co-Adaptive Multi-Task LoRA: 전이 인식 및 라벨 없는 도메인 참여 제어

잠재적 명확성 (Latent Clarity): 비디오 이상 징후 예측을 위한 월드 모델 운동학(Kinematics)과 의미론적

표현 등가 클래스(Representation Equivalence Classes)에 대한 교사 감독

Co-Adaptive Multi-Task LoRA: 전이 인식 및 라벨 없는 도메인 참여 제어

잠재적 명확성 (Latent Clarity): 비디오 이상 징후 예측을 위한 월드 모델 운동학(Kinematics)과 의미론적

표현 등가 클래스(Representation Equivalence Classes)에 대한 교사 감독