ascend-tribe/openPangu-2.0-Flash (아직 Huggingface에 업로드되지 않았습니다)

openPangu-2.0-Flash는 Ascend에서 학습된 MoE (Mixture of Experts) 모델입니다. 이 모델은 총 92B (920억) 개의 파라미터를 보유하고 있으며, 활성화되는 파라미터는 6B (60억) 개입니다. 컨텍스트 길이 (context length)는 512k입니다. 총 사전 학습 (pretraining) 데이터는 34T (34조) 토큰을 포함합니다. 사후 학습 (Post-training) 과정에서 openPangu-2.0-Flash는 느린 사고와 빠른 사고 능력을 갖춘 통합 SFT (Supervised Fine-Tuning), 다수의 전문가 RL (Reinforcement Learning, 강화학습) 학습, 그리고 여러 RL 전문가를 결합한 온폴리시 증류 (on-policy distillation)를 통해 학습되었습니다.
submitted by /u/External_Mood4719
[link] [comments]

Insights

ascend-tribe/openPangu-2.0-Flash (아직 Huggingface에 업로드되지 않았습니다)

요약

핵심 포인트

댓글

Qwen 3.6 27B Speculative Decoding 벤치마크: 단일 RTX 3090에서 약 100 TPS 달성

AI 에이전트가 도구를 잘 사용하지 못하는 이유는 모델 때문이 아니라 '도구함'이 허술하기 때문일지도 모릅니다 — Function

GLM 5.2가 실제로 프로덕션급인가요? 실제 다중 파일 컴퓨터 비전 구현 작업에서의 테스트 결과

Qwen 3.6 27B Speculative Decoding 벤치마크: 단일 RTX 3090에서 약 100 TPS 달성

AI 에이전트가 도구를 잘 사용하지 못하는 이유는 모델 때문이 아니라 '도구함'이 허술하기 때문일지도 모릅니다 — Function

GLM 5.2가 실제로 프로덕션급인가요? 실제 다중 파일 컴퓨터 비전 구현 작업에서의 테스트 결과