
ByteDance Seed, 이미지 생성 능력을 구성하기 위한 DanceOPD 출시
요약
ByteDance Seed가 T2I, 로컬 및 글로벌 편집을 통합한 단일 플로우 모델인 DanceOPD를 출시했습니다. 이 모델은 기존 증류 방식보다 10배 높은 효율성을 자랑하며, 높은 벤치마크 성능을 유지합니다. 또한 NVIDIA는 Blackwell GPU에 최적화된 753B 파라미터 규모의 GLM-5.2 모델을 출시했습니다.
핵심 포인트
- DanceOPD는 T2I와 편집 기능을 통합한 단일 플로우 모델임
- 기존 증류 방식 대비 10배의 효율성 달성
- GEditBench 5.35 및 GenEval 0.85의 높은 성능 기록
- NVIDIA의 GLM-5.2는 Blackwell GPU용 NVFP4 양자화 지원
ByteDance Seed가 이미지 생성 능력을 구성하기 위한 DanceOPD를 출시했습니다.
간섭 없이 T2I (Text-to-Image), 로컬 편집 (local editing), 그리고 글로벌 편집 (global editing)을 통합하는 단일 플로우 모델 (single flow model)입니다. 하드 라우팅 (Hard routing) + 원 온-폴리시 쿼리 (one on-policy query)를 통해 이전의 증류 (distillation) 방법들보다 10배의 효율성을 달성했습니다.
프로젝트 페이지:
https://danceopd.github.io
논문:
https://paperswithcode.co/paper/2606.273
DanceOPD는 GEditBench에서 5.35를 기록하고, 여러 전문가 분야를 하나의 학생 모델 (student)로 흡수하면서도 GenEval의 0.85를 유지합니다.
NVIDIA가 Hugging Face에 최적화된 GLM-5.2를 방금 출시했습니다.
1M 컨텍스트 (context)를 가진 753B 파라미터 MoE (Mixture-of-Experts) 모델로,
Blackwell GPU를 위해 NVFP4로 양자화(quantized)되어—
FP8 정확도에 거의 근접합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기