ByteDance, 단 3B 파라미터로 거의 모든 것을 수행하려는 오픈 소스 모델 출시

Lance는 단일 프레임워크 내에서 **이미지 및 비디오 이해(understanding), 생성(generation), 편집(editing)**을 지원하는 경량 네이티브 통합 멀티모달 모델(unified multimodal model)입니다.

3B 규모에서의 효율성. 단 **3B의 활성 파라미터(active parameters)**만으로, Lance는 이미지 생성, 이미지 편집 및 비디오 생성 벤치마크 전반에서 강력한 성능을 제공합니다.
처음부터 학습(Trained from scratch). Lance는 단계별 멀티태스크 레시피(staged multi-task recipe)로 구축되었으며, 128-A100-GPU 예산 내에서 완전히 처음부터 학습되었습니다.

Insights