
LabVLA: 과학 실험실 환경에서 VLA 모델 접지(Grounding)
요약
LabVLA는 16가지 로봇 유형에 걸친 10K개 이상의 실험실 장면을 기반으로 구축되었으며, Qwen3-VL 백본과 DiT flow-matching 전문가를 결합했습니다. 이를 통해 LabUtopia에서 71.1%의 성공률을 달성하고 실제 Franka 로봇으로 전이(transfer)할 수 있는 성능을 보여주었습니다.
핵심 포인트
- LabVLA는 대규모 실험실 환경 데이터를 활용하여 모델을 학습시켰습니다.
- Qwen3-VL과 DiT flow-matching 전문가를 결합한 구조가 핵심입니다.
- 높은 성공률(71.1%)을 달성하고 실제 로봇 하드웨어로 전이가 가능합니다.
RoboGenesis는 16가지 로봇 유형에 걸쳐 10K개 이상의 실험실 장면을 구축했습니다. LabVLA는 Qwen3-VL 백본과 DiT flow-matching 전문가를 결합하여, LabUtopia에서 71.1%의 성공률을 달성하고 실제 Franka 로봇으로 전이(transfer)할 수 있습니다.
논문: https://huggingface.co/papers/2606.13
578
...
모델: https://huggingface.co/zjunlp/LabVLA
프로젝트 페이지: https://zjunlp.github.io/LabVLA/
FlashMemory-DeepSeek-V4
Lookahead Sparse Attention은 500K 컨텍스트에서 KV 캐시를 90% 이상 줄여, 이를 전체 크기의 단 13.5%로 압축하면서도 RULER, LongBench-v2, LongMemEval에서의 정확도를 유지하거나 향상시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기