Allen AI, Hugging Face에 양손 로봇 페그보드 데이터셋 공개
요약
Allen AI가 Hugging Face에 35K 프레임 규모의 양손 로봇 페그보드 조작 데이터셋을 공개했습니다. 또한 Alibaba 연구진은 DiT의 성능을 높이는 새로운 방식인 DAR을 제안했습니다.
핵심 포인트
- Allen AI의 양손 로봇 조작 데이터셋 공개
- LeRobot 기반 3개 카메라 뷰 및 35K 프레임 포함
- Alibaba의 DiT 성능 개선을 위한 DAR 방식 제안
- DAR 적용 시 데이터 및 연산량 대폭 절감 가능
Allen AI가 Hugging Face에 양손 로봇 페그보드 (pegboard) 데이터셋을 방금 공개했습니다.
LeRobot을 통해 캡처된 3개의 카메라 뷰를 포함한 35K 프레임의 양손 조작 (dual-arm manipulation) 데이터입니다.
Diffusion-Adaptive Routing
Alibaba 연구진이 Diffusion Transformers (DiT)의 잔차 연결 (residual connections)을 대체할 수 있는 드롭인 (drop-in) 교체 방식인 DAR을 소개합니다.
이 방식은 레이어와 노이즈 제거 단계 (denoising steps) 전반에 걸쳐 학습 가능하고 타임스텝 적응형 (timestep-adaptive)인 집계 (aggregation)를 수행합니다.
이를 통해 ImageNet에서 8.75배 적은 [데이터/연산량]으로 7.56 FID를 달성했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기