본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 15. 03:51

SpatialClaw

요약

NVIDIA가 별도의 미세 조정 없이 코드를 액션 인터페이스로 활용하는 공간 추론 에이전트 'SpatialClaw'를 공개했습니다. VLM이 Python 코드를 작성하고 지각 도구를 조합하여 스스로 계획을 수정하며 동작하는 것이 특징입니다.

핵심 포인트

  • 미세 조정(fine-tuning)이 필요 없는 훈련 불필요 에이전트
  • Python 코드를 직접 액션 인터페이스로 사용
  • VLM 기반의 자가 수정 및 계획 수립 능력
  • 기존 에이전트 대비 20개 벤치마크에서 평균 11.2점 향상

NVIDIA가 코드를 액션 인터페이스로 사용하는, 훈련이 필요 없는 공간 추론 에이전트를 공개했습니다. VLM은 영구적인 커널에 Python을 작성하고, 지각 도구를 조합하며, 결과를 검사하고, 계획을 수정합니다—미세 조정(fine-tuning)이 필요 없습니다. 이전 에이전트들보다 20개 벤치마크에서 +11.2점 향상되었습니다.

Paper page:
https://paperswithcode.co/paper/2606.136
73

Project page:
https://spatialclaw.github.io
Code:
https://github.com/NVlabs/SpatialClaw

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0