SpatialBench

공간 파운데이션 모델 (Spatial Foundation Models)을 위한 최초의 교차 패러다임 (cross-paradigm) 벤치마크로, 19개의 데이터셋, 546개의 장면, 41개의 모델을 아우르며 단 하나의 질문에 답하고자 합니다: 당신은 진정으로 다재다능한 플레이어인가?

논문 (Paper):
https://huggingface.co/papers/2605.27367
…
벤치마크 (Benchmark):
https://huggingface.co/datasets/ropedia-ai/SpatialBenchmark
…
모델 (Model):
https://huggingface.co/ropedia-ai/DA-Next
…
데이터셋 (Dataset):
https://huggingface.co/datasets/ropedia-ai/DA-Next-5M
…

NVIDIA가 방금 LocateAnything를 출시했습니다.

이 모델은 느린 토큰 단위 (token-by-token) 좌표 생성 방식을 대체하여, 바운딩 박스 (bounding boxes)를 단일 단계에서 원자 단위 (atomic units)로 디코딩합니다. 병렬 박스 디코딩 (Parallel Box Decoding)은 탐지 (detection), OCR, 그리고 GUI 작업 전반에서 위치 정확도 (localization accuracy)를 향상시키는 동시에 추론 (inference) 속도를 2.5배 더 빠르게 달성합니다.

Insights

SpatialBench

요약

핵심 포인트

댓글

Embodied AI란 무엇인가?

논란이 된 노르웨이-잉글랜드 월드컵 골을 플레이 가능한 3D 시뮬레이션으로 재구축 (Claude Code 사용)

JP모건, 2026년 2분기 기록적인 이익 달성, 시가총액 1조 달러에 근접

오펜하이머, 테라팹이 스페이스X의 가치 평가와 미래에 '결정적'이라고 밝히다

논란이 된 노르웨이-잉글랜드 월드컵 골을 플레이 가능한 3D 시뮬레이션으로 재구축 (Claude Code 사용)

JP모건, 2026년 2분기 기록적인 이익 달성, 시가총액 1조 달러에 근접

오펜하이머, 테라팹이 스페이스X의 가치 평가와 미래에 '결정적'이라고 밝히다