본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 29. 18:50

통합된 공간 모델 평가 벤치마크: 깊이, 포즈, 궤적, 포인트 클라우드 작업을 동일한 프레임워크 내에서 테스트

요약

SpatialBench는 깊이, 포즈, 궤적, 포인트 클라우드 등 다양한 공간 작업을 동일한 프레임워크에서 평가하는 통합 벤치마크입니다. 또한 VulnGym은 AI 에이전트의 코드 취약점 탐지 능력을 평가하기 위한 오픈 소스 벤치마크를 제공합니다.

핵심 포인트

  • SpatialBench를 통한 공간 기초 모델의 통합적 비교 가능
  • 19개 데이터셋과 540개 이상의 장면을 포함한 광범위한 테스트 환경
  • VulnGym을 활용한 AI 에이전트의 코드 취약점 탐지 능력 평가

통합된 공간 모델 평가 벤치마크(Unified Spatial Model Evaluation Benchmark), 깊이(Depth), 포즈(Pose), 궤적(Trajectory), 포인트 클라우드(Point Cloud)와 같은 작업들을 동일한 프레임워크 내에서 테스트합니다.
https://
git
hub.com/Ropedia/Spatia
lBench
...
SpatialBench는 다양한 공간 기초 모델(Spatial Foundation Models)을 동일한 출발선에 놓고 비교하는 작업을 수행합니다. 19개의 데이터셋, 540개 이상의 장면을 통해 실내외, 실제 및 합성 데이터, 정적 및 동적 상황 등 다양한 케이스를 포괄합니다.

실제 엔지니어링 환경에서 AI 에이전트(AI Agents)의 취약점 발견 능력을 평가할 수 있도록 실제 코드 저장소(Code Repositories)를 기반으로 한 취약점 탐지 벤치마크를 제공합니다.
https://
git
hub.com/Tencent/VulnGym
VulnGym은 ~에 의해 개발된 오픈 소스 취약점 벤치마크 테스트 세트입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @qingq77 (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0