본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 05. 19:54

VideoKR: 지식 및 추론 집약적 비디오 이해를 위한 최초의 데이터셋

요약

VideoKR은 지식 및 추론 집약적인 비디오 이해를 위해 설계된 최초의 데이터셋입니다. 인간 참여형 생성 방식을 통해 145K개의 전문가 도메인 비디오에서 315K개의 예시를 구축했습니다.

핵심 포인트

  • 인간 참여형 생성 방식을 통한 고품질 데이터 큐레이션
  • 텍스트 지름길 의존을 방지하고 진정한 시각적 추론 유도
  • VideoKR-Eval 벤치마크를 통한 모델 성능 평가 가능

VideoKR: 지식 및 추론 집약적 (knowledge- and reasoning-intensive) 비디오 이해를 위한 최초의 데이터셋

이 데이터셋은 인간 참여형 생성 (human-in-the-loop generation) 방식을 통해 145K개의 전문가 도메인 비디오에서 315K개의 예시를 큐레이션했습니다.

VideoKR-Eval 벤치마크는 모델이 텍스트 지름길 (textual shortcuts)에 의존하는 대신 진정한 시각적 추론 (visual reasoning)을 수행하도록 강제합니다.

Hugging Face에서 모든 결과물을 확인해 보세요.

논문:
https://huggingface.co/papers/2606.05

컬렉션:
https://huggingface.co/collections/minuzero/videokr

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0