디자인 비디오 생성 평가: 구성적 충실도(Compositional Fidelity)를 위한 지표
요약
디자인 애니메이션을 위한 생성형 비디오 모델의 표준화된 평가 프레임워크를 제안합니다. 레이아웃 충실도, 동작 정확성, 시간적 품질, 콘텐츠 충실도의 네 가지 차원을 통해 주관적인 인간 평가 없이도 자동화된 벤치마킹이 가능하도록 설계되었습니다.
핵심 포인트
- 디자인 애니메이션은 자연스러운 비디오와 달리 구조화된 제약 조건(동작, 방향, 속도 등)을 따름
- 레이아웃 구조 보존과 특정 영역의 안정적 유지가 핵심적인 평가 요소임
- 레이아웃 충실도, 동작 정확성, 시간적 품질, 콘텐츠 충실도의 4가지 차원으로 구성된 자동화 프레임워크 제공
- 주관적인 인간 평가에 대한 의존성을 제거하여 객관적인 모델 벤치마킹 기반 구축
생성형 비디오 모델(Generative video models)이 디자인 애니메이션 작업에 점점 더 많이 사용되고 있지만, 이 도메인을 위한 표준화된 평가 프레임워크는 존재하지 않습니다. 자연스러운 비디오 생성(Natural video generation)과 달리, 디자인 애니메이션은 구조화된 제약 조건을 부과합니다. 즉, 특정 구성 요소는 규정된 동작 유형(Motion types), 방향, 속도 및 타이밍에 따라 애니메이션화되어야 하는 반면, 애니메이션화되지 않는 영역은 안정적으로 유지되어야 하며 레이아웃 구조(Layout structure)가 보존되어야 합니다. 본 논문은 레이아웃 충실도(Layout fidelity), 동작 정확성(Motion correctness), 시간적 품질(Temporal quality), 그리고 콘텐츠 충실도(Content fidelity)의 네 가지 차원으로 구성된 완전 자동화된 평가 프레임워크를 제공합니다. 이를 통해 주관적인 인간 평가에 대한 의존성을 제거하고, 해당 분야의 발전 과정을 벤치마킹할 수 있는 공통된 기반을 구축합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기