arXiv논문2026. 06. 19. 12:21

DataMagic: 정형 데이터를 데이터 인사이트 비디오로 변환하기

요약

DataMagic은 정형 데이터와 자연어 질의를 사용하여 서사적인 데이터 인사이트 비디오를 생성하는 엔드투엔드 시스템입니다. DVSpec 명세와 '생성 후 오케스트레이션' 멀티 에이전트 아키텍처를 통해 데이터 충실도와 서사적 일관성을 동시에 확보합니다.

핵심 포인트

정형 데이터를 동적 차트와 내레이션이 포함된 비디오로 변환
데이터 충실도 보장을 위한 선언적 명세 DVSpec 도입
멀티 에이전트 기반의 '생성 후 오케스트레이션' 아키텍처 채택
단순 비디오를 넘어 탐색 가능한 대화형 데이터 인터페이스 제공

데이터 비디오는 동적 차트, 음성 내레이션, 동기화된 애니메이션을 통합하여 데이터 인사이트를 시간적 서사(temporal narratives)로 전달하며, 데이터 관리 생명주기에서 데이터 소비 효율을 높이는 효과적인 매체로 작용합니다. 그러나 고품질 데이터 비디오를 제작하기 위해서는 데이터 분석, 서사 설계(narrative design), 비디오 제작을 아우르는 전문 지식이 필요합니다. 기존 방식들은 다음과 같은 한계가 있습니다: 정적 시각화 도구(예: BI 대시보드)는 서사적 논리와 애니메이션이 부족하며, 저작 도구(authoring tools)는 사용자가 원천 데이터(raw data)로부터 작업하기보다 시각화 자료를 미리 준비해야 합니다. 또한 픽셀 수준의 비디오 생성 모델은 데이터의 충실도(fidelity)나 출처(provenance)를 보장할 수 없습니다. 본 논문에서는 원천 정형 데이터(tabular data)와 자연어 질의를 서사적인 데이터 인사이트 비디오로 변환하는 엔드투엔드(end-to-end) 대화형 시스템인 DataMagic을 선보입니다. 데이터 충실도를 보장하기 위해, DataMagic은 데이터 기반의 의미론적 참조(semantic references)를 통해 시각 및 애니메이션 요소를 기저의 데이터 필드에 결합하는 선언적 명세(declarative specification)인 DVSpec을 도입합니다. 설계 공간의 조합 폭발(combinatorial explosion) 문제를 해결하기 위해, DataMagic은 후보 장면들을 병렬로 생성한 후 전역 오케스트레이션(global orchestration)을 통해 서사적 일관성을 최적화하는 '생성 후 오케스트레이션(Generate-then-Orchestrate)' 멀티 에이전트 아키텍처를 채택합니다. DVSpec의 로직과 렌더링의 분리(decoupling)를 활용하여, 이 시스템은 세 가지 상호작용 모드와 구조화된 출처 기반 데이터 질의응답(Q&A)을 추가로 지원함으로써 일방향 비디오를 탐색 가능한 대화형 데이터 인터페이스로 변환합니다. 109개의 실제 샘플에 대한 평가를 통해 DataMagic의 효과를 검증했습니다. 홈페이지: https://datamagic-home.github.io/

AI 자동 생성 콘텐츠

원문 바로가기

DataMagic: 정형 데이터를 데이터 인사이트 비디오로 변환하기

요약

핵심 포인트

댓글