Vertigo Vertigo: 예측적 AI 더블을 통한 영화적 이상향의 재구성
요약
히치콕의 영화 'Vertigo'를 AI 비디오 확산 모델로 재구성한 연구입니다. 원본 프레임의 2.78%만을 사용하여 프레임 보간을 통해 시퀀스를 예측하며, 생성된 영상이 고전 영화의 규범을 얼마나 충실히 재현하는지 탐구합니다.
핵심 포인트
- 희소한 키프레임을 활용한 비디오 확산 모델 기반 프레임 보간 기술 적용
- 생성된 프레임의 73.1%가 원본의 그럴듯한 재현으로 인식됨
- 영화적 규범이 모델의 잠재적 사전 확률(latent priors)에 압축되어 있음을 시사
- 생성형 미디어가 영화의 욕망과 진정성 논리를 가속화하는 방식 분석
Vertigo Vertigo는 히치콕(Hitchcock)의 Vertigo (1958)를 장면 단위로 AI 재구성한 작업으로, 원본 영화 프레임의 단 2.78%만을 사용하여 생성되었습니다. 우리는 이 희소한 키프레임 앵커(keyframe anchors) 세트를 사용하여, 대규모 비디오 확산 모델(large video diffusion model)을 통한 첫 프레임-마지막 프레임 보간(first-last frame interpolation)을 수행함으로써 그 사이의 시퀀스들을 예측합니다. Vertigo 자체는 인공적인 이상향에 대한 강박적인 재구성에 관한 영화입니다. Vertigo Vertigo는 이러한 논리를 영화의 재료로 확장하여, 정전(canonical text)을 생성 시스템 내에 인코딩된 고전 영화의 규범적 관습을 탐사하기 위한 프로브(probe)로 취급합니다. 계산적 분석과 미디어 이론가들(Lev Manovich, Shane Denson, Kevin L. Ferguson)의 비판적 피드백을 통해 평가했을 때, 이 결과물은 놀라운 구조적 충실도(structural fidelity)를 보여줍니다. 프레임의 73.1%가 Vertigo의 그럴듯한 재현으로 인식되었으며, 단 3.6%만이 치명적인 실패를 보였습니다. 이러한 충실도는 영화적 규범이 모델의 잠재적 사전 확률(latent priors) 내에 깊게 압축되어 있음을 시사합니다. 미학적으로, 이 재구성은 원본 영화와 그 예측적 그림자 사이의 불안정한 오버레이(overlay)로 렌더링되어, 관객의 진정성 지각에 지속적인 의구심을 불러일으킵니다. 이는 21세기의 현기증(vertigo)이라 할 수 있습니다. 본 작업은 생성형 미디어가 영화로부터의 패러다임 전환이 아니라, 고전 할리우드에서부터 현재 현대적 지각을 재편하고 있는 예측적 미디어 환경에 이르기까지, 영화의 욕망과 거짓된 진정성의 논리를 가속화하는 것이라고 주장합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기