비디오 버전의 Nano Banana 습격 @GeminiApp 의 새로운 비디오 모델로 추정되는 「Gemini Omni」의 리크 출력이 유포되고
요약
최근 'Gemini Omni'로 추정되는 새로운 비디오 모델의 리크 출력이 유포되면서 큰 주목을 받고 있습니다. 이 모델은 단순히 영상을 생성하는 것을 넘어, 화면에 나타나는 '문자 정보의 의미적 일관성(textual integrity)'을 유지하는 데 강점을 보였습니다. 특히 삼각함수 증명과 같은 복잡한 수식 과정에서 글자가 무너지지 않고 논리적으로 그려지는 모습이 핵심적인 기술 진보로 평가됩니다.
핵심 포인트
- 단순 영상 생성을 넘어 '정보의 의미적 일관성' 유지에 초점을 맞춘 비디오 AI 모델의 등장 가능성.
- 복잡한 수식이나 텍스트가 포함된 시각 자료(예: 교과서, 화이트보드 강의)를 정확하게 재현할 수 있는 능력을 보여줌.
- 이 기술은 '영상 생성'에서 '설명 가능한 영상(Explanatory Video)'으로 AI의 역할이 진화하고 있음을 시사함.
- 향후 교육 콘텐츠 제작, 튜토리얼 비디오 등 설명적이고 구조적인 영상 콘텐츠 제작에 혁신을 가져올 것으로 기대됨.
비디오 버전의 Nano Banana 습격
@GeminiApp
의 새로운 비디오 모델로 추정되는 「Gemini Omni」의 리크 출력이 유포되고 있다.
・프롬프트는 「칠판에 삼각함수의 증명을 쓰는 교수」
・수식이 무너지지 않고 그려져 있다고 함
・교수의 동작과 칠판 내용이 일치하고 있다고 함
등, 화면 속의 「문자」가 문자로서 성립하고 있다.
리크 비디오와 배경을 설명합니다
これ何がすごいかというと、「映像をきれいに作る」のではなく「画面に出る情報の意味を保つ」ことができていること。動画AIが苦手だった画面内テキストの崩れが、三角関数の証明という難題で破綻していない。つまり、テキスト整合性の課題が前進したと言える。
これって本質的には、「映像を生成する動画AI」から「説明できる動画AI」へのシフトの兆し。
・教科書を映像化する役割
・ホワイトボードで解く先生の役割
・ステップを書きながら解説するチュートリアルの役割
こうした「文字 + 動作 +
例えば、「三角関数の加法定理を証明する動画を作って」と依頼すると、
① 黒板を背景に教師キャラを配置
② 数式を順番に書き進める動作を生成
③ 各ステップに整合した板書を維持
を組み合わせて実行できるかもしれない。
실제 누출 게시물은 여기
https://
x.com/chetaslua/stat
us/2053824398503678108
…
공식 발표는 Google I/O 2026으로 예상되고 있다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @so_ainsight (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기