Gemini Omni는 '무엇이든 생성할 수 있는' 새로운 AI 모델 제품군입니다
요약
Google이 텍스트, 이미지, 비디오, 오디오 등 다양한 입력을 통해 AI 비디오를 생성할 수 있는 새로운 모델 제품군인 Gemini Omni를 발표했습니다. 첫 번째 모델인 Omni Flash는 멀티모달 입력을 활용한 비디오 생성을 지원하며, 향후 모든 형태의 입력을 통해 무엇이든 생성할 수 있는 범용 모델을 목표로 합니다.
핵심 포인트
- Gemini Omni는 다양한 모달리티를 지원하는 새로운 생성형 AI 모델 제품군임
- 첫 번째 모델인 Omni Flash는 텍스트, 사진, 비디오, 오디오를 입력값으로 사용하여 비디오 생성 가능
- Google은 Omni가 모든 입력으로부터 무엇이든 생성할 수 있는 모델이 되는 것을 목표로 함
- Omni Flash는 기존 Nano Banana 이미지 생성 모델의 비디오 버전과 유사한 포지셔닝을 가짐
Google은 Gemini Omni라고 부르는 대규모의 새로운 생성형 AI (Generative AI) 모델 제품군을 발표하고 있습니다. 첫 번째 Omni 모델인 Omni Flash는 텍스트, 사진, 비디오, 오디오 등 다양한 입력값(Input)을 사용하여 AI 비디오를 생성할 수 있습니다. 하지만 Google은 블로그 게시물을 통해 향후 Omni가 "어떤 입력으로부터든 무엇이든 생성할 수 있는" 존재가 되기를 구상하고 있다고 밝혔으며, 이것이 바로 Omni라는 이름이 붙은 이유입니다. 이 회사는 Omni Flash를 작년 출시 이후 사람들이 이미 500억 개 이상의 이미지를 생성하는 데 사용해 온 Nano Banana 이미지 생성 모델과 유사한 비디오 버전으로 포지셔닝하고 있습니다. 예를 들어, 여러분은 Omni Flash에게 ...를 삽입해 달라고 요청할 수 있습니다. 전체 이야기는 The Verge에서 확인하세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 The Verge AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기