본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 29. 18:38

매일 AI 뉴스 0629

요약

Alibaba의 Wan 팀이 음성, 영상, 텍스트를 하나의 Transformer로 통합한 실시간 대화 모델 Wan-Streamer v0.1을 공개했습니다. 또한 Google의 GPU 부족으로 인한 Meta의 Gemini 이용 제한 보도와 오스트리아의 Anthropic 유치 제안 등 주요 AI 산업 동향을 다룹니다.

핵심 포인트

  • Wan-Streamer v0.1은 음성·영상·텍스트를 통합 처리하여 약 550ms 내외의 낮은 지연 시간을 구현함
  • 기존 모듈 결합 방식과 달리 단일 Transformer 구조로 전이중(Full-duplex) 대화 지원
  • Google의 GPU 자원 공급 제한으로 인해 Meta의 일부 AI 프로젝트가 지연됨
  • 오스트리아 정부가 기술 혁신 주도권을 위해 Anthropic의 EU 유치를 제안함
  • Alibaba의 Wan 팀이 음성과 영상을 실시간으로 주고받는 대화 모델 「Wan-Streamer v0.1」의 연구 프리뷰를 공개했다. 음성·영상·텍스트의 입출력을 하나의 Transformer로 통합하였으며, 모델 측의 응답 지연은 약 200밀리초(ms)라고 밝혔다.
  • 컴퓨팅 자원(Computing resources)을 둘러싼 움직임도 이어졌다. Google이 GPU 부족을 이유로 Meta에 대한 Gemini 제공을 제한했다는 보도가 나왔으며, 유럽에서는 오스트리아가 EU 역내로 Anthropic 유치를 촉구했다.

Alibaba의 Wan 팀이 실시간 음성·영상 대화를 위한 기반 모델(Foundation model) 「Wan-Streamer v0.1」을 공개했다. 음성 인식이나 음성 합성, 아바타 생성과 같은 처리를 별개의 모듈로 연결하는 기존 구성과 달리, 음성·영상·텍스트의 입출력을 하나의 Transformer로 통합하여 다룬다. 토큰을 시계열로 엮어 블록 단위의 인과 어텐션(Causal attention)으로 순차적으로 스트리밍하는 설계로, 상대방의 발화에 끼어들며 응답하는 전이중(Full-duplex) 대화를 상정한다. 논문에 따르면 모델 측의 응답 지연은 약 200밀리초(ms)이며, 양방향 네트워크 지연 350밀리초(ms)를 더해도 대화 전체의 지연은 약 550밀리초(ms) 내로 수렴하며, 최단 160밀리초(ms)·25fps 단위로 출력한다고 한다. 현 시점의 v0.1은 192p의 실증 단계로, 고해상도화는 향후 과제로 꼽고 있다.

Source: https://arxiv.org/abs/2606.25041

Source: https://wan-streamer.com/

Google이 GPU 부족을 이유로 Meta의 Gemini 이용을 제한했다고 Financial Times가 보도했다. 관계자의 말에 따르면, Google은 3월경 Meta에 대하여 Meta가 구매를 요청했던 Gemini용 컴퓨팅 자원을 모두 공급할 수는 없다고 전달했다고 한다. 이로 인해 Meta의 사내 AI 프로젝트 일부에 중단이나 지연이 발생한 것으로 알려졌다. 다른 Google 고객들에게도 적지 않은 영향이 나타나고 있으나, 수요가 특히 큰 Meta가 가장 큰 타격을 입었다고 보도되었다. Google은 이 건에 대해 확인하지 않았으며, 현 시점에서는 미확인 정보이다.

오스트리아의 디지털화 담당 국무장관 Alexander Proell 씨가 EU의 기술 담당 위원 Henna Virkkunen 씨에게 서한을 보내, EU 역내로 Anthropic 유치를 검토하도록 제안했다고 Bloomberg 등이 보도했다. 미국이 미국 외 지역 이용자에 의한 Anthropic의 최첨단 모델 이용을 제한한 것에 따른 움직임으로, Proell 씨는 서한에서 유럽이 중요한 혁신에서 뒤처져서는 안 된다고 지적했다. 법적 안정성이나 시장, 자본, 가치관 측면에서 EU가 적합하다며 역내로 Anthropic을 유치하는 길을 함께 찾고 싶다고 촉구했다. 다만 구체적인 진행 방식에 대해서는 언급하지 않았으며, 실현 가능성을 의문시하는 시각이 있다는 점도 인정하고 있다. Anthropic은 이 제안에 대해 코멘트하지 않았다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0