본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 15. 07:53

Kuaishou가 Hugging Face에 Keye-VL-2.0을 공개하다

요약

Kuaishou가 30B MoE 구조를 가진 Keye-VL-2.0 모델을 Hugging Face에 공개했습니다. 이 모델은 시간 단위 비디오 이해와 코드, 도구 검색 기능을 통합한 내장 에이전트를 갖추고 있어 정교한 비디오 작업에서 강력한 성능을 보여줍니다.

핵심 포인트

  • 30B MoE 구조를 채택하여 효율성과 성능을 높였습니다.
  • 256K 컨텍스트로 시간 단위의 장기 비디오 이해가 가능합니다.
  • 코드, 도구 및 검색 기능을 통합한 내장 에이전트를 제공합니다.

Kuaishou가 Hugging Face에 Keye-VL-2.0을 공개했습니다.

이 모델은 30B MoE(Mixture of Experts) 구조를 가지며, 시간 단위의 비디오 이해를 위해 256K 컨텍스트를 처리할 수 있고, 코드, 도구 및 검색을 위한 내장 에이전트를 갖추고 있습니다. 이는 정교한(fine-grained) 비디오 작업에서 클로즈드 소스 거대 모델들과 경쟁합니다.

논문:
https://paperswithcode.co/paper/2606.106
51
...
모델:
https://huggingface.co/Kwai-Keye/Keye-VL-2.0-30B-A3B
...
Kwai Keye의 더 많은 정보:
https://huggingface.co/Kwai-Keye

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0