본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 19. 07:08

Video Pre-Training (VPT)은 레이블이 없는 Minecraft 게임플레이 영상을 사용하여 모방을 통해 게임을 플레이할 수 있는

요약

레이블이 없는 Minecraft 게임플레이 영상을 활용하여 모방 학습을 수행하는 Video Pre-Training(VPT) 기술을 소개합니다. 인간의 시연 영상을 통해 행동을 복제하고, 강화학습을 통해 특정 목표를 달성하도록 미세 조정된 모델들을 제공합니다.

핵심 포인트

  • 레이블 없는 영상을 활용한 비디오 사전 학습 기술
  • 인간의 시연 영상을 통한 행동 복제(Behavioral Cloning) 모델 구현
  • 강화학습을 통한 특정 아이템 획득 및 목표 달성 미세 조정
  • 다양한 환경(기초, 집, 초반 게임)에 최적화된 변형 모델 제공

Video Pre-Training (VPT)은 레이블이 없는 Minecraft 게임플레이 영상을 사용하여 모방 (imitation)을 통해 게임을 플레이할 수 있는 AI 에이전트를 학습시킵니다.

  • 1x, 2x, 3x 너비 구성으로 사용 가능한 사전 학습된 (Pre-trained) 모델들
  • 인간의 시연 (demonstration) 영상으로 학습된 행동 복제 (Behavioral cloning) 모델들
  • 다이아몬드 곡괭이 (diamond pickaxe) 획득을 위해 미세 조정된 (fine-tuned) 강화학습 (Reinforcement learning) 모델들
  • 기초 (Foundation), 집 (house), 그리고 초반 게임 (early game)에 미세 조정된 변형 모델들 제공

AI 자동 생성 콘텐츠

본 콘텐츠는 X @githubprojects (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0