X요약2026. 06. 13. 07:35

Robust-U1이 멀티모달 LLM에 시각적 자가 복구 기능을 제공합니다

요약

ICML 연구에서 발표된 Robust-U1은 멀티모달 LLM에 시각적 자가 복구 기능을 제공합니다. 이 모델은 지도 학습, 강화학습(RL), 그리고 두 보기 간의 공동 추론을 활용하여 손상되거나 가려진 이미지 영역의 픽셀과 의미를 스스로 복원하도록 훈련되었습니다.

손상된 이미지는 이해를 방해합니다.

이 ICML 연구는 모델들이 픽셀을 스스로 복원하도록 훈련시킵니다.

복구 과정은 지도 학습(supervised training), 픽셀 및 의미론적 보상을 사용한 강화학습 (RL), 그리고 두 보기(views)에 걸친 공동 추론을 활용합니다.

AI 자동 생성 콘텐츠