
Robust-U1이 멀티모달 LLM에 시각적 자가 복구 기능을 제공합니다
요약
ICML 연구에서 발표된 Robust-U1은 멀티모달 LLM에 시각적 자가 복구 기능을 제공합니다. 이 모델은 지도 학습, 강화학습(RL), 그리고 두 보기 간의 공동 추론을 활용하여 손상되거나 가려진 이미지 영역의 픽셀과 의미를 스스로 복원하도록 훈련되었습니다.
핵심 포인트
- Robust-U1은 멀티모달 LLM에 시각적 자가 복구 기능을 추가합니다.
- 복구 과정에는 지도 학습, 강화학습(RL), 공동 추론이 사용됩니다.
- 손상된 이미지의 픽셀과 의미를 스스로 복원하는 것이 핵심입니다.
손상된 이미지는 이해를 방해합니다.
이 ICML 연구는 모델들이 픽셀을 스스로 복원하도록 훈련시킵니다.
복구 과정은 지도 학습(supervised training), 픽셀 및 의미론적 보상을 사용한 강화학습 (RL), 그리고 두 보기(views)에 걸친 공동 추론을 활용합니다.
논의:
https://huggingface.co/papers/2606.08
063
…
데모:
https://huggingface.co/spaces/Jiaqi-hkust/Robust-U1
…
모델:
https://huggingface.co/Jiaqi-hkust/Robust-U1
…
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기