
ByteDance Seed, TaskMem 출시
요약
ByteDance Seed가 멀티모달 에이전트의 기억력을 향상시키는 강화학습(RL) 프레임워크인 TaskMem을 출시했습니다. Qwen3-VL-30B를 기반으로 하며, 작업에 따라 메모리 초점을 동적으로 전환하여 VQA 정확도를 높입니다.
핵심 포인트
- 멀티모달 에이전트를 위한 강화학습 기반 메모리 프레임워크
- 스트리밍 비디오 VQA 정확도 최대 7% 향상
- Qwen3-VL-30B 모델을 기반으로 구축
- 과제에 따른 동적 메모리 초점 전환 기능 제공
ByteDance Seed가 TaskMem을 출시했습니다.
멀티모달 에이전트(multimodal agents)에게 무엇을 기억해야 하는지 가르치는 강화학습 (RL) 프레임워크로, 스트리밍 비디오 벤치마크에서 VQA (Visual Question Answering) 정확도를 최대 7% 향상시킵니다.
논문 (Paper):
https://huggingface.co/papers/2605.31075
모델 (Model):
https://huggingface.co/ByteDance-Seed/TaskMem
데모 (Demo):
https://taskmem.github.io
Qwen3-VL-30B를 기반으로 구축된 TaskMem은 당면한 과제에 따라 메모리 초점 (memory focus)을 동적으로 전환합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기