
DataClaw0: 가공되지 않은 멀티모달 스트림을 위한 에이전트 기반 맞춤화 (agentic tailoring)
요약
DataClaw0는 비디오, GUI, 임바디드 데이터 등 가공되지 않은 멀티모달 스트림을 정제하기 위한 에이전트 기반 맞춤화 모델입니다. 9B 파라미터 규모로 노이즈를 필터링하고 신호를 조밀한 감독 데이터로 재구성합니다.
핵심 포인트
- 9B 모델을 활용한 멀티모달 데이터 노이즈 필터링
- 사실적 앵커와 의미론적 합성을 통한 데이터 재구성
- SFT와 GRPO를 결합한 5개 도메인 학습 방식
- 멀티모달 스트림을 위한 에이전트 기반 맞춤화 기술
원하는 어떤 데이터든 만드세요.
9B 모델이 비디오, GUI, 그리고 임바디드 데이터 (embodied data)로부터 노이즈를 필터링합니다.
이 모델은 사실적 앵커 (factual anchors)와 의미론적 합성 (semantic synthesis)을 사용하여 신호를 조밀한 감독 (dense supervision)으로 재구성합니다.
5개의 도메인. SFT와 GRPO를 결합했습니다. 벤치마크가 포함되어 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기