새로운 @heyjasper 출시! MONET: 재현 가능한 텍스트-이미지 (Text-to-Image) 연구를 가능하게 하는 1억 500만 개의
요약
Jasper가 1억 500만 개의 샘플로 구성된 MONET 데이터셋을 출시했습니다. 이 데이터셋은 Apache 2.0 라이선스를 따르며, 중복 제거 및 재캡션 과정을 거쳐 텍스트-이미지(T2I) 연구의 재현성을 높이는 데 목적이 있습니다.
핵심 포인트
- 1억 500만 개의 대규모 T2I 데이터셋 공개
- Apache 2.0 라이선스로 연구 및 상업적 활용 용이
- 중복 제거 및 재캡션 처리를 통한 데이터 품질 확보
- Nano T2I 코드베이스를 통한 모델 학습 지원
새로운 @heyjasper 출시! MONET: 재현 가능한 텍스트-이미지 (Text-to-Image) 연구를 가능하게 하는 1억 500만 개의 샘플로 구성된 Apache2.0 중복 제거 (deduped) 및 재캡션 (recaptioned) 데이터셋입니다.
Nano T2I: @huggingface에서 자신만의 T2I 모델을 학습시킬 수 있는 코드베이스: https://huggingface.co/datasets/jasperai/monet … : https://github.com/gojasper/nano-t2i … 매우
AI 자동 생성 콘텐츠
본 콘텐츠는 X 홈 추천 피드의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기