본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 07. 01:58

GGT-100K

요약

이미지 복원 작업을 위한 GGT-100K 데이터셋과 멀티모달 모델 벤치마킹 연구를 소개합니다. 또한 JetBrains가 공개한 12B MoE 모델인 Mellum2의 효율적인 아키텍처와 성능을 다룹니다.

핵심 포인트

  • GGT-100K: 103K개의 고품질 이미지 복원 학습 쌍 제공
  • 멀티모달 파운데이션 모델 9종에 대한 벤치마킹 수행
  • Mellum2: 2.5B 활성 파라미터로 14B급 성능을 내는 12B MoE 모델
  • Mellum2는 코드, 추론, 에이전트 워크플로우에 최적화됨

GGT-100K

우리는 실제 환경의 이미지 복원 (image restoration) 작업에 대해 9개의 멀티모달 파운데이션 모델 (multimodal foundation models)을 벤치마킹했습니다.
승리한 모델은 10개의 복원 베이스라인 (restoration baselines) 성능을 향상시키는 103K개의 저화질-고화질 (LQ-HQ) 학습 쌍의 엔진이 되었습니다.

모든 결과물은 Hugging Face에 공개되어 있습니다: 103K개의 쌍, 500개의 테스트 이미지, 그리고 20개의 사전 학습된 체크포인트 (pretrained checkpoints).

논문 (Paper):
https://huggingface.co/papers/2605.31039

데이터셋 (Dataset):
https://huggingface.co/datasets/VCLab-PolyU/GGT-100K

JetBrains가 Mellum2를 오픈 소스로 공개했습니다

토큰당 단 2.5B의 활성 파라미터 (active parameters)만으로 처음부터 학습된 12B Mixture-of-Experts (MoE) 모델입니다.
코드, 추론 (reasoning), 그리고 빠른 에이전트 워크플로우 (agentic workflows)를 위해 구축되었습니다.
2.5B의 밀집 연산 (dense compute)으로 구동되면서도 14B 모델들과 경쟁할 만한 성능을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0