X요약2026. 06. 07. 01:58

GGT-100K

요약

이미지 복원 작업을 위한 GGT-100K 데이터셋과 멀티모달 모델 벤치마킹 연구를 소개합니다. 또한 JetBrains가 공개한 12B MoE 모델인 Mellum2의 효율적인 아키텍처와 성능을 다룹니다.

핵심 포인트

GGT-100K: 103K개의 고품질 이미지 복원 학습 쌍 제공
멀티모달 파운데이션 모델 9종에 대한 벤치마킹 수행
Mellum2: 2.5B 활성 파라미터로 14B급 성능을 내는 12B MoE 모델
Mellum2는 코드, 추론, 에이전트 워크플로우에 최적화됨

GGT-100K

우리는 실제 환경의 이미지 복원 (image restoration) 작업에 대해 9개의 멀티모달 파운데이션 모델 (multimodal foundation models)을 벤치마킹했습니다.
승리한 모델은 10개의 복원 베이스라인 (restoration baselines) 성능을 향상시키는 103K개의 저화질-고화질 (LQ-HQ) 학습 쌍의 엔진이 되었습니다.

모든 결과물은 Hugging Face에 공개되어 있습니다: 103K개의 쌍, 500개의 테스트 이미지, 그리고 20개의 사전 학습된 체크포인트 (pretrained checkpoints).

논문 (Paper):
https://huggingface.co/papers/2605.31039
…
데이터셋 (Dataset):
https://huggingface.co/datasets/VCLab-PolyU/GGT-100K
…

JetBrains가 Mellum2를 오픈 소스로 공개했습니다

토큰당 단 2.5B의 활성 파라미터 (active parameters)만으로 처음부터 학습된 12B Mixture-of-Experts (MoE) 모델입니다.
코드, 추론 (reasoning), 그리고 빠른 에이전트 워크플로우 (agentic workflows)를 위해 구축되었습니다.
2.5B의 밀집 연산 (dense compute)으로 구동되면서도 14B 모델들과 경쟁할 만한 성능을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

GGT-100K

요약

핵심 포인트

댓글