진화 미세 조정 (Evolution Fine-Tuning)

발견 에이전트 (discovery agents)를 위한 연습 단계.

EFT는 156K의 궤적 (trajectories)을 사용하여 371개의 태스크 (tasks) 전반에서 솔루션을 진화시키도록 LLM을 학습시킵니다.

Finch 모델은 홀드아웃 태스크 (held-out tasks)에서 베이스 모델 (base models)보다 10% 더 높은 성능을 보입니다.

컬렉션 (Collection):
https://huggingface.co/collections/minnesotanlp/evolution-fine-tuning

프로젝트 (Project):
https://open-galapagos.github.io/evolution_fine_tuning/

논문 (Paper):
https://paperswithcode.com/paper/2606.29082

GEAR: 10배 더 빠른 자기회귀 (autoregressive) 이미지 생성

Tencent Hunyuan의 새로운 방법은 VQ 토크나이저 (tokenizers)와 AR 생성기 (generators)를 엔드투엔드 (end-to-end)로 공동 학습시키며, 새로운 이중 판독 (dual read-out) 방식을 통해 LlamaGen-REPA를 능가합니다. 모든 토크나이저는 Hugging Face에 있습니다.

Insights

진화 미세 조정 (Evolution Fine-Tuning)

요약

핵심 포인트

댓글

컨텍스트가 채워짐에 따라 로컬 LLM의 속도를 몰래 갉아먹는 것은 무엇인가 - 파트 2

9개의 AI 에이전트, 2개의 CPU 코어, 하나의 체육관: 3계층 아키텍처 (Thread Edition)

Claude에게 'Qiita 글쓰기 프로젝트'를 만들게 한 이야기

AI 에이전트 비교: CrewAI / Devin / OpenHands의 접근 방식과 커버 영역의 차이

9개의 AI 에이전트, 2개의 CPU 코어, 하나의 체육관: 3계층 아키텍처 (Thread Edition)

Claude에게 'Qiita 글쓰기 프로젝트'를 만들게 한 이야기

AI 에이전트 비교: CrewAI / Devin / OpenHands의 접근 방식과 커버 영역의 차이