본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 05. 05:53

ml-intern 소개: Hugging Face 의 연구팀을 자동화한 에이전트

요약

ml-intern은 Hugging Face 생태계 위에서 구축된 자동화 에이전트로, ML 연구자들이 수행하는 복잡한 연구 루프 전체를 오픈소스로 구현했습니다. 이 에이전트는 프롬프트 입력만으로 논문 검색, 인용 관계 추적, GPU 샌드박스에서의 아이디어 구현 및 반복 개선 과정을 자동으로 처리합니다. 이를 통해 과학적 추론 모델의 성능을 크게 향상시키고, 의료 데이터셋 생성부터 경쟁 수학 문제 해결까지 광범위한 연구 작업을 자동화하여 연구 효율성을 극대화합니다.

핵심 포인트

  • ML 연구 루프 전체를 자동화: 논문 검색, 인용 관계 추적, 구현 및 반복 개선 과정을 자동으로 수행합니다.
  • Hugging Face 생태계 통합 활용: Arxiv, Hugging Face Hub/Papers, Datasets 등 HF의 모든 리소스를 깊이 있게 활용합니다.
  • 고급 연구 작업 자동화 능력 입증: GPQA 점수 향상(10%→32%), 의료 데이터셋 합성 및 성능 개선, 경쟁 수학 문제 해결 등을 성공적으로 수행했습니다.
  • 완전한 개발 주기 지원: 로컬 GPU가 없을 경우 HF Jobs를 통해 훈련을 시작하고 모니터링하며 실패 진단까지 자동화합니다.

ml-intern 소개: 후학습 팀을 자동화한 에이전트
@huggingface
매일 ML 연구자들이 수행하는 실제 연구 루프의 오픈소스 구현입니다. 프롬프트를 주면, 논문 검색, 인용 관계 추적, GPU 샌드박스에서 아이디어 구현, 반복 및 개선하여 모든 사용 사례에 대해 심층적으로 연구 기반 모델을 구축합니다. 모두 Hugging Face 생태계 위에서 구축되었습니다.

다음과 같은 놀라운 일을 수행할 수 있습니다:

우리는 과학적 추론을 위한 최고의 모델을 훈련시켰습니다. 공식 벤치마크 논문에서 인용된 인용 관계를 거쳤습니다. OpenScience 와 NemoTron-CrossThink 를 추가하고, ARC/SciQ/MMLU 에서 7 개의 난이도 필터링 데이터셋 변형을 더한 후 Qwen3-1.7B 에 대해 12 번의 SFT 실행을 수행했습니다. 이로 인해 GPQA 점수가 10 시간 만에 10% → 32% 로 상승했습니다. Claude Code 의 최고 결과: 22.99%.

의료 환경에서는 이용 가능한 데이터셋을 검토하고, 품질이 너무 낮음을 결론지었으며, 긴급 대응, hedging, 다국어 등 위해 1,100 개의 합성 데이터 포인트를从头에서 생성하는 스크립트를 작성했습니다. 그 후 훈련을 위해 50 배 확대했습니다. HealthBench 에서 Codex 를 60% 초과하여 압도했습니다.

경쟁 수학에서는 완전한 GRPO 스크립트를 작성하고, http://hf.co/spaces 에서 A100 GPU 로 훈련을 시작했으며, 보상 청구와 붕괴를 관찰한 후 ablation 을 실행하여 성공했습니다. 모두 논문으로 완전히 뒷받침되며 자동적으로 수행되었습니다.

작동 방식은?

ml-intern 은 HF 생태계를 최대한 활용합니다:

  • arxiv 와 http://hf.co/papers 에서 논문을 찾으며, 이를 완전히 읽고, 인용 그래프를 거치며, 방법론 섹션과 http://hf.co/datasets 에서 참조된 데이터셋을 가져옵니다.
  • Hub 를 탐색하며 최근 문서를 읽습니다. 훈련 전에 데이터셋을 검토하고 재포맷하여 GPU 시간 낭비를 방지합니다.
  • 로컬 GPU 가 없으면 HF Jobs 에서 훈련 작업을 시작하며, 실행을 모니터링하고, 자신의 평가 출력을 읽으며, 실패를 진단하고 재훈련합니다.

ml-intern 은 연구자들이 어떻게 작업하고 생각하는지를 깊이 반영합니다. 데이터가 어떻게 보일지, 좋은 모델이 어떤 느낌을 주는지를 알고 있습니다.

오늘 CLI 와 웹 앱으로 출시하며, 모바일/데스크톱에서 사용할 수 있습니다.
CLI:
https://github.com/huggingface/ml-intern/tree/main

웹 + 모바일:
https://huggingface.co/spaces/smolagents/ml-intern

그리고 가장 좋은 점은? 1,000 달러 GPU 리소스와 Anthropic 크레딧을 제공하여 가장 빠른 사용자들을 위한 것입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @akseljoonas (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0