연구진이 단 32개의 H100으로 Deep Research 에이전트를 학습시키고 모든 것을 오픈 소스로 공개했습니다
요약
Ohio State University 연구진이 32개의 H100 GPU와 8K개의 합성 데이터를 활용해 학습시킨 오픈 소스 Deep Research 에이전트 QUEST-35B를 공개했습니다. 학습 레시피, 코드, 가중치 및 데이터셋을 모두 오픈 소스로 제공하며 프런티어 모델에 필적하는 성능을 보여줍니다.
핵심 포인트
- 32개의 H100 GPU를 활용한 효율적인 학습 방식
- 8K개의 합성 샘플(synthetic samples) 사용
- 학습 레시피, 코드, 가중치, 데이터셋 전체 오픈 소스 공개
- 기존 프런티어 Deep Research 시스템과 경쟁 가능한 성능 입증
Ohio State University의 NLP 팀이 약 32개의 H100과 약 8K개의 합성 샘플 (synthetic samples)을 사용하여 학습된 오픈 소스 Deep Research 에이전트인 QUEST-35B를 출시했습니다.
팀은 학습 레시피 (training recipe), 코드, 가중치 (weights) 및 데이터셋을 오픈 소스로 공개했습니다. 벤치마크 결과는 여러 프런티어 (frontier) Deep Research 시스템들에 대해 경쟁력 있는 성능을 보여줍니다.
오픈 소스 Deep Research 에이전트와 프런티어 폐쇄형 (closed) 시스템 사이의 가장 큰 남은 격차는 무엇이라고 생각하십니까?
출처: Professor Yusu
제출자: /u/BuildwithVignesh
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/LocalLLaMA의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기