
ResearchMath-14K
요약
멀티 에이전트 파이프라인을 통해 수집된 14,056개의 대규모 수학 문제 데이터셋인 ResearchMath-14K를 소개합니다. 이 데이터셋은 Qwen3 모델의 수학적 추론 성능을 9.2포인트 향상시켰으며, 정답 없이도 추론 감독이 가능함을 입증했습니다.
핵심 포인트
- 최첨단 수학적 추론을 위한 최대 규모 데이터셋 구축
- 에이전트 기반 필터링을 통한 Qwen3 모델 성능 9.2포인트 향상
- 정답(ground truth) 없이도 공개 문제를 통한 추론 감독 가능성 확인
- NVIDIA의 PCB 결함 생성 모델 출시 및 시각 검사 학습 효율성 증대
멀티 에이전트 파이프라인 (multi-agent pipeline)이 14,056개의 공개 연구 수준 수학 문제들을 수집했습니다.
이는 최첨단 수학적 추론 (mathematical reasoning)을 위한 해당 분야 최대 규모의 데이터셋입니다.
논문 (Paper):
https://huggingface.co/papers/2605.28003
…
데이터셋 (Dataset):
https://huggingface.co/datasets/amphora/ResearchMath-14k
…
추론 흔적 (reasoning traces)에 대한 에이전트 기반 필터링 (agentic filtering)을 거친 후 Qwen3 모델의 성능이 9.2포인트 향상되었습니다.
이는 완전하게 정확한 정답 (ground truth) 없이도 공개된 문제들이 추론을 감독 (supervise)할 수 있음을 보여줍니다.
NVIDIA가 방금 Hugging Face에 PCB 이상 생성 모델을 출시했습니다.
깨끗한 이미지와 이진 마스크 (binary mask)로부터 현실적인 인쇄 회로 기판 (printed-circuit-board) 결함을 생성합니다.
단 8개의 실제 사례만으로 시각 검사 (visual-inspection) 모델을 학습시킬 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기