본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 30. 21:34

ResearchMath-14K

요약

멀티 에이전트 파이프라인을 통해 수집된 14,056개의 대규모 수학 문제 데이터셋인 ResearchMath-14K를 소개합니다. 이 데이터셋은 Qwen3 모델의 수학적 추론 성능을 9.2포인트 향상시켰으며, 정답 없이도 추론 감독이 가능함을 입증했습니다.

핵심 포인트

  • 최첨단 수학적 추론을 위한 최대 규모 데이터셋 구축
  • 에이전트 기반 필터링을 통한 Qwen3 모델 성능 9.2포인트 향상
  • 정답(ground truth) 없이도 공개 문제를 통한 추론 감독 가능성 확인
  • NVIDIA의 PCB 결함 생성 모델 출시 및 시각 검사 학습 효율성 증대

멀티 에이전트 파이프라인 (multi-agent pipeline)이 14,056개의 공개 연구 수준 수학 문제들을 수집했습니다.

이는 최첨단 수학적 추론 (mathematical reasoning)을 위한 해당 분야 최대 규모의 데이터셋입니다.

논문 (Paper):
https://huggingface.co/papers/2605.28003

데이터셋 (Dataset):
https://huggingface.co/datasets/amphora/ResearchMath-14k

추론 흔적 (reasoning traces)에 대한 에이전트 기반 필터링 (agentic filtering)을 거친 후 Qwen3 모델의 성능이 9.2포인트 향상되었습니다.

이는 완전하게 정확한 정답 (ground truth) 없이도 공개된 문제들이 추론을 감독 (supervise)할 수 있음을 보여줍니다.

NVIDIA가 방금 Hugging Face에 PCB 이상 생성 모델을 출시했습니다.

깨끗한 이미지와 이진 마스크 (binary mask)로부터 현실적인 인쇄 회로 기판 (printed-circuit-board) 결함을 생성합니다.

단 8개의 실제 사례만으로 시각 검사 (visual-inspection) 모델을 학습시킬 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0