
AgenticDataBench
요약
AgenticDataBench는 15개 도메인과 344개의 현실적인 작업을 포함하는 새로운 벤치마크입니다. 97개의 데이터셋과 433개의 데이터 과학 기술을 활용하여 LLM 데이터 에이전트의 성능을 엄격하게 평가합니다.
핵심 포인트
- 15개 도메인에 걸친 344개의 현실적인 작업 포함
- 97개의 데이터셋 및 433개의 데이터 과학 기술 활용
- LLM 데이터 에이전트 평가를 위한 세밀한 레이블 제공
AgenticDataBench
15개 도메인에 걸친 344개의 현실적인 작업 (tasks).
97개의 데이터셋 (datasets) 및 433개의 데이터 과학 기술 (data science skills).
LLM 데이터 에이전트 (data agents)를 엄격하게 평가하기 위한 세밀한 레이블 (Fine-grained labels). https://t.co/SmOhRCPNaL
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기