
BeyondArena: 표 형식 파운데이션 모델 (Tabular Foundation Models)은 실제로 범용적인가?
요약
BeyondArena는 표 형식 파운데이션 모델(Tabular FMs)의 범용성을 검증하기 위해 IID, 시계열, 그룹화된 태스크를 포함한 142개 데이터셋 벤치마크를 제시합니다. 연구 결과, Tabular FMs는 소규모 동질적 데이터에서는 강점을 보이나, 복잡한 과제에서는 여전히 트리 기반 및 딥러닝 모델이 우세함을 밝혀냈습니다.
핵심 포인트
- 142개 데이터셋을 활용한 새로운 표 형식 모델 벤치마크 제시
- Tabular FMs는 소규모 동질적 데이터셋에서 높은 성능 발휘
- 복잡한 태스크에서는 트리 기반 및 딥러닝 모델이 여전히 우위
- Data Foundry 큐레이션 툴킷 및 데이터셋 오픈 소스 공개
BeyondArena: 표 형식 파운데이션 모델 (Tabular Foundation Models)은 실제로 범용적인가?
IID, 시계열 (temporal), 그리고 그룹화된 (grouped) 태스크에 걸친 142개 데이터셋의 새로운 벤치마크가 진실을 밝혀냅니다. 표 형식 FM (Tabular FMs)은 규모가 작은 동질적 데이터 (small homogeneous data)에서는 승리합니다. 하지만 트리 기반 (Tree-based) 모델과 딥러닝 (deep learning) 모델은 여전히 어려운 과제들을 지배하고 있습니다.
논문 (Paper):
https
://paperswithcode.co/paper/2606.304
10
…
데이터셋 (Dataset):
https
://huggingface.co/datasets/TabArena/BeyondArena
…
코드 (Code):
https
://github.com/TabArena/data-foundry
…
142개 데이터셋 전체와 Data Foundry 큐레이션 툴킷은 오픈 소스입니다. 이제 당신의 모델을 진정으로 벤치마킹할 시간입니다.
Microsoft가 방금 Hugging Face에 새로운 GUI 에이전트를 출시했습니다.
Sico-Evolution의 태스크 성공률 (Task Success Rate)이 39.8%에서 82.9%로 급증했습니다.
GPT-5.4, Claude Opus 4.6, 그리고 Claude Opus 4.7을 능가합니다.
이 모든 것은 4B 파라미터 모델로부터 이루어집니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기