본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 13. 11:04

V4FinBench: 기업 파산 예측을 위한 테이블형 기반 모델, LLM 및 표준 방법론의 벤치마킹

요약

V4FinBench는 기업 파산 예측이라는 고위험 금융 과제를 위한 새로운 벤치마크입니다. 이 데이터셋은 Visegràd Group (V4) 경제의 2006년부터 2021년까지의 데이터를 활용하여, 131개의 재무 및 비재무 특징과 6가지 예측 시점을 포함하는 백만 개 이상의 회사-연도 기록으로 구성되어 있습니다. 이 데이터셋은 기존 공개 데이터셋의 부족함과 한계를 극복하고, TabPFN 같은 모델이 실제 금융적 어려움 구조를 포착할 수 있도록 평가 및 개발을 지원하는 것을 목표로 합니다.

핵심 포인트

  • V4FinBench는 기업 파산 예측에 특화된 대규모 벤치마크 데이터셋이다.
  • 데이터셋은 V4 경제의 2006-2021년 데이터를 기반으로 하며, 131개의 재무/비재무 특징과 6가지 예측 시점을 포함한다.
  • 이 벤치마크는 기존 공개 금융 데이터셋의 규모 및 복잡성 부족 문제를 해결한다.
  • V4FinBench를 활용한 모델(예: TabPFN)은 단순히 특정 패턴을 학습하는 것을 넘어, 일반화 가능한 재무적 어려움 구조를 포착할 수 있음을 입증했다.

기업 파산 예측은 심각한 클래스 불균형과 다중 시점(multi-horizon) 예측 요구 사항이 특징인 고위험 금융 과제입니다. 이를 지원하는 공개 데이터셋은 부족하고 작습니다: 널리 사용되는 무료 벤치마크는 6,000개에서 80,000개 사이의 회사-연도 관측치를 포함하며, 더 큰 리소스는 구독 결제 장벽 뒤에 있습니다. 이러한 격차를 해소하기 위해, 우리는 Visegràd Group (V4) 경제(2006-2021)에서 가져온 131개의 재무 및 비재무 특징, 6가지 예측 시점, 그리고 지급 능력(solvency), 지속 가능성(pro...)을 종합적으로 포착하는 복합 스트레스 기준을 갖춘 백만 개 이상의 회사-연도 기록으로 구성된 벤치마크인 V4FinBench를 소개합니다.

American Bankruptcy Dataset을 활용한 외부 평가에서, V4FinBench에 파인튜닝된 TabPFN 체크포인트는 바닐라(vanilla) TabPFN보다 성능이 향상되었으며, 이는 적응(adaptation)이 단순히 V4 고유의 패턴뿐만 아니라 전이 가능한 재무적 어려움 구조를 포착함을 시사합니다. V4FinBench는 현실적인 금융 데이터에 대한 예측 방법론의 추가 평가 및 개발을 지원하기 위해 공개되었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0