본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 01. 11:03

FlagGAM: 설명 가능한 정형 데이터 예측을 위한 규칙 기반 일반화 가법 모델링 (Rule-Based Generalized Additive

요약

FlagGAM은 정형 데이터 예측을 위해 규칙 구축과 예측을 분리한 새로운 가법 모델링 프레임워크를 제안합니다. 인간이 읽을 수 있는 희소 규칙 기저를 사용하여 투명성을 확보하면서도, 결측치와 노이즈에 강건한 성능을 보여줍니다.

핵심 포인트

  • 특징 수준의 규칙 구축과 예측을 분리한 프레임워크 제안
  • 인간이 이해 가능한 희소 규칙-기저 행렬 유지
  • 결측치 및 노이즈 상황에서 기존 모델 대비 높은 강건성
  • 혼합 유형 분류 및 회귀 작업에서 우수한 성능 입증

높은 이해관계가 걸린 도메인(high-stakes domains)에서의 정형 데이터 예측(Tabular prediction)은 정확하고, 투명하며, 불완전한 입력에 대해 강건한(robust) 모델을 필요로 합니다. 본 논문에서는 특징 수준의 규칙 구축(feature-level rule construction)과 예측을 분리하는 규칙 정의 기저 프레임워크(rule-defined basis framework)인 FlagGAM을 제안합니다. Flag 핵심 모듈(Flag Core Module)은 수치형 및 범주형 변수를 임계값 플래그(threshold flags), 범주 수준 플래그(category-level flags), 꼬리 편차 기저(tail-deviation bases), 범주형 계단 함수(categorical step functions)를 포함하는 희소하고(sparse) 인간이 읽을 수 있는 단변량 기저(univariate bases)로 변환하며, 이후 기본 가법 헤드(default additive head)가 이러한 기저들을 제한된 GAM 스타일의 예측기(predictor)로서 결합합니다. FlagGAM은 트리거된 규칙들을 압축된 카운트 요약(count summaries)으로 축소하는 대신, 혼합 유형 분류(mixed-type classification) 및 회귀(regression), 특징별 가중치 부여(feature-specific weighting), 그리고 선택적인 유연한 예측 헤드(flexible prediction heads)를 지원하는 희소 규칙-기저 행렬(sparse rule-basis matrix)을 유지합니다. 정형 데이터 벤치마크 전반에 걸쳐, 기본 FlagGAM은 투명한 가법 모드(transparent additive mode)에서 EBM과 유사한 성능을 유지하며, 혼합 유형 회귀(mixed-type regression)에서는 릿지 회귀(ridge regression)보다 실질적으로 개선된 성능을 보입니다. 또한 결측치 및 노이즈 섭동(missing and noisy perturbations) 상황에서 일반적인 베이스라인(baselines)보다 더 적은 AUROC 저하를 보여줍니다. 유연한 헤드(Flexible heads)는 정확도를 더욱 향상시켜 강력한 트리 기반 베이스라인(tree-based baselines)에 근접하지만, 이 경우 결과 모델은 완전한 가법 GAM이라기보다는 규칙-기저 표현(rule-basis representation) 뒤에 비선형 예측기(nonlinear predictor)가 따르는 형태로 해석되어야 한다는 주의점이 있습니다. 종합적으로, FlagGAM은 경쟁력 있는 정확도, 전달 가능한 규칙, 그리고 불완전한 입력에 대한 강건함이 요구되는 정형 데이터 환경을 위한 실용적인 절충안을 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0