arXiv논문2026. 05. 05. 17:08

Gradient Boosted Risk Scores

요약

리스크 점수는 의료, 보험 등 다양한 분야에서 사용되는 해석 가능하고 실행 가능한 머신러닝 모델입니다. 본 기사는 리스크 점수를 구축하기 위한 간단하면서도 효과적인 접근법으로 그라디언트 부스팅(Gradient Boosting) 기반 알고리즘을 제안합니다. 이 방법은 기존의 회귀 기반 대안보다 적은 규칙 수로 경쟁력 있는 예측 성능을 달성함을 광범위한 실험적 평가를 통해 입증했습니다.

핵심 포인트

리스크 점수는 해석 가능하고 실행 가능한 머신러닝 모델로, 다양한 산업(의료, 보험 등)에 응용됩니다.
제안된 방법은 그라디언트 부스팅을 기반으로 하며, 리스크 점수 구축을 위한 효율적인 접근법입니다.
이 알고리즘은 기존 회귀 기반 대안 대비 적은 규칙 수로도 우수한 예측 성능을 유지합니다 (분류 작업에서 60% 감소 등).
파이썬 및 R 바인딩과 C++ 구현을 제공하여 실질적인 사용성을 높였습니다.

Risk scores 는 의학, 보험, 리스크 관리 등 다양한 분야에서 응용되는 해석 가능하고 실행 가능한 머신러닝 모델의 한 종류입니다. 대부분의 계산 방법과 달리, 리스크 점수는 제한된 기준에 따라 데이터 샘플에 포인트를 할당하여 사람이 계산하도록 설계되었습니다. 리스크 점수를 생성하는 가장 일반적인 접근법은 선형 회귀를 사용하여 선택된 변수의 효과를 추정하는 것입니다. 우리는 컴팩트하고 예측력 있는 리스크 점수를 구축하기 위한 간단하고 효과적인 접근법을 제안합니다. 그라디언트 부스팅 (Gradient Boosting) 을 기반으로 한 알고리즘과 파이썬 및 R 바인딩을 포함한 C++ 구현을 제공합니다. 회귀 기반 대안보다 평균적으로 분류 작업에서 60% 적은 규칙, 시간-이벤트 작업에서 16% 적은 규칙을 생성하면서도 경쟁력 있는 예측 성능을 달성한다는 것을 12 개의 표 데이터셋에 대한 광범위한 경험적 평가에서 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

Gradient Boosted Risk Scores

요약

핵심 포인트

댓글