경마 AI 개발 기록 #19 기대값 운용의 수학적 패배: 왜 「케리 기준(Kelly Criterion)」으로 자산이 녹아내렸는가

요약

경마 예측 AI 모델에 케리 기준(Kelly Criterion)을 도입하여 자금 관리를 시도했으나, 모델의 확률 과신(Over-confidence) 문제로 인해 자산이 급락한 사례를 분석합니다. 모델의 예측 확률과 실제 적중률 사이의 괴리가 오버베팅을 유발하여 파산에 이르게 된 수학적 원인을 다룹니다.

핵심 포인트

케리 기준 도입을 통한 기대값(EV) 기반 동적 베팅 로직 구현
모델의 확률 과신(Over-confidence)이 자산 파산의 핵심 원인임을 규명
예측 확률과 실제 결과 간의 신뢰도 곡선(Reliability Curve) 분석 필요성
확률 교정(Calibration) 및 안전 계수 도입을 통한 리스크 관리 방안 제시

1. 개요

지난 기사(제18화)에서는 모델 업데이트에 따른 스코어 변동을 흡수하는 「3페이즈 워크포워드(3-phase Walk-forward) 기반」을 확립하였고, 2026년 Q1이라는 미지의 기간에서도 높은 예측 정확도(Spearman 상관계수 0.40)를 유지할 수 있음을 확인했습니다.

「맞추기 위한 무기」가 갖춰진 지금, 다음 과제는 「어떻게 효율적으로 벌 것인가」입니다. 제19화에서는 투자 이론에서 최강이라 불리는 자금 관리술 「케리 기준 (Kelly Criterion)」의 도입과, 그로 인해 자산이 수천 엔까지 녹아내린 충격적인 「수학적 패배」의 기록을 적습니다.

2. 구현 내용: 기대값에 기반한 과학적 투자

지금까지의 「일정 금액을 거는 (베타가이/단순 베팅)」 방식에서 탈피하여, 예측 확률과 배당률(Odds)로부터 산출되는 「기대값 (Expected Value: EV)」에 기반하여 투자액을 동적으로 결정하는 로직을 betting_logic.py에 구현했습니다.

2-1. 케리 기준의 도입

케리 기준이란 자산 성장률을 최대화하기 위한 투자 비율을 산출하는 수식입니다.

여기서,

2-2. 기대값 (EV) 필터링

예측 확률과 시장 배당률을 비교하여, 기대값이 일정 수준(ev_threshold)을 초과하는 베팅 항목만을 추출합니다.

# betting_logic.py 로직 발췌
def calculate_ev(prob, odds):
    return prob * odds
...

2-3. 월간 롤링 최적화 (Recalibration)

SimulationEngine을 확장하여, 1개월마다 「최근 12개월의 데이터로 Optuna를 돌려 전략 파라미터를 최적화」 → 「다음 달의 실전 예측」을 반복하는, 보다 실전에 가까운 워크포워드 검증 체제를 구축했습니다.

3. 직면한 문제: 자산 곡선의 수직 낙하

완벽한 이론 무장을 하고 임했던 백테스트 (exp017)의 결과는 눈을 의심케 하는 것이었습니다.

자산의 추이: 100만 엔으로 시작한 가상 자산이 2023년을 기점으로 급락. 최종적으로 수천 엔까지 감소하여 실질적인 「파산」을 기록했습니다.
이상한 상향 및 하향 변동: 일부 레이스에서 자산의 10% 이상을 투입하고 빗나가는 거동이 빈번하게 발생했습니다.
ROI의 괴리: 단순 베팅 시의 ROI는 80% 이상을 유지하고 있음에도 불구하고, 자금 관리를 도입하자마자 수지가 괴멸했습니다.

왜 수학적으로 옳아야 할 케리 기준이 자산을 녹이는 독약으로 변했을까요?

4. 해결 접근법: 신뢰도 곡선 (Reliability Curve)을 통한 진단

원인을 규명하기 위해 모델의 예측 확률을 분석했습니다.

4-1. 충격적인 사실: 모델의 「과신」

분석 결과, 현재의 랭킹 모델에는 치명적인 수학적 결함이 있음이 판명되었습니다.

모델의 출력: 「이 말이 이길 확률은 **20%**입니다."
실제 결과: 100회 시도했을 때 실제로 이긴 것은 **5회 (5%)**뿐.

즉, 모델이 확률을 4~5배나 과대평가 (Over-confidence) 하고 있었던 것입니다.

4-2. 수학적 패배의 메커니즘

케리 기준은 「정확한 적중 확률」을 전제로 한 식입니다. 모델이 확률을 5%에서 20%로 4배 과신하면, 케리 기준은 「이것은 엄청난 노다지 레이스다!」라고 판단하여 자산의 허용 범위를 대폭 초과하는 **오버베팅 (Over-betting)**을 지시합니다.

부정확한 잣대로 측정한 「기대값」에 기반하여 복리 운용을 수행한 결과, 복리의 힘이 자산을 늘리는 방향이 아니라 파멸시키는 방향으로 풀 가동되어 버린 것이 패인이었습니다.

5. 최종적인 해결책: 잠정적인 「안전 계수」 도입

근본적인 해결을 위해서는 「확률의 교정 (Calibration)」이 필요하지만, 우선 현재 모델로 운용을 계속하기 위한 응급처치로서 **확률 안전 계수 (prob_safety_factor)**를 도입했습니다.

5-1. 적중 확률의 할인

모델이 산출한 확률을 조정합니다.

# 확률의 과신을 보정
adjusted_prob = model_prob * trial.suggest_float('prob_safety_factor', 0.1, 0.5)
# 보정된 확률로 EV와 케리 비율을 재계산
...

5-2. 전략 파라미터의 엄격한 제약

Optuna의 탐색 범위를 조정하여 극단적인 투자를 방지하는 가드레일을 설치했습니다.

kelly_multiplier

: 0.01 〜 0.1 (초 쿼터 켈리 (Super Quarter-Kelly)) -
ev_threshold
: 1.5 〜 2.5 (보다 확실한 왜곡(distortion)만을 노림)

5-3. 개선 후의 자산 추이

이 보정을 통해 자산의 급격한 붕괴는 멈췄습니다. 2025년 시뮬레이션에서는 **ROI 97.7%**까지 회복되었으며, JRA의 환급률(약 75~80%)을 크게 상회하는 '에지(Edge)의 씨앗'을 유지하면서 파산을 회피할 수 있는 전략으로 진화했습니다.

6. 배운 점

「정밀도 (Spearman 상관계수)」와 「확신 (Calibration)」은 별개의 것이다

지금까지의 실험(exp018까지)에서 추구해 온 것은 「말의 순위를 올바르게 맞히는 능력 (상관관계)」이었습니다. 하지만 마권 투자에 있어서는 「그 확률이 얼마나 정확한가」라는 **절대적인 교정 정밀도 (Calibration accuracy)**가 상관관계 이상으로 중요하다는 것을 통감했습니다. 상관관계가 1.0이라 하더라도, 확률이 2배 어긋나 있다면 케리 기준 (Kelly Criterion)으로는 파산하게 됩니다.

복리는 양날의 검

기대값 운용에서의 복리는 예측이 정확하다면 자산을 기하급수적으로 늘리지만, 예측에 「과신」이라는 노이즈가 섞이는 순간 자산을 기하급수적으로 파괴하는 폭력으로 변합니다.

7. 차회 예고

모델의 「과신」을 안전 계수로 억지로 억누름으로써 파산은 면했습니다. 하지만 이는 대증요법에 불과합니다. 우리가 다음에 해야 할 일은 수학적으로 올바른 「척도」를 손에 넣는 것입니다.

다음 회에서는 모델이 내뱉는 「거짓 확률」을 「진정한 적중률」로 변환하는, **확률 교정 (Calibration)**의 본격적인 구현에 도전합니다.

Discussion

AI 자동 생성 콘텐츠

원문 바로가기