
【검증】 신형 LLM 「fable-5」에게 2026 W杯 우승 예측을 시켰더니, 답변 방식이 일류였다
요약
신형 LLM fable-5를 활용하여 2026년 월드컵 우승 팀을 예측하는 실험을 진행했습니다. 모델은 단순한 팀 이름 대신 배당률, 정량 모델, 역사적 데이터를 분석하여 확률 분포 기반의 판단 구조를 제시했습니다.
핵심 포인트
- fable-5는 단순 답변 대신 확률 분포와 판단 근거를 제시함
- 베팅 라인과 골드만삭스 모델 등 실데이터를 기반으로 분석 수행
- 불확실성을 인정하고 신뢰 구간을 제시하는 판단 구조의 중요성 강조
2026년 W杯(북중미 대회)가 오늘 개막했습니다. 48개 팀, 104경기, 사상 최대 규모입니다.
최근 막 교체한 신형 모델 fable-5에게 가장 속이기 어려운 태스크를 부여해 보았습니다——우승 팀 예측입니다. 한 달 후에는 결승 토너먼트가 시작되므로, 정답 확인으로부터 도망칠 수 없습니다.
분위기가 아니라, 개막일의 실데이터를 제공했습니다.
| 데이터 | 내용 |
|---|---|
| 북메이커 배당률 (Bookmaker Odds) | 스페인 +450 / 프랑스 +500 / 잉글랜드 +700 / 브라질 +800 |
| 골드만삭스 (Goldman Sachs)의 정량 모델 | 스페인 26% / 프랑스 19% / 아르헨티나 14% |
| 역사적 데이터 | 1966~2022년의 15개 대회 중, 대회 전 유력 후보가 우승한 경우는 단 3회뿐 |
이름을 즉답하지 않고, 문제를 3개 층으로 분해했습니다.
베팅 라인(Betting line)은 '의견'이 아니라 '돈의 투표'입니다. 스페인 +450은 환급률(Payout ratio)을 제외하면 약 18~20%의 우승 확률을 의미합니다. 시장을 뒤엎는 예측에는 시장이 반영하지 않은 정보가 필요합니다.
단판 승부의 토너먼트는 분산(Variance)이 극도로 큽니다 (PK전은 거의 동전 던지기 수준). 26%의 유력 후보라는 것은, 74%의 확률로 우승하지 못하는 팀이라는 뜻입니다. 15회 중 3회라는 실적은 이러한 구조의 필연입니다.
48개 팀 체제로 노크아웃(Knockout)이 1라운드 증가했습니다. 북미의 여름 더위와 장거리 이동으로 인해 컨디션 관리가 숨겨진 전장이 됩니다. 스타 플레이어의 상한치보다 로스터(Roster)의 깊이에 무게 중심이 옮겨갑니다.
이름이 아니라, 확률 분포(Probability distribution)가 돌아왔습니다.
| 팀 | 우승 확률 |
|---|---|
| 스페인 | 22% (골드만삭스의 26%에서 의도적으로 하향 수정—— "컨센서스 자체가 리스크") |
| 프랑스 | 18% (선수층은 대회 최고 수준) |
| 아르헨티나 | 13% (챔피언의 멘탈리티, 단 주력 선수들의 고령화) |
| 잉글랜드 | 11% |
| ... |
fable-5의 결론을 한 줄로 요약하면:
"한 팀을 고른다면 스페인. 하지만 확률을 이해하고 있다면, 진짜 답은 『우승 확률이 5할을 넘는 팀은 존재하지 않는다』입니다."
대부분의 사람에게 우승 예측을 물으면, 팀 이름과 감정이 돌아옵니다. 좋은 모델에게 물으면, 사전 분포(Prior distribution)·조정항(Adjustment term)·신뢰 구간(Confidence interval), 그리고 "78%의 확률로 나는 틀린다"라는 정직한 신고가 돌아옵니다.
AI 시대에 정말로 희소한 것은 답 그 자체가 아니라, 판단의 구조입니다. 답은 누구나 낼 수 있습니다. 불확실성을 테이블 위에 올려 보여주는 것이, 신뢰할 수 있는 도구와 아첨하는 도구의 갈림길입니다.
한 달 후에 이 기사를 공개 채점하겠습니다. 스페인이 우승하면 모델의 공이고, 틀린다면——뭐, 본인이 처음부터 말했습니다. 스페인조차 74%의 확률로 우승하지 못한다고.
(데이터 출처: BetMGM / DraftKings / FanDuel 개막일 배당률, 골드만삭스 정량 모델, ESPN)
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기