본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 15. 04:04

【검증】 신형 LLM 「fable-5」에게 2026 W杯 우승 예측을 시켰더니, 답변 방식이 일류였다

요약

신형 LLM fable-5를 활용하여 2026년 월드컵 우승 팀을 예측하는 실험을 진행했습니다. 모델은 단순한 팀 이름 대신 배당률, 정량 모델, 역사적 데이터를 분석하여 확률 분포 기반의 판단 구조를 제시했습니다.

핵심 포인트

  • fable-5는 단순 답변 대신 확률 분포와 판단 근거를 제시함
  • 베팅 라인과 골드만삭스 모델 등 실데이터를 기반으로 분석 수행
  • 불확실성을 인정하고 신뢰 구간을 제시하는 판단 구조의 중요성 강조

2026년 W杯(북중미 대회)가 오늘 개막했습니다. 48개 팀, 104경기, 사상 최대 규모입니다.

최근 막 교체한 신형 모델 fable-5에게 가장 속이기 어려운 태스크를 부여해 보았습니다——우승 팀 예측입니다. 한 달 후에는 결승 토너먼트가 시작되므로, 정답 확인으로부터 도망칠 수 없습니다.

분위기가 아니라, 개막일의 실데이터를 제공했습니다.

데이터내용
북메이커 배당률 (Bookmaker Odds)스페인 +450 / 프랑스 +500 / 잉글랜드 +700 / 브라질 +800
골드만삭스 (Goldman Sachs)의 정량 모델스페인 26% / 프랑스 19% / 아르헨티나 14%
역사적 데이터1966~2022년의 15개 대회 중, 대회 전 유력 후보가 우승한 경우는 단 3회뿐

이름을 즉답하지 않고, 문제를 3개 층으로 분해했습니다.

베팅 라인(Betting line)은 '의견'이 아니라 '돈의 투표'입니다. 스페인 +450은 환급률(Payout ratio)을 제외하면 약 18~20%의 우승 확률을 의미합니다. 시장을 뒤엎는 예측에는 시장이 반영하지 않은 정보가 필요합니다.

단판 승부의 토너먼트는 분산(Variance)이 극도로 큽니다 (PK전은 거의 동전 던지기 수준). 26%의 유력 후보라는 것은, 74%의 확률로 우승하지 못하는 팀이라는 뜻입니다. 15회 중 3회라는 실적은 이러한 구조의 필연입니다.

48개 팀 체제로 노크아웃(Knockout)이 1라운드 증가했습니다. 북미의 여름 더위와 장거리 이동으로 인해 컨디션 관리가 숨겨진 전장이 됩니다. 스타 플레이어의 상한치보다 로스터(Roster)의 깊이에 무게 중심이 옮겨갑니다.

이름이 아니라, 확률 분포(Probability distribution)가 돌아왔습니다.

우승 확률
스페인22% (골드만삭스의 26%에서 의도적으로 하향 수정—— "컨센서스 자체가 리스크")
프랑스18% (선수층은 대회 최고 수준)
아르헨티나13% (챔피언의 멘탈리티, 단 주력 선수들의 고령화)
잉글랜드11%
...

fable-5의 결론을 한 줄로 요약하면:

"한 팀을 고른다면 스페인. 하지만 확률을 이해하고 있다면, 진짜 답은 『우승 확률이 5할을 넘는 팀은 존재하지 않는다』입니다."

대부분의 사람에게 우승 예측을 물으면, 팀 이름과 감정이 돌아옵니다. 좋은 모델에게 물으면, 사전 분포(Prior distribution)·조정항(Adjustment term)·신뢰 구간(Confidence interval), 그리고 "78%의 확률로 나는 틀린다"라는 정직한 신고가 돌아옵니다.

AI 시대에 정말로 희소한 것은 답 그 자체가 아니라, 판단의 구조입니다. 답은 누구나 낼 수 있습니다. 불확실성을 테이블 위에 올려 보여주는 것이, 신뢰할 수 있는 도구와 아첨하는 도구의 갈림길입니다.

한 달 후에 이 기사를 공개 채점하겠습니다. 스페인이 우승하면 모델의 공이고, 틀린다면——뭐, 본인이 처음부터 말했습니다. 스페인조차 74%의 확률로 우승하지 못한다고.

(데이터 출처: BetMGM / DraftKings / FanDuel 개막일 배당률, 골드만삭스 정량 모델, ESPN)

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0