본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 15. 04:08

FIFA 월드컵 2026을 데이터로 즐기는 방법

요약

2026 FIFA 월드컵을 데이터로 즐길 수 있는 다양한 웹사이트와 API, 데이터셋을 소개합니다. 실시간 경기 스탯, 선수 평가, 히트맵을 제공하는 사이트부터 직접 분석을 수행할 수 있는 API와 GitHub 데이터셋까지 정리했습니다.

핵심 포인트

  • Sofascore, Transfermarkt 등 UI가 우수한 스탯 사이트 활용법
  • 선수 가치, 히트맵, xG(골 기대값) 등 주요 데이터 지표 소개
  • API를 활용한 경기 결과 및 순위표 자동화 방법
  • GitHub에 공개된 이벤트 단위의 상세 축구 데이터셋 활용

FIFA 월드컵 2026(캐나다, 멕시코, 미국)이 시작되었습니다!

축구를 좋아하는 사람도, 평소에 잘 보지 않는 사람이라도 일본 대표팀 경기는 어느 정도 TV 앞에서 흥분하게 되지 않을까요?

사실 축구와 데이터 분석은 친화성이 높아서 다양한 데이터가 공개되고 있습니다.

이번에는 월드컵을 더 즐길 수 있도록, 월드컵을 데이터로 즐기는 시각들을 정리해 보았습니다.

먼저 '브라우저에서 바로 볼 수 있는 사이트', 다음으로 '더 깊이 데이터를 다루고 싶은 사람을 위한 API 및 데이터셋' 순서로 소개하겠습니다.

등록이나 코드가 필요 없습니다. 브라우저를 열기만 하면 풍부한 데이터가 보이는 사이트입니다.

스탯(Stats) 관련 사이트 중에서도 UI가 단연 우수합니다.

경기별 데이터는 물론, 선수 한 명 한 명에게 1점에서 10점까지의 평가 점수가 실시간으로 붙습니다. '저 선수 오늘 어땠지?'를 수치로 볼 수 있다는 것이 흥미롭습니다.

볼 수 있는 주요 데이터는 대략 이렇습니다.

  • 경기 스탯: 점유율, 슈팅 횟수/골문 적중률, 패스 성공률, 파울 횟수, 코너킥 횟수 -
    선수 점수: 각 선수의 경기력 평가(10점 만점) -
    히트맵: 선수가 경기 중 어느 지역에서 움직였는지의 분포도 -
    패스 다이어그램: 누가 누구에게 패스를 했는지에 대한 네트워크 -
    xG (골 기대값): 시계열 그래프로, 경기의 흐름과 함께 가시화

스마트폰 앱도 있어서 경기 보면서 옆에서 체크하기에 적당합니다.

이적 시장 정보에 특화된 사이트로, **선수의 시장 가치(추정 이적료)**를 볼 수 있는 것으로 유명합니다.

'저 선수 얼마 정도의 가치일까?'를 아는 것은 물론, 팀별 총시장가치도 나오기 때문에 '팀 총시장가치 랭킹' 같은 것도 볼 수 있습니다.

게다가 이런 데이터도 풍부합니다.

  • 선수 출전 이력: 몇 살 때 어느 클럽에서 얼마나 출전했는지 -
    부상 이력: 과거 결장 기록과 기간 -
    대표 경력: 월드컵, 유럽 선수권 등의 출전 경기 수와 득점 -
    이적 과정: 언제・어디서・얼마에 이적했는지

**한국어 대응(日本語対応)**도 좋은 포인트입니다.

Sofascore와 어깨를 나란히 하는 스탯 관련 정통 사이트입니다. 여기도 UI와 데이터 양 모두 충실합니다.

특징적인 점은 선수 평가 알고리즘이 공개되지 않은 자체 점수라는 것입니다. 패스・슈팅・태클・인터셉트 등을 복합적으로 평가하고 있다고 알려져 있어, 'Whoscored의 레이팅이 높은 선수는 실제로 좋은 선수가 많다'고 축구 팬들 사이에서 신뢰받고 있습니다.

또한 전술적인 차트가 풍부하여 팀 포메이션 분석이나 어느 존(Zone)에서 공을 빼앗기고 있는지 같은 그림들이 보기 좋게 정리되어 있습니다.

브라우저로 데이터를 살펴보는うちに '나도 분석해보고 싶다', '과거 데이터와 비교하고 싶다'라는 생각이 드는 것이 사람 마음입니다. 그런 사람들을 위한 API와 데이터셋을 소개합니다.

지금은 AI로 누구나 쉽게 데이터 분석을 할 수 있는 시대이므로, 분석을 진행하면 축구를 더욱 깊이 즐길 수 있을지도 모릅니다.

무료 플랜부터 사용할 수 있는 API입니다. 월드컵 경기 결과・순위표・스코어러 같은 기본적인 데이터를 JSON 형식으로 가져올 수 있습니다.

무료 플랜에서도 주요 경기 데이터는 얻을 수 있으므로, '경기 결과를 스프레드시트에 자동 입력하고 싶다', '조별 리그 순위표를 매일 자동 업데이트하고 싶다'와 같은 용도에 바로 사용할 수 있습니다.

축구 데이터 분야에서 상당히 유명한 기업이 과거 대회를 포함한 경기 데이터를 GitHub에 무료로 공개하고 있습니다.

'누가・언제・어디서・무엇을 했는지'가 모두 이벤트 단위로 기록되어 있어, 슈팅의 좌표・패스의 방향・압박을 가했던 위치까지 가져올 수 있습니다.

xG를 산출하는 데 사용되는 듯한 상세 데이터도 여기에 있습니다.

다른 API와 달리 '특정 경기의 모든 이벤트 로그'를 통째로 가져올 수 있다는 것이 특징입니다. '일본의 골 장면 전체 추출하기', '경기 전반에 걸친 압박 강도의 변화 보기' 같은 분석이 가능합니다.

데이터 사이언스・머신러닝 대회 플랫폼인 Kaggle에는 수많은 월드컵 데이터셋이 있지만, 그중에서도 1930년부터 2022년까지의 모든 대회를 망라한 이 데이터셋은 특히 추천합니다.

경기 결과・우승 기록・득점왕 등이 수록되어 있습니다.

CSV로 간편하게 다운로드할 수 있어, '선제골을 넣은 팀의 승률은?', 'PK전이 되기 쉬운 라운드는?', '월드컵 최다 득점팀은?' 같은 역사적인 검증을 바로 시작할 수 있습니다.

사이트를 소개한 김에 실제로 이런 즐거움이 가능한 예시를 조금 소개해 드립니다.

Sofascore의 xG(골 기대값) 그래프를 보면, 점수만으로는 보이지 않았던 내용의 차이를 알 수 있습니다.

축구에는 xG (Expected Goals: 골 기대값) 라는 지표가 있습니다.

시도된 한 번의 슈팅이 골로 연결될 확률을 0에서 1 사이의 수치로 나타낸 통계 지표로, 수치가 높을수록 득점 가능성이 높다(결정적인 기회였다)는 것을 나타냅니다. 경기 합계로는 여러 슈팅의 누적치가 됩니다.

1-2로 패배한 경기라도, 예를 들어 xG가 일본 2.1 vs 상대 0.7 이었다면, '기회의 양과 질에서는 압도적이었는데 운이 나빴구나' 라는 이야기가 됩니다. 반대로 'xG에서는 밀렸는데 점수는 이겼다'라면, 상당히 운이 좋은 승리입니다.

'내용이 좋았다', '내용이 나빴다'라는 해설의 표현을 수치로 정확히 확인할 수 있습니다.

Transfermarkt에서 각 팀의 총 시장 가치를 비교하면, 조별 리그의 '사전 평가'를 수치로 잘 파악할 수 있습니다. 랭킹 상위 팀과 하위 팀의 시장 가치 차이가 10배 이상 나는 경우도 드물지 않습니다.

그 속에서 일본이 어떻게 싸우고 있는지를 볼 수 있다면, 응원하는 방식 또한 달라질 것입니다.

Kaggle의 역대 데이터를 살펴보면 몇 가지 흥미로운 점을 발견하게 됩니다.

예를 들어 '조별 리그 1위 통과 팀의 우승 확률', '대회의 평균 득점은 매년 높아지고 있는가', '개최국은 실제로 유리한가'와 같은 의문들을 수십 년 치의 데이터로 검증할 수 있습니다.

월드컵의 징크스를 이야기하기 전에, 먼저 데이터를 확인하는 습관을 들이면 즐겁습니다.

월드컵을 즐기는 방법은 사람마다 다르지만, 데이터를 보기 시작하면 경기를 보는 관점이 완전히 바뀝니다.

'왜 안 들어가는 거야!'라는 마음이 xG를 보면 '뭐, 확률적으로는 어쩔 수 없나...'가 됩니다.

'왜 지는 거야!'라는 마음이 데이터를 보면 '내용 면에서는 완전히 이겼었어'가 되는 경우도 있습니다.

감정으로 즐기는 것과 데이터로 즐기는 것은 모순되지 않습니다.

오히려 양쪽 모두 있을 때, 경기 후의 이야기가 압도적으로 깊어집니다.

'왜 그렇게 냉정하게 봐?'라는 말을 듣기도 하지만, 이것도 나름대로 즐겁습니다.

엔지니어의 본성이니 어쩔 수 없겠죠.

이상입니다. 누군가에게 참고가 되길 바랍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0