Monte Carlo Pass Search: 축구에서의 3D 반사실적 패스 평가를 위한 궤적 생성 활용
요약
축구 패스 평가를 위해 Monte Carlo Tree Search(MCTS) 개념을 도입한 MCPS 프레임워크를 제안합니다. 3D 트래킹 데이터를 기반으로 반사실적 패스 궤적을 생성하고, 가치 모델을 통해 패스의 잠재적 가치를 분포 형태로 평가합니다.
핵심 포인트
- MCTS 기반의 Monte Carlo Pass Search(MCPS) 프레임워크 제안
- 3D 고충실도 트래킹 데이터를 활용한 반사실적 패스 궤적 생성
- SMART 모델을 적응시켜 월드 모델의 샘플 효율성 및 예측 정확도 향상
- 평균 및 백분위 기반 점수를 통한 분포 인식 가치 귀속 가능
우리는 축구에서의 패스 평가를 Monte Carlo Tree Search (MCTS)와 유사한 평가 문제로 재구성하였으며, 이 구성 요소들은 대부분 기존 문헌에서 다른 이름으로 존재합니다: 가치 모델 (possession value, 점유 가치), 월드 모델 (world model, 공과의 상호작용을 포함한 다중 에이전트 궤적), 그리고 반사실적 행동에 대한 정책 (policy over counterfactual actions, 노이즈를 통한 패스 변형 샘플링). Bundesliga의 3D 공 궤적을 포함한 최초의 공개 고충실도 (high-fidelity) 트래킹 데이터셋을 기반으로, 우리는 Monte Carlo Pass Search (MCPS)를 소개합니다. MCPS는 관찰된 각 패스에 대해 킥 파라미터 (kick parameters)를 추론하고, 실행 변형 (execution variants) 및 옵션 변형 (option variants)을 샘플링하며, 공 조건부 월드 모델 (ball-conditioned world model)을 사용하여 다음 공 상호작용이 일어날 때까지 각 후보를 전방으로 롤아웃 (rollout)하고, 학습된 가치 모델로 결과를 점수화하여 획득한 가치에 대한 분포를 얻습니다. 이 분포는 분석 및 순위 산정에 사용되는 두 가지 상호 보완적인 실행 잉여 (execution-surplus) 점수인 평균 기반 (mean-based) 점수와 백분위 기반 (percentile-based) 점수를 통해 분포 인식 귀속 (distribution-aware attribution)을 가능하게 합니다. 제한된 공개 데이터 하에서 월드 모델의 샘플 효율성 (sample-efficient)을 높이기 위해, 우리는 자율 주행 분야의 이산 토큰 자기회귀 궤적 생성기 (discrete-token, autoregressive trajectory generator, SMART)를 적응시켰으며, 이것이 베이스라인과 비교하여 강력한 best-of-20 예측 정확도를 생성하는 동시에 다운스트림 평가를 위한 완전한 가설적 롤아웃 (fully hypothetical rollouts)을 지원함을 보여줍니다. 우리는 모델 체크포인트와 코드를 공개했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기