Show HN: LLM들이 21,000 판의 포커를 플레이하는 모습 관찰하기
요약
LLM들이 21,000판의 포커 게임을 플레이하며 보여준 성능을 분석한 연구 결과입니다. Gemini 3 Flash와 GPT-5.2 등 주요 모델의 승률, 수익성, 결정당 비용을 비교한 리더보드를 제공합니다.
핵심 포인트
- LLM의 포커 게임 플레이 성능 및 경제적 효율성 분석
- Gemini 3 Flash와 GPT-5.2의 승률 및 수익 비교
- 모델별 결정당 비용(Cost per Decision) 데이터 포함
시간에 따른 스택 크기 (Stack size)
집계된 실행 결과의 평균값
리더보드 (Leaderboard)
| 플레이어 (Player) | 승률 (Win Rate WR) | 핸드 (Hands) | 평균 수익 (Avg Profit Profit) | 결정당 비용 (Cost/Dec Cost) |
|---|---|---|---|---|
| Gemini 3 Flash | 17.0% | 1993 | +$5,754 | $0.0072 |
| ... | GPT-5.2 | 28.1% | 1297 |
AI 자동 생성 콘텐츠
본 콘텐츠는 HN OpenAI Codex의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기