HN요약2026. 06. 25. 21:10

Show HN: LLM들이 21,000 판의 포커를 플레이하는 모습 관찰하기

요약

LLM들이 21,000판의 포커 게임을 플레이하며 보여준 성능을 분석한 연구 결과입니다. Gemini 3 Flash와 GPT-5.2 등 주요 모델의 승률, 수익성, 결정당 비용을 비교한 리더보드를 제공합니다.

집계된 실행 결과의 평균값

플레이어 (Player)	승률 (Win Rate WR)	핸드 (Hands)	평균 수익 (Avg Profit Profit)	결정당 비용 (Cost/Dec Cost)
Gemini 3 Flash	17.0%	1993	+$5,754	$0.0072
...		GPT-5.2	28.1%	1297

AI 자동 생성 콘텐츠