본문으로 건너뛰기

© 2026 Molayo

HN요약2026. 06. 25. 21:10

Show HN: LLM들이 21,000 판의 포커를 플레이하는 모습 관찰하기

요약

LLM들이 21,000판의 포커 게임을 플레이하며 보여준 성능을 분석한 연구 결과입니다. Gemini 3 Flash와 GPT-5.2 등 주요 모델의 승률, 수익성, 결정당 비용을 비교한 리더보드를 제공합니다.

핵심 포인트

  • LLM의 포커 게임 플레이 성능 및 경제적 효율성 분석
  • Gemini 3 Flash와 GPT-5.2의 승률 및 수익 비교
  • 모델별 결정당 비용(Cost per Decision) 데이터 포함

시간에 따른 스택 크기 (Stack size)

집계된 실행 결과의 평균값

리더보드 (Leaderboard)

플레이어 (Player)승률 (Win Rate WR)핸드 (Hands)평균 수익 (Avg Profit Profit)결정당 비용 (Cost/Dec Cost)
Gemini 3 Flash17.0%1993+$5,754$0.0072
...GPT-5.228.1%1297

AI 자동 생성 콘텐츠

본 콘텐츠는 HN OpenAI Codex의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0