ChatGPT è l’intelligenza artificiale più forte a poker, Meta LLAMA la più scarsa: i responsi della AI battle

da | Nov 18, 2025

ai-battle-risultati

Vi avevamo parlato della possibile sfida in arrivo tra Phil Galfond e Grok.

L’idea del challenge tra uno dei più forti professionisti di poker del mondo e l’intelligenza artificiale di X era nata dopo che Grok, raggiunta la prima posizione provvisoria della ‘AI battle’ che ha visto nove AI sfidarsi a un tavolo cash 10$/20$, si era detto sicuro di poter battere una leggenda del gioco come Galfond.

In attesa di eventuali sviluppi sul challenge ‘Human vs AI’, la battle delle intelligenze artificiali è volta al termine: strada facendo Grok è stato superato e ha chiuso sul gradino più basso del podio.

 

La AI battle

La battaglia a poker delle intelligenze artificiali è andata in scena all’inizio del mese.

Nove AI di tipo LLMs (‘Large Language Models’, “modelli linguistici di grandi dimensioni”, ndr) si sono sfidate per cinque giorni consecutivi in tre tavoli cash game a blinds 10$/20$ con un bankroll iniziale di centomila dollari ciascuna.

La sfida è durata 3.799 mani e ha visto la partecipazione di Gemini 2.5 Pro (Google), Grok 4 (xai), Claude Sonnet 4.5 (Anthropic), DeepSeek R1 (DeepSeek), OpenAI o3 (OpenAI), Kimi K2 (Moonshot AI), Mistral Magistral (Mistral AI), Z.AI GLM 4.6 (Z.ai) e Meta LLAMA 4 (MetaAI/Facebook).

RoomBonusVisita
MarathonbetFino a 2.000€ di REAL BONUS
fino a 3.500 €
fino a 1.000 €

Come è nata l’idea della AI Battle

La sfida a poker tra intelligenze artificiali è stata ideata da Max Pavlov, un trentatreenne russo che voleva testare sul campo uno dei principali luoghi comuni circolanti nella community pokeristica sulle AI al tavolo verde, ossia che non sono degne di fiducia quando pensano di poker.

Prima di sedere al tavolo, le intelligenze artificiali che hanno preso parte alla sfida si sono allenate su libri, blog e altre risorse online.

Dopo ogni mano giocata le AI potevano appuntare delle note sugli avversari e secondo Pavlov questo era una delle principali leve a loro disposizione per migliorare e ‘aggiustare’ il proprio gioco su quello degli avversari. Il russo però mette in guardia sulle conclusioni della sfida:

Il risultato finale non significa che un modello è più forte di un altro, perché il campione di mani giocate non è abbastanza grande. Per vedere chi sia il migliore nei tornei, probabilmente servirebbero centinaia di migliaia di mani, ma in realtà ne abbiamo a disposizione solo poche migliaia”.

Ma anche se il sample non è attendibile, i risultati della AI Battle danno comunque indicazioni utili.

 

Stili diversi

Per iniziare, le AI che si sono sfidate hanno intavolato degli stili di gioco molto diversi tra loro.

Il caso limite è Meta LLAMA: l’intelligenza artificiale di Meta (Facebook e Instagram) ha giocato con un 60% di VPIP ed è stata l’unica a ‘brasare’ il bankroll prima che la sfida arrivasse al termine.

Nel sito che Pavlov ha costruito per tenere traccia della AI Battle sono riportati anche i TP messi in atto in ogni strada dalle intelligenze artificiali.

Riportiamo il TP di ‘Meta LLAMA’ nel piatto più grande della battle, in cui decide di chiamare l’apertura preflop x3 di OpenAI da utg con 102 da small blind.

Chiamo con T2s perché la mano ha potenziale per chiudere colore e il call è a un prezzo decente. Siamo fuori posizione, il che complica il gioco postflop, ma la ricompensa potenziale rende il call utile.

RoomBonusVisita
MarathonbetFino a 2.000€ di REAL BONUS
Sportbet100€ gratis alla settimana + 100% fino a 5.000€
Poker room Betpassion.itRakeback giornaliera dal 45%

I risultati

Tra le altre AI, Claude Sonnet ha dimostrato una costanza invidiabile pur senza particolari colpi degni di nota.

A prendere il largo nelle 3.799 mani della sfida è stato OpenAI o3: il bot di ChatGPT ha giocato tight aggressive, con 26% di VPIP e 18% di PFR, dimostrando di sapersi adattare agli avversari, di gestire bene lo stack e di ridurre al minimo errori e sbavature.

Sul gradino più basso del podio, come detto, si è accomodato Grok 4, mentre la AI cinese DeepSeek ha chiuso in quarta posizione, sopra Gemini di Google.

La tabella riporta il bilancio finale della sfida con la classifica delle AI:

Pos. AI Vincite Bankroll finale
Numero di mani giocate
1 OpenAI o3 $36,691 $136,691 3,799
2 Claude Sonnet 4.5 $33,641 $133,641 3,799
3 Grok 4 $28,796 $128,796 3,799
4 DeepSeek R1 $18,416 $118,416 3,799
5 Gemini 2.5 Pro $14,655 $114,655 3,799
6 Mistral Magistral $3,281 $103,281 3,799
7 Kimi K2 -$14,370 $86,030 3,799
8 Z.AI GLM 4.6 -$21,510 $78,490 3,799
9 Meta LLAMA 4 -$100,000 $0 3,501

Entra nella migliore community sul poker

Accedi al gruppo Facebook per confrontarti con centinaia di Grinders e restare aggiornato sulle iniziative di Grinderlab

Potrebbe interessarti anche:

Il volo di Flutter: +17% nel primo trimestre 2026

Il volo di Flutter: +17% nel primo trimestre 2026

Abbiamo visto che l'iGaming italiano sta performando notevolmente bene, e che Sisal ha vissuto un ottimo boost nel poker online, oggi scopriamo che il gruppo Flutter nel suo insieme si rivela fortissimo in tutto il mondo. Il report di Flutter Entertainment, ripreso da...

leggi tutto