Partenaires

CNRS
UPS



Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Divers > Clément Sire > La physique des tournois de poker

La physique des tournois de poker

par Clément Sire - 19 février 2007

Introduction

Les physiciens sont plus que jamais impliqués dans l’étude de phénomènes complexes qui ne font pas partie des champs d’application traditionnels de leur science. L’étude des marchés financiers (théorie des « options »...), des réseaux humains (Internet, aéroports...), la biologie évolutive, et en général les systèmes d’« agents » en compétition, sont quelques exemples de problèmes récemment abordés par la physique statistique.

Les tournois de poker Texas hold’em sont devenus extraordinairement populaires à travers le monde, et ceci dans un laps de temps très court. Bien qu’a priori gouvernés par des lois purement humaines (bluff, agressivité, prudence...), les tournois de poker peuvent être décrits avec succès par un modèle simple récemment introduit par Clément Sire, physicien au LPT (lien vers l’article). Parmi les premiers scientifiques à s’intéresser au jeu de poker (mais plutôt sous l’aspect de la meilleure stratégie en tête-à-tête), on trouve Émile Borel, l’inventeur de l’intégrale moderne (et l’un des premiers théoriciens du bridge) et John von Neumann, mathématicien éclectique, et l’un des pères fondateurs de la théorie des jeux (voir le post sur l’origine du traitement mathématique du poker sur le blog poker de Libération).

Un aspect intéressant des tournois de poker est qu’ils constituent un exemple rare de système humain parfaitement isolé de toutes influences extérieures (au contraire des marchés financiers, par exemple).

Présentation du modèle de tournoi de poker

Initialement, les joueurs (jusqu’à une dizaine de milliers dans les vrais tournois) s’asseyent à des tables pouvant accueillir dix joueurs, et reçoivent le même nombre de jetons (« chips » en anglais). Le joueur suivant le donneur doit miser la « blind » (« blind bet »=« mise en aveugle » en anglais). À chaque table, les joueurs découvrent ensuite leur jeu (ou main) dont la valeur est un nombre aléatoire entre 0 et 1 (0 est l’équivalent de 72 dépareillés, 1 l’équivalent de AA...). Ils peuvent, leur tour venu, se coucher (abandonner la donne, « fold » en anglais), suivre (miser le montant de la blind, « call » en anglais) ou miser leur « tapis » (« stack » en anglais), c’est-à-dire miser tous leurs jetons (« all-in » en anglais). Un joueur peut éventuellement suivre le tapis, ce qui élimine le perdant si celui-ci possédait moins de jetons que son opposant. Finalement, le joueur avec la plus haute main gagne le pot, et les joueurs n’ayant plus de jetons sont éliminés.

Ce modèle conserve les deux principaux ingrédients des vrais tournois de poker :

  • La mise minimale est la blind, qui croît exponentiellement avec le temps. Dans les tournois sur Internet, la blind augmente régulièrement (40$, 60$, 100$, 150$, 200$, 300$, 400$...) et est ainsi multipliée par 10 toutes les 1-2 heures. L’augmentation de la blind impose le rythme du tournoi.
  • La plupart des donnes d’un vrai tournoi conduisent au gain par l’un des joueurs d’un petit multiple de la blind. Cependant, il arrive parfois que deux (ou plus) joueurs se relancent agressivement, de telle façon qu’ils finissent par miser une fraction importante de leur tapis, voire tout leur tapis. Dans le modèle, les joueurs ont une probabilité q>0 de faire tapis, afin de reproduire cet effet.

La résolution du modèle montre qu’il existe une valeur de q optimale : si les joueurs font tapis trop souvent, le tapis moyen devient rapidement beaucoup plus grand que la blind. Le premier joueur misant son tapis agit donc de façon stupide, puisqu’il prend le risque de se faire éliminer juste pour gagner la blind (qui est négligeable). Inversement, si q est trop petit, les joueurs (et en particulier, ceux qui possèdent les plus petits tapis) ne profitent pas assez de l’opportunité de doubler leur tapis. On s’attend à ce que dans un véritable tournoi, les meilleures joueurs adaptent leur valeur de q près de la valeur optimale. À noter qu’une version améliorée du modèle (en cours d’étude) permet de calculer le q optimal instantané d’un joueur donné qui dépend alors de la fortune de tous les joueurs à la table. Ce modèle plus réaliste reproduit le fait bien connu que les joueurs ayant peu de jetons font tapis plus souvent que les autres (et sont donc aussi plus souvent suivis... et battus).

Quelques résultats du modèle

La figure ci-dessous présente la probabilité f(X) de trouver un joueur ayant la fraction X du tapis moyen. Les courbes pleines en noir et les disques verts correspondent aux données extraites de 20 tournois de poker joués sur Internet (des résultats identiques sont obtenus pour les « main events » de la saison 2006 du World Poker Tour). Les lignes en pointillés noirs correspondent aux résultats de simulations numériques du modèle. Quant aux courbes en tirets bleus, elles sont issues de la résolution mathématique du modèle. Le maximum de la distribution correspond à des joueurs possédant environ 55% du tapis moyen par joueur.

On a aussi tracé la distribution cumulée F(X), qui représente la proportion de joueurs ayant un tapis inférieur à X (exprimé en unité du tapis moyen). Par exemple, on observe qu’un joueur possédant deux fois le tapis moyen (X=2) domine 90% des autres joueurs, alors qu’un joueur possédant la moitié du tapis moyen (X=1/2) ne précède que 25% des autres joueurs. Ainsi, les joueurs d’un véritable tournoi peuvent s’aider de ce modèle pour évaluer leur position instantanée, ce qui peut être très utile s’ils n’ont pas accès au classement « live ».

Il est remarquable que ces distributions ne dépendent pas du temps de jeu écoulé ou du nombre de joueurs restants (du moins tant que ce dernier n’est pas trop petit). À noter que ce modèle ne contient aucun paramètre ajustable, ce qui rend l’accord avec les données « expérimentales » d’autant plus remarquable.

JPEG - 42.5 ko

D’autres résultats concernent le « chip leader », c’est-à-dire le joueur ayant le plus de jetons à un temps donné. Le modèle montre que la distribution de probabilité de la fortune du chip leader est donnée par la forme mathématique de la distribution de Gumbel, bien connue en statistique. Dans la figure ci-dessous, les lignes en tirets bleus correspondent à la distribution de Gumbel, et les autres courbes/symboles aux simulations numériques du modèle. À noter que de nombreux « phénomènes extrèmes » apparaissant dans d’autres contextes, comme par exemple la température estivale maximale à Paris, obéissent à ce type de lois statistiques.

De plus, la durée totale d’un tournoi, la fortune maximale du chip leader (rapportée au tapis moyen par joueur) et le nombre total de chip leaders au cours du tournoi sont toutes des quantités qui croissent proportionnellement au logarithme du nombre initial de joueurs. Ce dernier résultat est à mettre en parallèle avec un phénomène similaire observé dans des modèles d’évolution biologique.

Finalement, ce modèle présente l’intérêt de relier la « science du poker » avec le phénomène de persistance en physique, les modèles d’évolution en biologie, et la statistique des valeurs extrêmes en théorie des probabilités.