La théorie des jeux appliquée à la Bataille Navale : stratégies mixtes et équilibre de Nash
La Bataille Navale semble à première vue un jeu de hasard : on tire à l’aveugle, on espère toucher. Pourtant, derrière cette apparente simplicité se cache un problème mathématique fascinant qui a retenu l’attention de certains des plus grands esprits du XXe siècle. La théorie des jeux, discipline fondée par John von Neumann et formalisée par John Nash, offre un cadre rigoureux pour analyser et optimiser nos décisions sur notre Bataille Navale en ligne.
Von Neumann, Nash et les fondations de la théorie des jeux
En 1928, le mathématicien hongrois John von Neumann publie son théorème du minimax, pierre angulaire de la théorie des jeux. Ce théorème établit que dans tout jeu à deux joueurs à somme nulle (ce que gagne l’un, l’autre le perd), il existe une stratégie optimale pour chaque joueur. La Bataille Navale correspond parfaitement à ce modèle : la victoire de l’un est la défaite de l’autre.
Vingt ans plus tard, John Nash généralise ce résultat en démontrant l’existence d’un équilibre dans tout jeu fini à plusieurs joueurs. L’équilibre de Nash désigne une situation où aucun joueur ne peut améliorer son résultat en changeant unilatéralement de stratégie. Ce concept, qui lui vaudra le prix Nobel d’économie en 1994, s’applique directement à la Bataille Navale, aussi bien dans la phase de placement que dans la phase de tir.
L’idée clé est que si vous jouez une stratégie « prévisible », votre adversaire peut l’exploiter. Réciproquement, toute tentative d’exploitation vous expose à un contre. L’équilibre se trouve dans la randomisation.
Stratégies pures contre stratégies mixtes
En théorie des jeux, une stratégie pure désigne un plan d’action déterministe : « je place toujours mon porte-avions en A1-A5 horizontalement » ou « je commence toujours par tirer au centre ». Le problème d’une stratégie pure est évident : dès que l’adversaire la détecte, il peut s’y adapter parfaitement.
Une stratégie mixte, en revanche, consiste à choisir entre plusieurs actions possibles selon une distribution de probabilités. Par exemple, placer son porte-avions horizontalement 60 % du temps et verticalement 40 % du temps, en variant les positions selon des pondérations précises. L’adversaire ne peut alors plus prédire votre placement, même s’il connaît votre stratégie générale.
Les conséquences pratiques sont immédiates :
- Ne jamais reproduire le même placement deux parties de suite contre le même adversaire
- Varier les orientations de vos navires de manière aléatoire
- Alterner entre placement périphérique, central et dispersé
- Éviter les schémas reconnaissables comme placer tous les navires parallèlement
Le paradoxe élégant de la théorie des jeux est qu’en acceptant de jouer « aléatoirement », vous jouez en réalité de manière optimale.
L’équilibre de Nash dans le placement des navires
Considérons la phase de placement comme un jeu en soi. Chaque joueur choisit simultanément une configuration de navires sur sa grille 10×10. Le nombre de configurations possibles est astronomique : on estime qu’il existe environ 30 milliards de placements valides différents. L’équilibre de Nash dans ce contexte serait une distribution de probabilités sur l’ensemble de ces configurations telle qu’aucun joueur ne gagne à dévier.
En pratique, calculer cet équilibre exact est infaisable. Cependant, on peut en déduire des principes directeurs. L’équilibre de Nash pour le placement implique que chaque case de la grille devrait avoir, en moyenne, la même probabilité d’être occupée par un navire. Autrement dit, un placement à l’équilibre ne favorise ni le centre, ni les bords, ni aucune zone particulière.
Ce résultat théorique contredit nos intuitions : la plupart des joueurs ont tendance à éviter les bords et à concentrer leurs navires au centre. Ce biais crée une opportunité d’exploitation pour qui connaît les statistiques. Pour une analyse détaillée de ces biais, consultez notre article sur les probabilités et mathématiques de la Bataille Navale.
L’information incomplète : le cœur du problème
La Bataille Navale est un jeu à information incomplète : vous ne connaissez pas la position des navires adverses, et votre adversaire ignore la vôtre. C’est cette asymétrie d’information qui rend le jeu stratégiquement riche. Contrairement aux échecs ou à Othello, où toute l’information est visible, la Bataille Navale ressemble davantage au poker : il faut raisonner sur ce que l’adversaire pourrait avoir fait.
Cette structure d’information incomplète a des conséquences profondes :
- La mise à jour bayésienne : chaque tir (touché ou manqué) vous donne de l’information. Un joueur rationnel devrait mettre à jour ses croyances sur la position des navires adverses après chaque résultat, selon la règle de Bayes.
- L’inférence stratégique : les tirs de votre adversaire révèlent sa stratégie. Un joueur qui tire systématiquement au centre croit probablement que vous y avez placé vos navires.
- Le signalement involontaire : votre propre séquence de tirs peut révéler votre mode de pensée et, indirectement, vos tendances de placement.
Les jeux à information incomplète sont au cœur de la théorie des jeux moderne. Le prix Nobel de John Harsanyi en 1994, partagé précisément avec Nash, récompensait ses travaux sur ces jeux bayésiens où les joueurs ont des croyances sur l’état du monde plutôt qu’une connaissance certaine.
La randomisation optimale des tirs
La phase de tir pose un problème d’optimisation fascinant. Naïvement, on pourrait penser que tirer aléatoirement sur les cases restantes est la meilleure stratégie. Mais la théorie des jeux montre que toutes les cases ne se valent pas : certaines positions sont plus susceptibles de contenir un navire, compte tenu des contraintes géométriques.
La stratégie optimale de tir repose sur un calcul de densité de probabilité. Pour chaque case non encore tirée, on calcule le nombre de configurations de navires restants compatibles avec les résultats déjà obtenus. Les cases qui apparaissent dans le plus grand nombre de configurations ont la plus forte probabilité de contenir un navire et doivent être ciblées en priorité. C’est le principe qui sous-tend l’algorithme chasse/cible, utilisé par les intelligences artificielles les plus performantes.
Ce calcul se complexifie considérablement au fil de la partie. Après un « touché », le nombre de configurations possibles chute brutalement, et les cases adjacentes au touché voient leur probabilité exploser. La stratégie optimale bascule alors du mode « recherche » (tirs espacés) au mode « destruction » (tirs groupés autour du touché).
Le concept de stratégie dominante
En théorie des jeux, une stratégie est dite dominée s’il en existe une autre qui donne un meilleur résultat quelle que soit l’action de l’adversaire. En Bataille Navale, certaines stratégies sont clairement dominées :
- Tirer deux fois au même endroit est évidemment dominé (aucune information nouvelle)
- Ignorer un « touché » pour continuer à chercher ailleurs est dominé : la valeur informationnelle d’un tir adjacent au touché est toujours supérieure
- Tirer uniquement sur des cases adjacentes en mode recherche est dominé par la technique de parité (cases en damier) qui couvre la grille plus efficacement
Éliminer les stratégies dominées est le premier pas vers le jeu optimal. Ce processus d’élimination itérative, appelé IESDS (Iterated Elimination of Strictly Dominated Strategies), réduit considérablement l’espace des stratégies à considérer et guide naturellement vers de meilleures décisions.
Application pratique : jouer à l’équilibre
Comment appliquer concrètement ces concepts théoriques ? Voici un protocole inspiré de la théorie des jeux pour vos parties de Bataille Navale :
Pour le placement : utilisez un générateur aléatoire (ou lancez un dé) pour déterminer la position et l’orientation de chaque navire. Cela élimine les biais cognitifs et vous rapproche de la stratégie mixte optimale. Si cela vous semble radical, alternez au minimum entre trois ou quatre schémas de placement prédéfinis, choisis aléatoirement.
Pour les tirs : en phase de recherche, adoptez un schéma en damier (parité) qui maximise la couverture. En phase de destruction, tirez systématiquement dans les quatre directions cardinales autour du dernier touché. L’approche est similaire à celle utilisée par l’intelligence artificielle à Othello, où l’algorithme évalue méthodiquement chaque coup possible.
Pour l’adaptation : contre un adversaire récurrent, exploitez ses biais de placement observés lors des parties précédentes, mais n’oubliez pas que lui aussi peut s’adapter. La clé est de trouver le bon équilibre entre exploitation et imprévisibilité.
Les limites de la théorie
Il serait naïf de penser que la théorie des jeux fournit une recette infaillible. Plusieurs limites s’imposent. D’abord, la rationalité parfaite supposée par les modèles ne correspond pas à la réalité : les joueurs humains ont des biais, des émotions, et une capacité de calcul limitée. Ensuite, l’équilibre de Nash est un concept défensif : il garantit qu’on ne peut pas être exploité, mais il ne maximise pas nécessairement le gain contre un adversaire faible.
Contre un débutant qui place systématiquement ses navires au centre, la stratégie à l’équilibre (tirer uniformément) est sous-optimale. Il vaut mieux exploiter le biais en ciblant le centre. Mais contre un expert, cette exploitation devient dangereuse, car il pourrait délibérément placer ses navires en périphérie pour vous piéger.
L’art de la Bataille Navale de haut niveau consiste donc à évaluer le niveau de l’adversaire pour doser entre exploitation et jeu à l’équilibre. C’est ce qu’on appelle en théorie des jeux le problème de l’exploitation optimale, un domaine de recherche encore actif.
Conclusion : la beauté mathématique de la Bataille Navale
La Bataille Navale, loin d’être un simple jeu de hasard, constitue un laboratoire idéal pour explorer les concepts fondamentaux de la théorie des jeux. Stratégies mixtes, équilibre de Nash, information incomplète, mise à jour bayésienne : tous ces outils mathématiques trouvent une application concrète et intuitive sur la grille 10×10.
La leçon principale de la théorie des jeux pour la Bataille Navale est paradoxale : pour jouer de manière optimale, il faut accepter de jouer de manière imprévisible, même pour soi-même. Testez ces principes sur notre Bataille Navale en ligne et découvrez si la théorie résiste à la pratique !