Intelligence artificielle DIY imbatable à l'hexapion : Différence entre versions

Version actuelle datée du 10 mai 2024 à 18:06

l'Hexapion est un jeu d'échec simplifié, il sert de support à l'entrainement d'une Intelligence artificielle en boites d'allumettes.

Auteur Antony Le Goïc-Auffret | Dernière modification 10/05/2024 par Nicco

Difficulté

Technique

Durée

3 heure(s)

Disciplines scientifiques

Informatique

l'Hexapion est un jeu d'échec simplifié, il sert de support à l'entrainement d'une Intelligence artificielle en boites d'allumettes.

Difficulté

Technique

Durée

3 heure(s)

Disciplines scientifiques

Informatique

Sommaire

1 Étape 1 - Imprimer les éléments papier du jeu.
2 Étape 2 - Trouvez les pièces du jeu !
3 Étape 3 - Pour imprimer les pièces en 3D
4 Étape 4 - La règle du jeu
5 Étape 5 - Jouez contre l'IA !
6 Étape 6 - etape optionnelle d' utilisation d'une découpeuse laser
7 Étape 7 - add-on découpe laser
8 Comment ça marche ?
9 Éléments pédagogiques
10 Commentaires

Licence : Attribution (CC-BY)

Intelligence artificielle, IA

Matériel et outils
Fichiers

intelligence_artificielle_DIY_imbatable___l_hexapion_modeDemploiExapion2.pdf

Intelligence_artificielle_DIY_imbatable___l_hexapion_Pion.stl

Intelligence_artificielle_DIY_imbatable___l_hexapion_perle.stl

Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_1.pdf

Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_2.pdf

Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_3.pdf

Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_4.pdf

Étape 1 - Imprimer les éléments papier du jeu.

Imprimez les éléments suivant en téléchargeant le fichier joint (voir à côté de la liste du matériel) :

le plateau de 9 cases.
les 24 visuels de boîtes d'allumettes (en couleur ou Noir & blanc suivant l'imprimante dont vous disposez).
coloriez les visuels de boîtes d'allumettes si nécessaire.
le tableau de suivi des victoires

Avec une imprimante imprimant en noir et blanc, choisissez le bon fichier et coloriez à la main !

Étape 2 - Trouvez les pièces du jeu !

Pour jouer à l'Hexapion, il vous faut trouver des pièces pour le jeu. Pour cela, vous pouvez fouiller dans votre vieux coffre à jouets ou fouiner dans un magasin pour trouver :

10 perles vertes
14 perles rouges
13 perles bleues
18 perles jaunes
3 pions blancs, 3 pions noirs (de type jeu d'échec ou de dame)

Et sinon, vous pouvez les faire vous-même, par exemple avec une imprimante 3D.

Si vous n’avez ni imprimante 3D, ni perles, imprimez l’image avec les différents cas de figures .

Étape 3 - Pour imprimer les pièces en 3D

Il y a 2 types de pièces :

les pions à imprimer en blanc et en noir
les perles à imprimer en rouge, vert, jeune et bleu.

Voici les quantités :

10 perles vertes
14 perles rouges
13 perles bleues
18 perles jaunes
3 pions blancs, 3 pions noirs

Sources des fichiers : ces fichiers sont librement réutilisable en citant les auteurs (licence CC-By).

le pion une réalisation de rpreston01
la perle une réalisation de 3dPrintNewsNow

Vous trouverez ces deux fichiers joints à cette page à côté du matériel

Intelligence artificielle DIY imbatable l hexapion pionen3D.jpg

Intelligence artificielle DIY imbatable l hexapion perleen3D.jpg

Étape 4 - La règle du jeu

1) Un pion ne peut se déplacer que d’une case en ligne droite (avancer).

2) Un pion peut manger un autre : en diagonale (il prend la place du pion mangé qui est retiré du jeu).

3) Il y a trois manières de gagner à l’Hexapion :

Amener un de ses pions sur la ligne opposée dans le camp adverse
Prendre tous les pions de l’adversaire
Bloquer l’adversaire (qui ne peut plus prendre ou avancer à son tour)

Étape 5 - Jouez contre l'IA !

Déroulement d’une partie :

L’animateur joue le rôle de l’IA. Il a les pions noirs.
Le joueur humain a les pions blancs, c’est lui qui commence la partie et il jouera comme il l’entend.

C'est le joueur humain qui commence car il faut de la "matière" pour que l'IA puisse fonctionner.

L’animateur joue pour l’IA en utilisant les boites d'allumettes qui représentent des états du jeu. Les positions équivalentes du point de vue des actions de l’IA ne sont pas représentées (par exemple, seule la boite avec le pion de gauche avancé est représenté, c’est l’équivalent de la situation avec le pion droit avancé).

Tour 1 : Le joueur humain avance un pion.

Tour 2 : L’IA joue avec une des boites marquées 2.( pour ceux qui n’ont ni imprimante 3D ni perles, regardez le cas de figure correspondant sur la feuille de l’étape 1)

L’animateur prend la boite d'allumette correspondant à la situation de jeu et tire une perle au hasard.

Il joue le coup de la couleur indiquée et garde la perle (il la pose sur la boite par exemple).

(ceux qui n’ont ni imprimante 3D, ni perles, jouez un coup au hasard )

Tour 3 : Il y a deux situations possibles : le joueur humain gagne ou bien la partie continue.

Si le joueur humain gagne, l’IA estime que son coup était mauvais, on retire la perle du jeu, c’est ainsi que l’IA apprend ! ( pour ceux qui n’ont ni imprimante 3D ni perles, barrez le coup que vous avez fait.)
Si la partie continue, l’IA estime que son coup était ni bon ni mauvais, on remet la perle dans la boite ( pour ceux qui n’ont ni imprimante 3D ni perles, laisser.).

Tour 4 : L’IA joue avec une des boites marquées 4. l’animateur tire une perle au hasard et joue pour l’IA. Il n’y a que 2 résultats possibles :

L’IA gagne, dans ce cas, l’IA estime que son coup était bon, on remet la perle dans la boite.
Le jeu peut continuer. l’IA estime que son coup n'était ni bon ni mauvais, on garde la perle (il la pose sur la boîte par exemple).(pour ceux qui n’ont ni imprimante 3D ni perles, marquez un signe pour vous rappeler que la prochaine fois on essaye un autre coup sur le coup que vous avez fait. )

Tour 5 : ce tour possède la même mécanique de jeu que le tour 3.

si l’IA perd, la perle du tour 4 est retirée du jeu sauf si c’est la dernière perle. Les autres perles sont remises dans leurs boîtes.

Etc...

Étape 6 - etape optionnelle d' utilisation d'une découpeuse laser

pour le plaisir des yeux, dans les fichiers, vous avez 4 planches pour la découpe laser, pour une planche de 600*300 et pour du bois de 3 mm. Attention, il manque 1 pièce, il faut refaire la 4 pièce pour chacune des 4 planches (je suis limite en taille de fichier 600*300)

bonne découpe

Fichier:Intelligence artificielle DIY imbatable l hexapion HEXAPION PLANCHE 4.pdf

Étape 7 - add-on découpe laser

je rajoute 2 planches pour la découpe laser pour 2 boites pour les pions du décompte de suivi des victoires, ainsi que 2 planches pour la découpe laser des pions et du plateau

Erreur lors de la création de la miniature : convert-im6.q16: unable to open image `/C:/Users/Atelier/Desktop/logo%20d%C3%A9brouillards.svg': No such file or directory @ error/blob.c/OpenBlob/2701.

Erreur lors de la création de la miniature : convert-im6.q16: unable to open image `/C:/Users/Atelier/Desktop/logo%20d%C3%A9brouillards.svg': No such file or directory @ error/blob.c/OpenBlob/2701.
Erreur lors de la création de la miniature : convert-im6.q16: unable to open image `/C:/Users/Atelier/Desktop/logo%20d%C3%A9brouillards.svg': No such file or directory @ error/blob.c/OpenBlob/2701.

Erreur lors de la création de la miniature : convert-im6.q16: unable to open image `/C:/Users/Atelier/Desktop/logo%20d%C3%A9brouillards.svg': No such file or directory @ error/blob.c/OpenBlob/2701.

Comment ça marche ?

Observations : que voit-on ?

Au fur et a mesure des parties, les perles correspondantes aux mauvais coups sont retirées, l’IA apprend et ne conserve que les coups qui lui font gagner.

L’Hexapion est très fort au bout de 4 à 6 défaites et quasi imbattable à 8-10.

Mise en garde : qu'est-ce qui pourrait faire rater l'expérience ?

Pensez à noter les victoires pour bien mesurer ce qu'il se passe.

Explications

L’Hexapion est un jeu dit « résolu ». Un jeu résolu est un jeu dont le résultat (gagner, perdre ou match nul) peut être correctement prédit à partir de n'importe quelle position, en supposant que les deux joueurs jouent à la perfection. Exemples de jeux résolus : Morpion (qui s’appelle aussi Tic-Tac-Toe ou OXO), puissance 4, Awalé, ...

Les boîtes d’allumettes représentent l’arbre des possibles du jeu dans son intégralité.

Chaque fois que l’IA perd, c’est une des branches de l’arbre qui mène à la défaite de l’IA qui est coupée. Petit à petit il y a de moins en moins de perles dans les boîtes, c’est-à-dire qu’il y a de moins en moins de possibilité de perdre pour l’IA.

Si il ne reste plus qu’une perle par boîte, il est impossible de gagner contre l’IA.

Dans ce système d’IA, c’est l’humain qui crée la donnée nécessaire au système pour apprendre.

C’est un apprentissage qui est supervisé puisque c’est nous qui fixons les règles de ce qu’est un « bon coup » ou un « mauvais coup ».

Notre IA possède également deux atouts de l’informatique :

Une mémoire parfaite
La capacité de répétition

Ainsi la machine ne fait jamais deux fois la même erreur.

Ce jeu permet d’illustrer ce qu’est l’apprentissage par renforcement utilisé en IA, de voir émerger un algorithme optimal et de s’interroger sur la notion d’« intelligence » dans ce système (particulièrement sur l’intelligence d’un système de boîtes d’allumettes !).

Plus d'explications

Conclusion

Pour finir, ce jeu peut également servir à faire émerger des stratégies face à la machine, comme prendre des risques qui paraîtraient illogiques contre un humain, afin d'explorer des scénarios dans lesquels l'IA n'a pas encore appris.

On peut également s'interroger sur la méthode pédagogique ou d'apprentissage à adopter, puisqu’au lieu de « punir » en enlevant la perle indésirable, on pourrait aussi bien « récompenser » en ajoutant par exemple une perle de même couleur à chaque coup gagnant de l'IA. Ce procédé a d’ailleurs un avantage puisque s’il permet d’améliorer les performances de l’IA d’un point de vue statistique, il laisse toujours une opportunité au joueur humain de gagner.

Applications : dans la vie de tous les jours

AlphaGo Zero, un programme qui bat les joueur du jeu de GO, est une nouvelle technique d'apprentissage par renforcement où l'ordinateur apprend en étant son propre professeur.

Vous aimerez aussi

Dans le principe, tous les jeux résolus se prêtent bien aux démonstrations d’apprentissage par renforcement.

Il existe des variantes pour le jeu de Nîm (qui vous permettra de recycler vos allumettes) ou encore du Morpion (mais il vous faudra alors 304 boites d’allumettes).

L’implémentation dans un programme devient alors plus intéressante et vous pourrez trouver des exemples sous Scratch ou en Python.

Dans ce dernier cas, quelques instructions conditionnelles permettront à l’algorithme d’explorer tout seul l’ensemble des options possibles en jouant contre lui-même.

Ce qui permet aux apprenants de coder eux-mêmes leur IA et de voir émerger la stratégie optimale au bout de quelques centaines de parties soit quelques secondes pour l’ordinateur.

Exemples sur scratch en anglais : https://en.scratch-wiki.info/wiki/Artificial_Intelligence

Si on créait d’autre IA en boite d’allumettes pour d’autres jeux cela prendrait des proportions énormes :

Jeu du Morpion : 304 boites d’allumettes.
Jeu du moulin : environ 10 milliards de boites d’allumettes soit le volume d’une sphère de 41 mètres de rayon.
Puissance 4 : 4 531 985 219 092 (près de 4 500 milliards !), une sphère de rayon de 302 m.
Les dames : Une sphère de 151 km de rayon (5.10²⁴ boites).
Les échecs : une sphère dont le centre est le soleil et qui irait presque jusque Neptune (10⁴³ boites pour 4.10¹² mètres).
Le jeu de GO : une sphère dont le rayon serait de 10²⁷fois la taille de l’univers observable (10¹⁷⁰ boites pour 8.10⁵⁴ mètres).

Sources : Building MENACEs for other games - https://www.mscroggs.co.uk/blog/52

Éléments pédagogiques

Objectifs pédagogiques

Comprendre ce qu’est l’apprentissage par renforcement utilisé en Intelligence Artificielle.

Pistes pour animer l'expérience

Conseils d’animation :

Pour chaque partie notez qui gagne pour constater l’évolution du nombre de victoire de l’IA.

vous pouvez confier le rôle de l’IA à des participants.

Il est possible de faire appel à l’intelligence collective en en prenant l’avis du groupe pour chaque coup.

Vous pouvez faire tourner les personnes qui incarnent le joueur.

L’algorithme converge au bout d’une dizaine partie environ (regardez le nombre de perles extraites !).

Sources et ressources

Une machine en boîtes d’allumettes qui apprend à jouer au Morpion - Le 26 février 2016 - Ecrit par Lisa Rougetet : https://images.math.cnrs.fr/Une-machine-en-boites-d-allumettes-qui-apprend-a-jouer-au-Morpion.html
Le MOOC Class'code sur l'IA : https://www.fun-mooc.fr/courses/course-v1:inria+41021+session01/about

Dernière modification 10/05/2024 par user:Nicco.

Commentaires

Published

@@ Ligne 3 : / Ligne 3 : @@
 |Licences=Attribution (CC-BY)
 |Description=l'Hexapion est un jeu d'échec simplifié, il sert de support à l'entrainement d'une Intelligence artificielle en boites  d'allumettes.
-|Disciplines scientifiques=Computing, Mathematics
+|Disciplines scientifiques=Computing
 |Difficulty=Technical
 |Duration=3
@@ Ligne 24 : / Ligne 24 : @@
 |Tuto_Attachments={{Tuto Attachments
 |Attachment=intelligence_artificielle_DIY_imbatable___l_hexapion_modeDemploiExapion2.pdf
-}}
+}}{{Tuto Attachments
+|Attachment=Intelligence_artificielle_DIY_imbatable___l_hexapion_Pion.stl
+}}{{Tuto Attachments
+|Attachment=Intelligence_artificielle_DIY_imbatable___l_hexapion_perle.stl
+}}{{Tuto Attachments
+|Attachment=Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_1.pdf
+}}{{Tuto Attachments
+|Attachment=Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_2.pdf
+}}{{Tuto Attachments
+|Attachment=Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_3.pdf
+}}{{Tuto Attachments
+|Attachment=Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_4.pdf
+}}{{Tuto Attachments}}
 }}
 {{Tuto Step
-|Step_Title=Imprimer les en noir&blanc ou couleur les éléments papier du jeu
+|Step_Title=Imprimer les éléments papier du jeu.
 |Step_Content=Imprimez les éléments suivant en téléchargeant le fichier joint (voir à côté de la liste du matériel) :
-* le plateau de 9 cases.
+*le plateau de 9 cases.
-* les 24 visuels de boites d'allumette (en couleur ou Noir & blanc suivant l'imprimante dont vous disposez).
+*les 24 visuels de boîtes d'allumettes (en couleur ou Noir & blanc suivant l'imprimante dont vous disposez).
-* coloriez les visuels de boites d'allumette si nécessaire.
+*coloriez les visuels de boîtes d'allumettes si nécessaire.
-* le tableau de suivi des victoires
+*le tableau de suivi des victoires
+Avec une imprimante imprimant en noir et blanc, choisissez le bon fichier et coloriez à la main !
 |Step_Picture_00=intelligence_artificielle_DIY_imbatable___l_hexapion_1200px-FabriqueTonHexapion.jpeg
 |Step_Picture_01=intelligence_artificielle_DIY_imbatable___l_hexapion_plateaujeu.jpg
@@ Ligne 41 : / Ligne 55 : @@
 }}
 {{Tuto Step
-|Step_Title=Impression 3D
+|Step_Title=Trouvez les pièces du jeu !
-|Step_Content=Il y a 2 type de pièces :
+|Step_Content=Pour jouer à l'Hexapion, il vous faut trouver des pièces pour le jeu. Pour cela, vous pouvez fouiller dans votre vieux coffre à jouets ou fouiner dans un magasin pour trouver :
+*10 perles vertes
+*14 perles rouges
+*13 perles bleues
+*18 perles jaunes
+*3 pions blancs, 3 pions noirs (de type jeu d'échec ou de dame)
+Et sinon, vous pouvez les faire vous-même, par exemple avec une imprimante 3D.
+Si vous n’avez ni imprimante 3D, ni perles, imprimez l’image avec les différents cas de figures .
+<br />
+}}
+{{Tuto Step
+|Step_Title=Pour imprimer les pièces en 3D
+|Step_Content=Il y a 2 types de pièces :
 *les pions à imprimer en blanc et en noir
 *les perles à imprimer en rouge, vert, jeune et bleu.
-voici les quantité :
+Voici les quantités :
 *10 perles vertes
 *14 perles rouges
-*13 permet bleues
+*13 perles bleues
 *18 perles jaunes
 *3 pions blancs, 3 pions noirs
@@ Ligne 57 : / Ligne 87 : @@
 Sources des fichiers : ces fichiers sont librement réutilisable en citant les auteurs (licence CC-By).
-* [https://www.thingiverse.com/thing:1371033 le pion] une réalisation de [https://www.thingiverse.com/rpreston01 rpreston01]
+*[https://www.thingiverse.com/thing:1371033 le pion] une réalisation de [https://www.thingiverse.com/rpreston01 rpreston01]
-* [https://www.thingiverse.com/thing:115644 la perle] une réalisation de [https://www.thingiverse.com/3dPrintNewsNow 3dPrintNewsNow]
+*[https://www.thingiverse.com/thing:115644 la perle] une réalisation de [https://www.thingiverse.com/3dPrintNewsNow 3dPrintNewsNow]
+Vous trouverez ces deux fichiers joints à cette page à côté du matériel
 |Step_Picture_00=intelligence_artificielle_DIY_imbatable___l_hexapion_pionen3D.jpg
 |Step_Picture_01=intelligence_artificielle_DIY_imbatable___l_hexapion_perleen3D.jpg
 |Step_Picture_02=intelligence_artificielle_DIY_imbatable___l_hexapion_20200126_204854.jpg
-|Step_Picture_03=Intelligence_artificielle_DIY_imbatable___l_hexapion_Pawn.stl
 }}
-{{Notes}}
+{{Tuto Step
+|Step_Title=La règle du jeu
+|Step_Content=1) Un pion ne peut se déplacer que d’une case en ligne droite (avancer).
+) Un pion peut manger un autre : en diagonale (il prend la place du pion mangé qui est retiré du jeu).
+) Il y a trois manières de gagner à l’Hexapion :
+*Amener	un de ses pions sur la ligne opposée dans le camp adverse
+*Prendre	tous les pions de l’adversaire
+*Bloquer	l’adversaire (qui ne peut plus prendre  ou	avancer à son tour)
+}}
+{{Tuto Step
+|Step_Title=Jouez contre l'IA !
+|Step_Content='''Déroulement d’une partie :'''
+*L’animateur joue le rôle de l’IA. Il a les pions noirs.
+*Le joueur humain a les pions blancs, c’est lui qui commence la partie et il jouera comme il l’entend.
+C'est le joueur humain qui commence car il faut de la "matière" pour que l'IA puisse fonctionner.
+L’animateur joue pour l’IA en utilisant les boites d'allumettes qui représentent des états du jeu. Les positions équivalentes du point de vue des actions de l’IA ne sont pas représentées (par exemple, seule la boite avec le pion de gauche avancé est représenté, c’est l’équivalent de la situation avec le pion droit avancé).
+'''Tour 1 :''' Le joueur humain avance un pion.
+'''Tour 2 :''' L’IA joue avec une des boites marquées '''2'''.''( pour ceux qui n’ont ni imprimante 3D ni perles,  regardez le cas de figure correspondant sur la feuille de l’étape 1)''
+L’animateur prend la boite d'allumette correspondant à la situation de jeu et tire une perle au hasard.
+Il joue le coup de la couleur indiquée et garde la perle (il la pose sur la boite par exemple).
+''(ceux qui n’ont ni imprimante 3D, ni perles, jouez un coup au hasard )''
+'''Tour 3 :''' Il y a deux situations possibles : le joueur humain gagne ou bien la partie continue.
+*Si le joueur humain gagne, l’IA estime que son coup était mauvais, on retire la perle du jeu, c’est ainsi que l’IA apprend ! ''( pour ceux qui n’ont ni imprimante 3D ni perles, barrez le coup que vous avez fait.)''
+*Si la partie continue, l’IA estime que son coup était ni bon ni mauvais, on remet la perle dans la boite ( ''pour ceux qui n’ont ni imprimante 3D ni perles, laisser.).''
+'''Tour 4 :''' L’IA joue avec une des boites marquées 4. l’animateur tire une perle  au hasard et joue pour l’IA. Il n’y a que 2 résultats possibles :
+*L’IA gagne, dans ce cas, l’IA estime que son coup était bon, on remet la perle dans la boite.
+*Le jeu peut continuer. l’IA estime que son coup n'était ni bon ni mauvais, on garde la perle (il la pose sur la boîte par exemple).''(pour ceux qui n’ont ni imprimante 3D ni perles, marquez un signe pour vous rappeler que la prochaine fois on essaye un autre coup sur le coup que vous avez fait. )''
+'''Tour 5''' : ce tour possède la même mécanique de jeu que le tour 3.
+si l’IA perd, la perle du tour 4 est retirée du jeu sauf si c’est la dernière perle. Les autres perles sont remises dans leurs boîtes.
+Etc...
+}}
+{{Tuto Step
+|Step_Title=etape optionnelle d' utilisation d'une découpeuse laser
+|Step_Content=pour le plaisir des yeux, dans les fichiers, vous avez 4 planches pour la découpe laser, pour une planche de 600*300 et pour du bois de 3 mm. Attention, il manque 1 pièce, il faut refaire la 4 pièce pour chacune des 4 planches (je suis limite en taille de fichier 600*300)
+bonne découpe
+|Step_Picture_00=Intelligence_artificielle_DIY_imbatable___l_hexapion_HEXAPION_PLANCHE_4.pdf
+}}
+{{Tuto Step
+|Step_Title=add-on découpe laser
+|Step_Content=je rajoute 2 planches pour la découpe laser pour 2 boites pour les pions du décompte de suivi des victoires, ainsi que 2 planches pour la découpe laser des pions et du plateau
+|Step_Picture_00=Intelligence_artificielle_DIY_imbatable___l_hexapion_boite_suivi_victoire_hexapion.svg
+|Step_Picture_01=Intelligence_artificielle_DIY_imbatable___l_hexapion_boite_suivi_victoire_ia_hexapion.svg
+|Step_Picture_02=Intelligence_artificielle_DIY_imbatable___l_hexapion_hexapion_plateau.svg
+|Step_Picture_03=Intelligence_artificielle_DIY_imbatable___l_hexapion_pion_suivi_victoire_ia.svg
+|Step_Picture_04=Intelligence_artificielle_DIY_imbatable___l_hexapion_pion_suivi_victoire.svg
+}}
+{{Notes
+|Observations=Au fur et a mesure des parties, les perles correspondantes aux mauvais coups sont retirées, l’IA apprend et ne conserve que les coups qui lui font gagner.
+L’Hexapion est très fort au bout de 4 à 6 défaites et quasi imbattable à 8-10.
+|Avertissement=Pensez à noter les victoires pour bien mesurer ce qu'il se passe.
+|Explanations=L’Hexapion est un jeu dit '''« résolu »'''. Un jeu résolu est un jeu dont le résultat (gagner, perdre ou match nul) peut être correctement prédit à partir de n'importe quelle position, en supposant que les deux joueurs jouent à la perfection. Exemples de jeux résolus : Morpion (qui s’appelle aussi Tic-Tac-Toe ou OXO), puissance 4, Awalé, ...
+Les boîtes d’allumettes représentent l’arbre des possibles du jeu dans son intégralité.
+Chaque fois que l’IA perd, c’est une des branches de l’arbre qui mène à la défaite de l’IA qui est coupée. Petit à petit il y a de moins en moins de perles dans les boîtes, c’est-à-dire qu’il y a de moins en moins de possibilité de perdre pour l’IA.
+Si il ne reste plus qu’une perle par boîte, il est impossible de gagner contre l’IA.
+Dans ce système d’IA, c’est l’humain qui crée la donnée nécessaire au système pour apprendre.
+C’est un apprentissage qui est '''supervisé''' puisque c’est nous qui fixons les règles de ce qu’est un « bon coup » ou un « mauvais coup ».
+Notre IA possède également deux atouts de l’informatique :
+*Une mémoire parfaite
+*La capacité de répétition
+Ainsi la machine ne fait jamais deux fois la même erreur.
+Ce jeu permet d’illustrer ce qu’est '''l’apprentissage par renforcement''' utilisé en IA, de voir émerger un algorithme optimal et de s’interroger sur '''la notion d’« intelligence »''' dans ce  système (particulièrement sur l’intelligence d’un système de boîtes d’allumettes !).
+|Deepen='''Conclusion'''
+Pour finir, ce jeu peut également servir à faire émerger des stratégies face à la machine, comme prendre des risques qui paraîtraient illogiques contre un humain, afin d'explorer des scénarios dans lesquels l'IA n'a pas encore appris.
+On peut également s'interroger sur la méthode pédagogique ou d'apprentissage à adopter, puisqu’au lieu de « punir » en enlevant la perle indésirable, on pourrait aussi bien « récompenser » en ajoutant par exemple une perle de même couleur à chaque coup gagnant de l'IA. Ce procédé a d’ailleurs un avantage puisque s’il permet d’améliorer les performances de l’IA d’un point de vue statistique, il laisse toujours une opportunité au joueur humain de gagner.
+|Applications=AlphaGo Zero, un programme qui bat les joueur du jeu de GO, est une nouvelle technique d'apprentissage par renforcement où l'ordinateur apprend en étant son propre professeur.
+|Related=Dans le principe, tous les jeux résolus se prêtent bien aux démonstrations d’apprentissage par renforcement.
+Il existe des variantes pour le jeu de Nîm (qui vous permettra de recycler vos allumettes) ou encore du Morpion (mais il vous faudra alors 304 boites d’allumettes).
+L’implémentation dans un programme devient alors plus intéressante et vous pourrez trouver des exemples sous Scratch ou en Python.
+Dans ce dernier cas, quelques instructions conditionnelles permettront à l’algorithme d’explorer tout seul l’ensemble des options possibles en jouant contre lui-même.
+Ce qui permet aux apprenants de coder eux-mêmes leur IA et de voir émerger la stratégie optimale au bout de quelques centaines de parties soit quelques secondes pour l’ordinateur.
+Exemples sur scratch en anglais : https://en.scratch-wiki.info/wiki/Artificial_Intelligence
+Si on créait d’autre IA en boite d’allumettes pour d’autres jeux cela prendrait des proportions énormes :
+* Jeu du Morpion : 304 boites d’allumettes.
+* Jeu du moulin : environ 10 milliards de boites d’allumettes soit le volume d’une sphère de 41 mètres de rayon.
+* Puissance 4 :  4 531 985 219 092 (près de 4 500 milliards !), une sphère	de rayon de 302 m.
+* Les dames : Une sphère de 151 km de rayon (5.10<sup>24</sup> boites).
+* Les échecs : une sphère dont le centre est le soleil et qui irait presque jusque Neptune (10<sup>43</sup> boites pour 4.10<sup>12</sup> mètres).
+* Le jeu de GO : une sphère dont le rayon serait de 10<sup>27</sup>fois la taille de l’univers observable (10<sup>170</sup> boites pour 8.10<sup>54</sup> mètres).
+Sources : Building MENACEs for other games - https://www.mscroggs.co.uk/blog/52
+|Objectives=Comprendre ce qu’est '''l’apprentissage par renforcement''' utilisé en Intelligence Artificielle.
+|Animation='''Conseils d’animation :'''
+Pour chaque partie notez qui gagne pour constater l’évolution du nombre de victoire de l’IA.
+vous pouvez confier le rôle de l’IA à des participants.
+Il est possible de faire appel à l’intelligence collective en en prenant l’avis du groupe pour chaque coup.
+Vous pouvez faire tourner les personnes qui incarnent le joueur.
+L’algorithme converge au bout d’une dizaine partie environ (regardez le nombre de perles extraites !).
+|Notes=*Une machine en boîtes d’allumettes qui apprend à jouer au Morpion - Le 26 février 2016  - Ecrit par  Lisa Rougetet : https://images.math.cnrs.fr/Une-machine-en-boites-d-allumettes-qui-apprend-a-jouer-au-Morpion.html
+*Le MOOC Class'code sur l'IA : https://www.fun-mooc.fr/courses/course-v1:inria+41021+session01/about
+}}
 {{Tuto Status
 |Complete=Published
 }}