Il faut des objets ou des photos d'objets de différentes formes et de couleurs variés.
Demander aux participants de regrouper les objets en fonction de leurs similarités (par exemple, par couleur, taille, forme).
Parlez des motifs que les participants ont utilisés pour regrouper les objets. Expliquez que l'apprentissage non supervisé fonctionne de manière similaire en regroupant des données similaires sans étiquettes préalables., C'est-à-dire sans avoir de point de référence comme lors de l'expérience précédente avec les carrés et les ronds.
Étape 3 - Apprentissage Par Renforcement
Prévoir tableau blanc (ardoise), feutre effaçable et étoiles ou gommettes
Dessinez un labyrinthe simple sur le papier ou le tableau blanc.
Indiquez le point de départ et la sortie.
Placez quelques obstacles et chemins incorrects.
Règles du Jeu :
Un joueur commence au point de départ et doit trouver la sortie.
À chaque intersection, le joueur doit choisir une direction (gauche, droite, tout droit).
Si le joueur choisit la bonne direction, il avance et reçoit une petite récompense.
Si le joueur choisit la mauvaise direction, il doit revenir en arrière et essayer une autre direction.
Apprentissage Par Renforcement :
Chaque fois que le joueur prend une décision correcte, il reçoit une récompense, ce qui renforce ce choix.
Chaque fois que le joueur prend une mauvaise décision, il ne reçoit pas de récompense et doit réessayer.
Le joueur apprend progressivement le bon chemin à suivre grâce aux récompenses et aux pénalités.
Une IA essaie différentes actions et apprend à maximiser les récompenses en évitant les pénalités.