tags

Activité ajoutée par Sciences Infuses le 26 juillet 2012.

Objectifs

Cette activité va présenter l'apprentissage machine (ou, autrement dit, l'apprentissage automatique). Les élèves vont pouvoir constater que l'on peut faire apprendre une machine, en faisant en sorte qu'elle se souvienne de ses erreurs. La faculté d'apprentissage étant considérée comme étant du domaine de l'intelligence, l'apprentissage automatique fait partie de l'intelligence artificielle.

Mise en place

L'activité se déroule en classe, avec l'aide d'une grille, de jetons, de cartes représentant les coups possibles et de bonbons symbolisant les coups qui n'ont pas encore été joués, ou qui mènent à la victoire.


Cette activité est inspirée de l'activité "L'ordinateur qui apprend avec des friandises" ("The sweet learning computer") du site cs4fn de Queen Mary (University of London) que vous pouvez retrouver à l'adresse: http://www.cs4fn.org/teachers/activities/. Pour plus de renseignements sur cs4fn, voir: http://www.cs4fn.org/.

Introduction

Parmi les caractéristiques de l'intelligence, on peut aisément citer la faculté d'apprentissage. Donc, si un ordinateur est capable d'apprendre de ses erreurs, on pourra vraiment parler d'intelligence artificielle.

On va donc proposer aux élèves une activité où l'informaticien a fourni à la machine un algorithme qui simule cette capacité d'apprendre. On ne dit donc pas à l'ordinateur ce qu'il doit faire pour gagner mais ce qu'il doit faire pour apprendre. La machine va donc apprendre quels sont les coups qui lui ont fait perdre et ceux qui lui ont fait gagner la partie. Elle apprend de ses erreurs afin de ne pas les reproduire.

Dans le cas présent, on va mettre en place un mécanisme qui permet à la machine de retenir ce qui l'a fait perdre et ainsi de ne plus reproduire la même erreur.

Présentation de l'activité

Le jeu auquel on va jouer est le Scipion. Il se présente sous la forme d'une grille 3x3 composée, au début, d'une rangée de ronds sur la première ligne (les ronds seront les pions du joueur 1) et une rangée de croix sur la dernière ligne (les croix seront les pions du joueur 2). Le principe est simple, on ne peut se déplacer que vers l'avant (vers le camp de son adversaire) si la case est vide, et on peut manger un pion adverse si ce pion est vers l'avant en diagonale, on ne peut jamais reculer (comme les pions au jeu d'échecs). Chaque joueur a trois possibilités pour gagner:

	1) placer un de ses pions sur la rangée 
	   opposée à celle de son départ,
	2) bloquer l'autre joueur pour que ce 
	   dernier ne puisse plus se déplacer,
	3) avoir pris toutes les pièces de l'adversaire.

Déroulement de l'activité

Placez un élève d'un côté de la grille et un autre de l'autre côté, de sorte qu'un des élèves ait les croix en face de lui et l'autre ait les ronds. Un des deux élèves va jouer la machine, l'autre joue normalement. Pour que joue le joueur-machine, il faut mettre en place des fiches représentant les coups possibles après un coup de l'adversaire. Sur chaque fiche, il faut mettre un bonbon de la couleur de chaque flèche. Quand c'est au tour de l'élève machine, il choissit un bonbon parmi ceux encore disponibles sur la fiche qui correspond à la configuration du jeu. Et il effectue le mouvement correspondant à la flèche de la même couleur. Vous l'aurez compris, le bonbon sera la clé du système de récompense. L'idée générale est la suivante, si un coup (une flèche de couleur) amène l'élève-machine à perdre directement après, alors on retire le bonbon de la fiche, l'élève-machine ne fera ainsi plus jamais ce mouvement qui l'a amené à perdre. Ceci est possible dans deux cas:

	1) Si l'élève non-machine gagne, 
	   alors il mange le bonbon
	2) Si l'élève machine se retrouve dans 
	   une configuration correspondant à 
	   une fiche où il n'y a plus de bonbons, 
	   il ne peut plus rien faire, il a donc perdu 
	   et l'élève non-machine qui gagne, 
	   mange donc le dernier bonbon qui 
	   a été utilisé. 

Il est important que l'élève machine choisisse le bonbon au hasard parmi ceux disponibles sur la fiche pour simuler correctement ce qu'un ordinateur ferait. Il ne doit donc pas réfléchir pour déterminer le bonbon le plus intéressant.

Au final, il ne restera donc plus que les bonbons qui font gagner. Le joueur-machine gagnera à tous les coups parce qu'il a appris que tous les autres coups lui font perdre la partie.

Objectif

L'objectif des deux élèves est donc bien différent. Celui de l'élève non-machine est de gagner le plus qu'il peut, afin de manger le plus de bonbons possibles, et l'objectif de l'élève-machine est de faire apprendre son ordinateur le plus possible, et pour ce faire, il doit absolument se débarrasser (et donc découvrir) le plus de mauvais bonbons possibles (les mauvais bonbons, pour lui, sont les bonbons qui lui font perdre la partie).

Représenter les victoires et les défaites

Il est intéressant de représenter cela dans un graphique. Il faut demander pour chaque partie, au joueur-machine, de tracer une ligne vers le bas quand il perd, et une ligne vers le haut quand il gagne. Les élèves pourront remarquer qu'à partir d'un certain moment, ça monte tout le temps puisque le joueur-machine ne fait que gagner (il a retiré tous les bonbons qui le mènent à une situation perdante). Un exemple du graphique qui peut être tracé se trouve dans le matériel.

Les élèves ont donc pu percevoir comment une machine peut apprendre de ses erreurs, et donc finir par faire de bons résultats.


Cette activité est inspirée de l'activité "L'ordinateur qui apprend avec des friandises" ("The sweet learning computer") du site cs4fn de Queen Mary (University of London) que vous pouvez retrouver à l'adresse: http://www.cs4fn.org/teachers/activities/. Pour plus de renseignements sur cs4fn, voir: http://www.cs4fn.org/.


Cette activité est inspirée de l'activité "L'ordinateur qui apprend avec des friandises" ("The sweet learning computer") du site cs4fn de Queen Mary (University of London) que vous pouvez retrouver à l'adresse: http://www.cs4fn.org/teachers/activities/. Pour plus de renseignements sur cs4fn, voir: http://www.cs4fn.org/.


Commentaires


Poster un commentaire


Titre:
 Votre message
 
Auteur:
GlossyBlue theme adapted by David Gilbert
Powered by PmWiki