AlphaGo excelle au go car il combine trois approches. D’abord la classique «méthode de Monte-Carlo» qui simule à l’avance des milliers de parties pour deviner quels coups ont le plus de chances de se solder par une victoire. Il ajoute à cela les possibilités offertes par le deep learning, une capacité d’apprentissage qui simule un réseau de neurones pour que l’ordinateur sache choisir la meilleure réponse possible aux paramètres qu’on lui donne (DeepMind a déjà fait ses preuves en la matière en créant un programme capable de jouer aux jeux vidéo sans qu’on lui en explique les règles). Enfin, AlphaGo a ingurgité 30 millions de mouvements de joueurs professionnels, puis joué contre lui-même pour mettre sa technique à l’épreuve - un «apprentissage par renforcement».
Comment joue l’Intelligence artificielle ?
Publié le 08/03/2016 à 20h01
Dans la même rubrique
Nos newsletters

Alerte Libé
Les alertes, infos et enquêtes Libé à ne pas manquer

Libé Matin
Le brief matinal idéal pour bien commencer la journée

Opinions
Les billets, éditos, tribunes ou chroniques qui font débat

Toutes nos newsletters
Actualité, politique, lifestyle... découvrez toutes nos newsletters

Les plus lus