Victoire historique de l'intelligence artificielle au jeu de GO

Home » Future » Victoire historique de l’intelligence artificielle au jeu de GO

Victoire historique de l'intelligence artificielle au jeu de GO

Il est considéré par les spécialistes comme le jeu le plus difficile à gagner par un ordinateur, et pourtant le jeu de go a cédé. Face à Fan Hui, le champion européen en titre, le logiciel AlphaGo a gagné cinq parties à zéro ! Ses développeurs l’ont annoncé le 27 janvier dans la prestigieuse revue Nature.

AlphaGo est le bijou de Google DeepMind, la succursale du groupe américain dédiée à l’intelligence artificielle. Dans la course à la conquête du go, Google coiffe ainsi au poteau Facebook, qui consacre également beaucoup de ressources à la recherche dans ce domaine. Il reste seulement à savoir si le logiciel gagnant sera en mesure de battre le numéro 1 mondial de go, le coréen Lee Se-dol. Le match est prévu en mars.

Dix puissance 600 combinaisons possibles

Le principe du jeu ? Sur un damier de 19 x 19 “intersections”, les deux joueurs sont censés s’accaparer la plus grande surface possible à l’aide de leurs pions noirs ou blancs. Une fois un pion de la couleur adverse entouré, celui-ci est éliminé.

Si le go détient le statut de trophée ultime pour les développeurs d’intelligence artificielle, c’est en raison du nombre immense de combinaisons possibles, c’est à dire de manières dont la partie peut se dérouler : 10 puissance 600, contre seulement 10 puissance 120 aux échecs. Pour ce dernier, la première victoire d’une machine contre une personne remonte à 1997, lorsque DeepBlue, fabriqué par IBM, battit le champion du monde Garri Kasparov.

Jusqu’à l’exploit annoncé cette semaine, on considérait que la victoire au go ne serait pas à la portée d’une l’intelligence artificielle (IA) avant une décennie, affirment les chercheurs dans Nature. Et pourtant, AlphaGo y est parvenu, gagnant également 99,8 % des parties contre les autres IA de go.

À la base du logiciel se trouve ce qu’on appelle “l’approche Monte Carlo”, qui simule les coups à jouer afin d’atteindre une certaine disposition sur le damier. En outre, ces simulations s’appuient sur un “arbre de recherches”, ce qui augmente leur puissance. Ainsi, à chaque coup, des milliers de coups sont simulés par la machine avant de choisir les plus efficaces d’entre elles. Le tout est encore enrichi en s’appuyant sur des réseaux de neurones artificiels, capables d’apprendre avec l’expérience (“deep learning” en jargon). Ces réseaux sont également utilisés par Google pour reconnaître les images.

Ainsi équipé, AlphaGo a d’abord appris à jouer en mémorisant des parties qui ont eu lieu entre grands joueurs, puis il s’est entraîné à jouer contre soi-même : avant la rencontre fatidique avec Fan Hui, il avait joué plusieurs centaines de milliers de parties !

Science & Vie – Fiorenza Gracci

شارك: