Un nouvel ordinateur apprend à jouer aux échecs à un niveau international en seulement 72 heures

16 septembre 2015 19:04 Mis à jour: 29 octobre 2015 21:18

Cela fait près de deux décennies que les ordinateurs sont en mesure de battre les meilleurs joueurs d’échecs au monde. Depuis lors, les algorithmes avaient seulement été améliorés, de sorte que les grands joueurs d’échecs dans le monde se faisaient battre dans un match en tête-à-tête avec une machine, et pouvait à peine gagner même lorsqu’on donnait à la machine un handicap sévère.

Pourtant, les principaux programmes d’échecs ne jouent pas aux échecs comme les humains, et comptent sur la force brute des centaines de calcul des millions de scénarios possibles par seconde au moment de décider de déplacer une pièce plutôt que de faire preuve d’intuition ou de sagesse.

Cela a conduit certains observateurs à dire que les programmes d’échecs ne jouent pas vraiment aux échecs du tout.

Les joueurs d’échecs « humains » sont souvent en mesure d’évaluer une situation en un coup d’œil par la construction d’une connaissance des coups classiques et des cas particuliers, mais cela est difficile à encoder dans les ordinateurs, qui doivent généralement compter sur des règles universelles.

Aujourd’hui un groupe de chercheurs de l’Imperial College de Londres ont construit un algorithme qui peut apprendre à jouer aux échecs par lui-même au lieu de compter sur des combinaisons de calculs de règles – et, par conséquent, il a joué davantage comme un être humain, et a exigé beaucoup moins de traitement par des calculs pour obtenir le même niveau de compétence que d’autres programmes d’échecs avancés.

L’algorithme est sans surprise basé sur un programme de deep learning (apprentissage profond), c’est-à-dire d’apprentissage automatique non linéaire. Les algorithmes de deep learning ont été un pilier des innovations en intelligence artificielle (AI) au cours des dernières décennies. Ils ont permis de faire des avancées significatives dans la reconnaissance visuelle et vocale pour des entreprises comme Google et Facebook, et ils ont même été déployés pour effectuer des performances comme apprendre à peindre dans le style des nouveaux et des anciens maîtres.

Ce qui différencie les algorithmes d’apprentissage profond des programmes classiques est qu’ils apprennent comment se comporter eux-mêmes grâce à un ensemble de données au lieu d’exécuter simplement un ensemble de règles. Par exemple, la formation d’un algorithme pour distinguer entre un siège de voiture et un volant impliquait de lui implémenter des milliers de photos de sièges et de volants.

Le jeu d’échec est un peu plus délicat. Implémenter les données de matchs enregistrés ne signifie pas travailler de la même façon qu’un joueur d’échecs. Un tel programme ne peut pas apprendre en regardant simplement en comment les autres jouent, il n’a aucune compréhension de la raison derrière chaque décision. Au lieu de cela, le programme appelé Giraffe joue contre lui-même, et est aidé par d’autres programmes d’échecs qui lui servent de tuteurs et donnent à Giraffe un « feedback » à intervalles réguliers pendant le jeu, permettant au programme de s’améliorer au fil du temps.

Après 72 heures de formation, Giraffe était en mesure de jouer aux échecs aussi bien qu’un maître international, ce qui le place à égalité des 2,2% des meilleurs joueurs d’échecs dans le monde entier selon la cote officielle des échecs. Ce qui rend la réalisation de Giraffe remarquable n’est pas le niveau de jeu, mais la facilité et la rapidité avec laquelle elle a atteint un tel niveau de compétences – ainsi que les ressources informatiques et humaines minimales qu’elle a consommées.

L’apprentissage de la stratégie de Giraffe a été testée par The Strategic Test Suite, qui évalue la façon dont le programme comprend 15 stratégies différentes selon 1 500 positions différentes. L’algorithme a montré un rythme de résolution comparable à certains des principaux programmes d’échecs, un exploit étonnant étant donné que les autres programmes « sont tous des mastodontes informatiques avec des centaines de paramètres qui ont été réglés manuellement et automatiquement sur plusieurs années, et que beaucoup d’entre eux ont été élaborées avec l’aide de grands joueurs d’échec», affirme les chercheurs de l’Imperial College de Londres.

Ils ont eu de grands maîtres d’échecs pour jouer contre les premières versions de Giraffe, pour voir où le programme pouvait être amélioré – mais le programme reste libre de la mise au point manuelle dont la plupart des autres programmes ont été paramétrés.

Au-delà du jeu d’échecs, les chercheurs avancent que les composants de base de Giraffe pourraient être greffés sur « d’autres jeux de société, et atteindre des performances de haut niveau rapidement, surtout dans les jeux où il n’y a pas eu des décennies de recherche intense dans la création d’une intelligence artificielle fortement paramétrée ».

Version anglaise de l’article : New Computer Learns How to Play Expert-Level Chess in Just 72 Hours

Soutenez Epoch Times à partir de 1€

Comment pouvez-vous nous aider à vous tenir informés ?

Epoch Times est un média libre et indépendant, ne recevant aucune aide publique et n’appartenant à aucun parti politique ou groupe financier. Depuis notre création, nous faisons face à des attaques déloyales pour faire taire nos informations portant notamment sur les questions de droits de l'homme en Chine. C'est pourquoi, nous comptons sur votre soutien pour défendre notre journalisme indépendant et pour continuer, grâce à vous, à faire connaître la vérité.