Et si StarCraft 2 sauvait le monde ?


 





Notre planète va à vau-l’eau, soumise à toujours plus de stress et de conditions délétères principalement causées par l’Homme. Ces quelques mots, qui ne manqueront pas d’égayer votre journée, sont à l’origine de nombreuses actions visant à retarder les conséquences désastreuses allant de pair avec la dégradation des écosystèmes de la Terre. À l’échelle individuelle comme au niveau de pays tout entiers, il est urgent de prendre des mesures et c’est l’une d’entre elles qui fera l’objet de cet article. Non, la ligne éditoriale des Stickology n’a pas évolué, puisque cette proposition se base étonnamment sur un outil créé pour le jeu vidéo. Un rien de contexte sera nécessaire, mais vous saurez bientôt à qui l’on devra la sauvegarde de notre monde : l’intelligence artificielle AlphaStar.



Artificial Intelligence Accidentally Learned Ecology through Video Games
Barbe L., Mony C., Abbott B.


De tous les titres donnant à l’e-sport ses lettres de noblesse, la série StarCraft (1998) fait office de précurseur. Le STR de Blizzard était déjà un véritable phénomène en Corée au début du siècle, et s’y voyait diffusé sur des chaînes dédiées à la compétition entre pro players. La plupart des occidentaux, ne nous le cachons pas, se contentait à l’époque d’un roulement d’yeux moqueur sans se douter des chiffres hallucinants qui accompagneraient le streaming de compétitions e-sportives sur leurs terres une décennie plus tard. Toujours inscrit dans cette tendance, StarCraft 2 (2010) a permis l’émergence de vrais champions aux stratégies affûtées au fil des matchs. Si son nom n’évoque rien au grand public, le Polonais Grzegorz "MaNa" Komincz est une star de la discipline, le Kasparov des Protoss. Le parallèle au jeu d’échecs n’est pas si anodin, car le développement d'intelligences artificielles trouve régulièrement un écho dans la presse au rythme des confrontations entre les robots et les joueurs humains maîtres de leur discipline. Ainsi les échecs, le shogi ou encore le jeu de go ont-ils vu triompher des IA ayant ingurgité des millions d’heures de jeu afin d’en extirper des stratégies gagnantes. AlphaGo, création de la société Deepmind, est l’une des plus connues. Elle a notablement fait tomber Lee Se-Dol, l’un des meilleurs joueurs de jeu de go (Image 1). Mais pourquoi se limiter aux jeux physiques et millénaires ? Deepmind a investi la scène e-sport en fin d’année dernière avec une nouvelle venue dans la famille Alpha : AlphaStar, l’IA dédiée à botter des culs à StarCraft 2.
 
Image 1 : AlphaGo en pleine démonstration

Tout comme les jeux précédemment cités, StarCraft invite le joueur à une gestion rigoureuse des risques et des bénéfices, mais possède pour lui un degré d’imprévisibilité vecteur de challenges supplémentaires. Le titre de Blizzard a les caractéristiques d’un jeu de stratégie en temps réel, à savoir l’utilisation de ressources naturelles pour produire des bâtiments et des unités, et une exploration nécessaire pour dissiper le brouillard de guerre qui empêche de savoir où sont les adversaires et les autres ressources de la map. Les joueurs n’ont donc pas accès à toutes les informations, et doivent survivre et se développer avec le peu de données qu’ils ont sur leur environnement pour prospérer sans se faire croquer par le premier rush Zerg venu. Les trois races que le joueur peut choisir (Terrans, Protoss, Zerg) n’ont pas la même approche de la collecte ou de l’utilisation de ressources, ajoutant un niveau de complexité qui les rend comparables, nous le verrons, aux différentes espèces végétales ou animales de la Terre. Dans StarCraft, la macrogestion est aussi importante que la microgestion de ses troupes, et seuls les meilleurs ont une vision d’ensemble suffisante pour trouver la stratégie gagnante. Toutes ces variables à explorer constituaient donc un challenge idéal pour AlphaStar et son réseau neural flambant neuf.

Figure 1 : les agents d'AlphaStar et leurs stratégies, regroupées par clusters

L’entraînement d’AlphaStar constituerait sans doute le plus dingue des training montages. Divisée en “agents”, c’est à dire en profils aux objectifs d’apprentissage distincts capables de se former au jeu de façon autonome (Figure 1), l’IA a lancé des millions de parties de StarCraft 2. Les agents s’affrontaient entre eux pour peaufiner leurs stratégies et en tirer la quintessence de la win, le summum du GG. Et ils ont eu du temps pour cela : l’équivalent de 200 ans de matchs ininterrompus, soit 26 millions de fois la durée de la chanson Eye of the Tiger (tout compte fait, oublions le training montage). Libre de toute influence humaine, AlphaStar a mis au point ses propres stratégies quitte à défier toute logique : les meilleurs agents avaient par exemple tendance à miser sur l’accumulation intensive de ressources, ou à produire des armées aux unités homogènes. Ces stratégies curieuses ont pourtant permis à l’IA de dominer des adversaires humains tels que MaNa dans 99,8% des cas ! Lors d’un match d’exhibition en octobre 2019, AlphaStar s’est même offert le luxe d’infliger un 5-0 sec à TLO, l’un des meilleurs joueurs Zerg. Derrière un aspect contre-productif, la gestion de l’écosystème du jeu était en fait redoutable d’efficacité, au point d’attirer l’attention des auteurs de l’étude, qui proposent un nouveau challenge à la création de Deepmind : trouver un moyen de sauver notre écologie en appliquant un apprentissage similaire.

Une compétition intra- ou inter-spécifique dans un écosystème aux ressources finies où seule la meilleure stratégie assure la survie de l’espèce : et si finalement la nature n’était qu’un RTS ? Aussi simpliste qu’il puisse paraître, ce postulat permet à Barbe et al. d’imaginer un nouveau programme pour AlphaStar, dans lequel de nouvelles données enrichiraient celles auxquelles les agents ont été soumis dans le cadre du jeu vidéo. Rappelez-vous : chacune des trois espèces du jeu se joue différemment. Là où les Terrans sont résistants mais se développent moins vite, les Zergs sont fragiles mais nombreux, capables de rapidement coloniser un écosystème. Pour les auteurs du papier, un parallèle peut être établi entre la physionomie de chaque race de StarCraft 2 et certains végétaux de la planète, faisant des Terrans l’équivalent des cactus et des Zergs de lointains cousins des orties (Figure 2). Chaque végétal, chaque animal, a une stratégie de survie et de prolifération corrélée à ce schéma “K et r”, où K est l’accumulation de ressources vers la production d’unités coûteuses et résistantes, et r la dépense immédiate de ressources pour une production de masse. Les données récupérées par AlphaStar renferment sans doute déjà leur lot d’informations applicables à notre monde.


Figure 2 : les races de StarCraft 2 partagent des caractéristiques avec les espèces vivantes de la Terre.

Bien que l’IA soit déjà mise à contribution dans de nombreux domaines (l’économie, la médecine…), l’écologie ne fait pas encore l’objet d’études poussées malgré son intérêt croissant. Matérialiser les luttes naturelles et demander à AlphaStar d’en extraire les stratégies gagnantes représente un bon espoir pour ces chercheurs de comprendre les meilleurs moyens de faire face à des variations significatives des écosystèmes : changement de conditions (température, humidité), de disponibilité de ressources, apparition de nouvelles d’espèces invasives… Et pourquoi pas le tester face à des humains de différentes cultures, pour mettre en évidence un moyen original de faire face aux défis qui nous attendent ? Bien que tout cela relève du fantasme à l’heure où ces lignes paraissent, il ne semble pas idiot que quelques espoirs soient fondés sur la capacité d’une intelligence libre de tout carcan humain à faire des choix pertinents. Il nous appartiendra in fine de les appliquer ou non pour entraîner des changements positifs et durables. Que tout cela dérive d’une partie de StarCraft, avouez quand même que ça aurait de la gueule.



Pour en apprendre plus sur l’apprentissage d’AlphaStar : https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii


Précédents billets de la rubrique :
Stickology #3 : La musique de jeu vidéo nous stresse-t-elle ?
Stickology #4 : Quels genres de jeux nous stressent le plus ? 
Stickology #5 : La représentation de la femme et le sexisme dans le jeu vidéo 
Stickology #6 : Cerner l'addiction aux jeux vidéo pour mieux l'étudier
Stickology #7 : Apprendre à se brosser les dents avec Kinect

Aucun commentaire:

Enregistrer un commentaire

Qu'est-ce que vous en dites ?