Notre
planète va à vau-l’eau, soumise à toujours plus de stress et de conditions
délétères principalement causées par l’Homme. Ces quelques mots, qui ne
manqueront pas d’égayer votre journée, sont à l’origine de nombreuses actions
visant à retarder les conséquences désastreuses allant de pair avec la
dégradation des écosystèmes de la Terre. À l’échelle individuelle comme au
niveau de pays tout entiers, il est urgent de prendre des mesures et c’est
l’une d’entre elles qui fera l’objet de cet article. Non, la ligne éditoriale
des Stickology n’a pas évolué, puisque cette proposition se base étonnamment
sur un outil créé pour le jeu vidéo. Un rien de contexte sera nécessaire, mais
vous saurez bientôt à qui l’on devra la sauvegarde de notre monde :
l’intelligence artificielle AlphaStar.
Artificial
Intelligence Accidentally Learned Ecology through Video Games
Barbe L., Mony C., Abbott B.
Trends in Ecology & Evolution, Juillet 2020
De
tous les titres donnant à l’e-sport ses lettres de noblesse, la série StarCraft
(1998) fait office de précurseur. Le STR de Blizzard était déjà un véritable phénomène
en Corée au début du siècle, et s’y voyait diffusé sur des chaînes dédiées à la
compétition entre pro players. La plupart des occidentaux, ne nous le cachons
pas, se contentait à l’époque d’un roulement d’yeux moqueur sans se douter des
chiffres hallucinants qui accompagneraient le streaming de compétitions
e-sportives sur leurs terres une décennie plus tard. Toujours
inscrit dans cette tendance, StarCraft 2 (2010) a permis l’émergence de vrais
champions aux stratégies affûtées au fil des matchs. Si son nom n’évoque rien
au grand public, le Polonais Grzegorz "MaNa" Komincz est une star de
la discipline, le Kasparov des Protoss. Le parallèle au jeu d’échecs n’est pas
si anodin, car le développement d'intelligences artificielles trouve
régulièrement un écho dans la presse au rythme des confrontations entre les
robots et les joueurs humains maîtres de leur discipline. Ainsi les échecs, le
shogi ou encore le jeu de go ont-ils vu triompher des IA ayant ingurgité des
millions d’heures de jeu afin d’en extirper des stratégies gagnantes. AlphaGo,
création de la société Deepmind, est l’une des plus connues. Elle a notablement
fait tomber Lee Se-Dol, l’un des meilleurs joueurs de jeu de go (Image 1). Mais pourquoi
se limiter aux jeux physiques et millénaires ? Deepmind a investi la scène
e-sport en fin d’année dernière avec une nouvelle venue dans la famille Alpha :
AlphaStar, l’IA dédiée à botter des culs à StarCraft 2.
Tout comme les jeux
précédemment cités, StarCraft invite le joueur à une gestion rigoureuse des
risques et des bénéfices, mais possède pour lui un degré d’imprévisibilité
vecteur de challenges supplémentaires. Le titre de Blizzard a les
caractéristiques d’un jeu de stratégie en temps réel, à savoir l’utilisation de
ressources naturelles pour produire des bâtiments et des unités, et une
exploration nécessaire pour dissiper le brouillard de guerre qui empêche de
savoir où sont les adversaires et les autres ressources de la map. Les joueurs
n’ont donc pas accès à toutes les informations, et doivent survivre et se
développer avec le peu de données qu’ils ont sur leur environnement pour
prospérer sans se faire croquer par le premier rush Zerg venu. Les trois races
que le joueur peut choisir (Terrans, Protoss, Zerg) n’ont pas la même approche
de la collecte ou de l’utilisation de ressources, ajoutant un niveau de
complexité qui les rend comparables, nous le verrons, aux différentes espèces
végétales ou animales de la Terre. Dans StarCraft, la macrogestion est aussi
importante que la microgestion de ses troupes, et seuls les meilleurs ont une
vision d’ensemble suffisante pour trouver la stratégie gagnante. Toutes ces
variables à explorer constituaient donc un challenge idéal pour AlphaStar et
son réseau neural flambant neuf.
Figure 1 : les agents d'AlphaStar et leurs stratégies, regroupées par clusters |
L’entraînement
d’AlphaStar constituerait sans doute le plus dingue des training montages.
Divisée en “agents”, c’est à dire en profils aux objectifs d’apprentissage
distincts capables de se former au jeu de façon autonome (Figure 1), l’IA a lancé des
millions de parties de StarCraft 2. Les agents s’affrontaient entre eux pour
peaufiner leurs stratégies et en tirer la quintessence de la win, le summum du
GG. Et ils ont eu du temps pour cela : l’équivalent de 200 ans de matchs
ininterrompus, soit 26 millions de fois la durée de la chanson Eye of the Tiger
(tout compte fait, oublions le training montage). Libre de toute influence
humaine, AlphaStar a mis au point ses propres stratégies quitte à défier toute
logique : les meilleurs agents avaient par exemple tendance à miser sur
l’accumulation intensive de ressources, ou à produire des armées aux unités
homogènes. Ces stratégies curieuses ont pourtant permis à l’IA de dominer des
adversaires humains tels que MaNa dans 99,8% des cas ! Lors d’un match
d’exhibition en octobre 2019, AlphaStar s’est même offert le luxe d’infliger un
5-0 sec à TLO, l’un des meilleurs joueurs Zerg. Derrière un aspect
contre-productif, la gestion de l’écosystème du jeu était en fait redoutable d’efficacité,
au point d’attirer l’attention des auteurs de l’étude, qui proposent un nouveau
challenge à la création de Deepmind : trouver un moyen de sauver notre écologie
en appliquant un apprentissage similaire.
Une compétition intra-
ou inter-spécifique dans un écosystème aux ressources finies où seule la
meilleure stratégie assure la survie de l’espèce : et si finalement la nature
n’était qu’un RTS ? Aussi simpliste qu’il puisse paraître, ce postulat permet à
Barbe et al. d’imaginer un nouveau programme pour AlphaStar, dans lequel de
nouvelles données enrichiraient celles auxquelles les agents ont été soumis
dans le cadre du jeu vidéo. Rappelez-vous : chacune des trois espèces du jeu se
joue différemment. Là où les Terrans sont résistants mais se développent moins
vite, les Zergs sont fragiles mais nombreux, capables de rapidement coloniser
un écosystème. Pour les auteurs du papier, un parallèle peut être établi entre
la physionomie de chaque race de StarCraft 2 et certains végétaux de la
planète, faisant des Terrans l’équivalent des cactus et des Zergs de lointains
cousins des orties (Figure 2). Chaque végétal, chaque animal, a une stratégie de survie et
de prolifération corrélée à ce schéma “K et r”, où K est l’accumulation de
ressources vers la production d’unités coûteuses et résistantes, et r la
dépense immédiate de ressources pour une production de masse. Les données
récupérées par AlphaStar renferment sans doute déjà leur lot d’informations
applicables à notre monde.
Figure 2 : les races de StarCraft 2 partagent des caractéristiques avec les espèces vivantes de la Terre. |
Bien que l’IA soit
déjà mise à contribution dans de nombreux domaines (l’économie, la médecine…),
l’écologie ne fait pas encore l’objet d’études poussées malgré son intérêt
croissant. Matérialiser les luttes naturelles et demander à AlphaStar d’en
extraire les stratégies gagnantes représente un bon espoir pour ces chercheurs
de comprendre les meilleurs moyens de faire face à des variations
significatives des écosystèmes : changement de conditions (température,
humidité), de disponibilité de ressources, apparition de nouvelles d’espèces
invasives… Et pourquoi pas le tester face à des humains de différentes
cultures, pour mettre en évidence un moyen original de faire face aux défis qui
nous attendent ? Bien que tout cela relève du fantasme à l’heure où ces lignes
paraissent, il ne semble pas idiot que quelques espoirs soient fondés sur la
capacité d’une intelligence libre de tout carcan humain à faire des choix pertinents. Il
nous appartiendra in fine de les
appliquer ou non pour entraîner des changements positifs et durables. Que tout
cela dérive d’une partie de StarCraft, avouez quand même que ça aurait de la
gueule.
Pour en apprendre plus
sur l’apprentissage d’AlphaStar :
https://deepmind.com/blog/article/alphastar-mastering-real-time-strategy-game-starcraft-ii
Précédents
billets de la rubrique :
Stickology #3 : La musique de jeu vidéo nous stresse-t-elle ?Stickology #4 : Quels genres de jeux nous stressent le plus ?
Stickology #5 : La représentation de la femme et le sexisme dans le jeu vidéo
Stickology #6 : Cerner l'addiction aux jeux vidéo pour mieux l'étudier
Stickology #7 : Apprendre à se brosser les dents avec Kinect
Aucun commentaire:
Enregistrer un commentaire
Qu'est-ce que vous en dites ?