Libratus poker

Un robot qui joue au poker travaille pour le Pentagone aux Etats-Unis

En 2017, un robot de poker appelé Libratus a fait la une des journaux lorsqu’il a battu quatre des meilleurs joueurs humains au Texas Hold’Em no limit. Aujourd’hui, la technologie de Libratus est en cours d’adaptation pour s’attaquer à des opposants d’un autre type de service de l’armée américaine.

Libratus a été créé par des chercheurs de l’Université Carnegie Mellon pour tester des idées de prise de décision automatisée basée sur la théorie des jeux. Au début de l’année dernière, le professeur Tuomas Sandholm, qui a dirigé le projet, a fondé une jeune entreprise appelée Strategy Robot pour adapter la technologie de jeu de son laboratoire à l’usage du gouvernement, par exemple pour les jeux de guerre et les simulations utilisées pour explorer la stratégie et la planification militaires. Fin août, selon les archives publiques, l’entreprise a reçu un contrat de deux ans d’une valeur maximale de 10 millions de dollars avec l’armée américaine. Il est décrit comme « en soutien » à une agence du Pentagone appelée Defense Innovation Unit, créée en 2015 pour courtiser la Silicon Valley et accélérer l’adoption des nouvelles technologies par l’armée américaine.

La défaite de Libratus contre les pros du poker en 2017 a été considérée comme une étape importante dans l’IA parce que le jeu de cartes a des caractéristiques complexes qui manquent dans les jeux de plateau les plus maîtrisés par les ordinateurs. Aux échecs et au Go, chaque pièce est exposée pour que les deux joueurs puissent la voir, ce qui en fait ce qu’on appelle des jeux d’information parfaits. Au poker, toutes les cartes ne sont pas visibles, ce qui signifie que – comme dans de nombreux scénarios de la vie réelle – certaines informations nécessaires pour calculer l’état réel du jeu sont inconnues. Libratus a été construit sur une technologie appelée théorie des jeux informatiques. Elle a gagné plus de 1,8 million de dollars en argent de jeu auprès des champions de poker en calculant comment ils pourraient réagir à ses décisions. Le logiciel a conçu de puissantes stratégies de paris et a même montré sa capacité à bluffer.

Sandholm dit que cette approche peut être appliquée à de nombreux autres jeux, ainsi qu’à des simulations militaires. Les exercices de jeu de guerre ne testent généralement qu’un petit nombre de stratégies pour des adversaires imaginaires, même lorsqu’ils sont exécutés sous forme de simulations informatiques, dit-il. « Cela vous expose à beaucoup d’exploitation, parce que le véritable adversaire peut ne pas jouer selon vos suppositions « , dit Sandholm.

Sandholm refuse de discuter des spécificités des projets de Strategy Robot, qui incluent au moins un autre contrat gouvernemental. Il dit qu’il peut s’attaquer à des simulations qui impliquent de prendre des décisions dans un espace physique simulé, par exemple où placer des unités militaires. L’Unité d’innovation de la Défense a refusé de commenter le projet, et l’Armée de terre n’a pas répondu aux demandes de commentaires.

La technique de poker de Libratus suggère que Strategy Robot pourrait fournir au personnel militaire des recommandations surprenantes. Les joueurs professionnels qui se sont attaqués au robot ont trouvé qu’il a basculé de façon troublante entre des tactiques apprivoisées et hyper agressives, tout en ne cessant d’accumuler les victoires alors qu’il calcule les chemins de la victoire. « C’est bizarre parce qu’il ne semble pas que cela vous submerge, mais ensuite vous regardez le score et vous vous rendez compte de ce qui s’est passé « , dit Sandholm.

Greg Allen, membre auxiliaire du groupe de réflexion du Center for a New American Security, affirme que le type de technologie qui alimentait Libratus pourrait rendre les jeux de guerre et les exercices de simulation plus utiles. « C’est encore loin d’être réel, mais c’est un meilleur substitut pour le monde réel « , dit-il. Quoi qu’il en soit, les résultats ne resteront probablement qu’une composante de la planification stratégique et de la recherche, dit-il, car le monde est beaucoup plus complexe et désordonné que les scénarios que même la meilleure technologie d’IA peut maîtriser.

Strategy Robot n’est pas la seule nouvelle incursion du Pentagone dans la théorie des jeux améliorée par l’IA. Son agence de recherche Darpa lance un programme pour explorer comment la technologie peut être appliquée à la prise de décision militaire. Michael Wellman, professeur à l’Université du Michigan, dit que son groupe travaille à l’application de la théorie computationnelle des jeux à la cybersécurité dans le cadre de ce programme. Il dit que Libratus peut être vu comme un signe que la technologie est en train de mûrir. « Il est vraiment temps d’essayer dans des domaines plus réels « , dit-il. « La percée au poker était si frappante, et les choses vont vite avec les autres jeux. »

En plus de Strategy Robot, Sandholm a fondé une deuxième startup appelée Strategic Machine, qui déploie ses techniques de résolution de jeux dans des environnements commerciaux, tels que les marchés de l’électricité, les sports, et rend les joueurs contrôlés par ordinateur dans les jeux vidéo adversaires wilier. Les deux entreprises sont piégées, comptent environ six employés et sont rentables, dit M. Sandholm.

De retour dans son laboratoire informatique CMU, Sandholm réfléchit également à la façon de rendre sa technologie plus portable. Lorsque Libratus s’est attaqué aux pros du poker, il a fonctionné sur le superordinateur Bridges au Pittsburgh Supercomputing Center financé par le gouvernement fédéral ; Sandholm dit que ses startups ont également utilisé des supercalculateurs. Lors de NeurIPS, la plus grande conférence mondiale sur l’IA le mois dernier, lui et son collaborateur sur Libratus, Noam Brown, ont présenté un article sur un robot de poker moins puissant mais plus compact appelé Modicum qui peut fonctionner sur un seul serveur. « Dans certaines applications, il faut le miniaturiser, s’il y a quelque chose à bord « , explique M. Sandholm. « Certaines plates-formes ne peuvent pas transporter de gros ordinateurs. »

Le Pentagone fait pression pour une utilisation plus large de la technologie de l’IA. En 2017, James Mattis, alors ministre américain de la Défense, déplorait que son département soit à la traîne des entreprises technologiques dans l’adoption de technologies comme l’apprentissage machine. La même année, le Pentagone a lancé un programme appelé Project Maven, destiné à employer des techniques d’IA disponibles dans le commerce sur les missions américaines. Son projet initial utilisait l’apprentissage machine pour repérer les objets dans les vidéos de surveillance de drones, avec l’aide de startups expertes en intelligence artificielle et de grandes entreprises, dont Google.

D’autres pays explorent également les utilisations militaires de l’IA. Le président russe Vladimir Poutine a déclaré que celui qui dirigera l’IA « deviendra le dirigeant du monde ». Les applications militaires occupent une place importante dans la stratégie nationale de la Chine en matière d’IA. En 2017, l’Université de la défense nationale de Chine a organisé un concours national de jeux de guerre dans lequel des équipes humaines ont affronté un système d’IA.

L’intérêt militaire croissant pour l’IA dérange certains technologues qui font progresser la technologie sous-jacente. Certains chercheurs de Google se sont joints aux milliers d’employés qui ont protesté contre le travail de l’entreprise sur le projet Maven.

M. Sandholm estime que les préoccupations concernant l’utilisation de l’IA par l’armée américaine sont exagérées. Cette technologie est importante pour aider le Pentagone à assurer la sécurité des États-Unis et à améliorer l’efficacité opérationnelle, dit-il. « Je pense que l’IA va rendre le monde beaucoup plus sûr « , dit Sandholm.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.