Intelligence artificielle : nouvelle lecture des réseaux de neurones

Et si les systèmes d’intelligence artificielle pouvaient être compris comme des joueurs engagés dans une partie interactive et stratégique, faite de coopération, de compétition, de co-opétition et de stratégies évolutives?

C’est l’hypothèse au cœur de l’ouvrage GPT Meets Game Theory, écrit par le professeur Hamidou Tembine, du Département de génie électrique et génie informatique, qui propose une lecture inédite des réseaux de neurones modernes à travers le prisme de la théorie des jeux.

L’ouvrage s’intéresse en particulier aux transformeurs, ces architectures qui constituent aujourd’hui la base des modèles d’IA les plus avancés. En mobilisant des concepts mathématiques issus de la théorie des jeux, mais aussi des analogies empruntées à la biologie et à la physique, le professeur Hamidou Tembine cherche à rendre plus lisibles les dynamiques internes de ces systèmes devenus de plus en plus complexes à mesure qu’ils s’entraînent sur des volumes massifs de données.

L’un des apports majeurs du livre est de proposer un cadre d’interprétation des comportements des modèles d’IA comme des équilibres dynamiques entre plusieurs agents. Dans cette perspective, entraîner un modèle revient moins à optimiser une fonction abstraite qu’à orchestrer une série d’interactions stratégiques, où chaque paramètre influence et est influencé par les autres.

Cette lecture prend une dimension encore plus concrète lorsqu’elle est appliquée aux modèles dits de « type champ moyen » (mean-field-type), où deux, un nombre moyen ou un très grand nombre d’agents interagissent de manière collective. Elle trouve également des applications directes dans le domaine de l’apprentissage fédéré, une approche où plusieurs appareils ou entités participent conjointement à l’entraînement d’un modèle sans centraliser leurs données.

Au-delà des aspects théoriques, GPT Meets Game Theory propose ainsi une grille de lecture pour mieux comprendre, et potentiellement mieux contrôler, le comportement des intelligences artificielles contemporaines. Le choix d’une architecture, d’une méthode d’entraînement ou d’une stratégie d’optimisation y est présenté comme une série de décisions stratégiques comparables à des coups joués dans une partie interactive impliquant de multiples acteurs.

Destiné aux chercheurs en informatique, en mathématiques et en ingénierie, l’ouvrage s’adresse également à toute personne curieuse de comprendre les fondements mathématiques des modèles d’apprentissage profond. Il met en lumière une idée centrale : à mesure que l’IA devient plus distribuée et interactive, la théorie des jeux pourrait devenir un outil essentiel pour en décrypter les logiques internes.

Nous joindre

À propos