Les mathématiques complexes des contrefactuels pourraient aider Spotify à choisir votre prochaine chanson préférée
Un nouveau type de modèle d'apprentissage automatique est mis en place pour améliorer la prise de décision automatisée dans les domaines de la finance, de la santé, du ciblage publicitaire, etc.
Un nouveau type de modèle d'apprentissage automatique construit par une équipe de chercheurs de la société de streaming musical Spotify capture pour la première fois les mathématiques complexes derrière l'analyse contrefactuelle, une technique précise qui peut être utilisée pour identifier les causes des événements passés et prédire les effets des événements futurs.
Le modèle, décrit plus tôt cette année dans la revue scientifique Nature Machine Intelligence, pourrait améliorer la précision de la prise de décision automatisée, en particulier des recommandations personnalisées, dans une gamme d'applications allant de la finance aux soins de santé.
L'idée de base derrière les contrefactuels est de se demander ce qui se serait passé dans une situation si certaines choses avaient été différentes. C'est comme rembobiner le monde, changer quelques détails cruciaux, puis appuyer sur play pour voir ce qui se passe. En ajustant les bonnes choses, il est possible de séparer la véritable causalité de la corrélation et de la coïncidence.
"Comprendre la cause et l'effet est extrêmement important pour la prise de décision", déclare Ciaran Gilligan-Lee, responsable du laboratoire de recherche sur l'inférence causale chez Spotify, qui a co-développé le modèle. "Vous voulez comprendre quel impact un choix que vous faites maintenant aura sur l'avenir."
Dans le cas de Spotify, cela peut signifier choisir les chansons à vous montrer ou quand les artistes doivent sortir un nouvel album. Spotify n'utilise pas encore de contrefactuels, dit Gilligan-Lee. "Mais ils pourraient aider à répondre aux questions que nous traitons tous les jours."
Les contrefactuels sont intuitifs. Les gens donnent souvent un sens au monde en imaginant comment les choses se seraient déroulées si ceci s'était produit au lieu de cela. Mais ils sont monstrueux mis en maths.
"Les contrefactuels sont des objets statistiques très étranges", explique Gilligan-Lee. "Ce sont des choses étranges à contempler. Vous demandez la probabilité que quelque chose se produise étant donné que cela ne s'est pas produit."
Gilligan-Lee et ses co-auteurs ont commencé à travailler ensemble après avoir lu le travail de chacun dans un article du MIT Technology Review. Ils ont basé leur modèle sur un cadre théorique pour des contrefactuels appelés réseaux jumeaux.
Les réseaux jumeaux ont été inventés dans les années 1990 par les informaticiens Andrew Balke et Judea Pearl. En 2011, Pearl a remporté le prix Turing, le prix Nobel de l'informatique, pour ses travaux sur le raisonnement causal et l'intelligence artificielle.
Pearl et Balke ont utilisé des réseaux jumeaux pour travailler sur une poignée d'exemples simples, explique Gilligan-Lee. Mais appliquer manuellement le cadre mathématique à des cas réels plus vastes et plus complexes est difficile.
C'est là qu'intervient l'apprentissage automatique. Les réseaux jumeaux traitent les contrefactuels comme une paire de modèles probabilistes : l'un représentant le monde réel, l'autre représentant le monde fictif. Les modèles sont liés de telle manière que le modèle du monde réel contraint le modèle du monde fictif, en le gardant le même à tous points de vue, sauf pour les faits que vous souhaitez modifier.
Gilligan-Lee et ses collègues ont utilisé le cadre des réseaux jumeaux comme modèle pour un réseau de neurones, puis l'ont formé pour faire des prédictions sur la façon dont les événements se dérouleraient dans le monde fictif. Le résultat est un programme informatique à usage général pour effectuer un raisonnement contrefactuel. "Cela vous permet de répondre à toute question contrefactuelle sur un scénario que vous souhaitez", explique Gilligan-Lee.
L'équipe Spotify a testé son modèle à l'aide de plusieurs études de cas réelles, dont une portant sur l'approbation du crédit en Allemagne, une sur un essai clinique international pour les médicaments contre les AVC et une autre sur la sécurité de l'approvisionnement en eau au Kenya.
En 2020, des chercheurs ont cherché à savoir si l'installation de tuyaux et de conteneurs en béton pour protéger les sources de la contamination bactérienne dans une région du Kenya réduirait les niveaux de diarrhée infantile. Ils ont trouvé un effet positif. Mais vous devez être sûr de ce qui l'a causé, dit Gilligan-Lee. Avant d'installer des murs en béton autour des puits à travers le pays, vous devez vous assurer que la baisse de la maladie a bien été causée par cette intervention et non un effet secondaire de celle-ci.
Il est possible que lorsque les chercheurs sont venus faire l'étude et installer des murs de béton autour des puits, cela a sensibilisé les gens aux risques de l'eau contaminée et ils ont commencé à la faire bouillir à la maison. Dans ce cas, "l'éducation serait un moyen moins coûteux d'étendre l'intervention", déclare Gilligan-Lee.
Un groupe croissant d'avocats découvre, navigue et combat les systèmes automatisés qui privent les pauvres de logements, d'emplois et de services de base.
Gilligan-Lee et ses collègues ont présenté ce scénario à travers leur modèle, demandant si les enfants qui sont tombés malades après avoir bu dans un puits non protégé dans le monde réel sont également tombés malades après avoir bu dans un puits protégé dans le monde fictif. Ils ont constaté que le fait de changer uniquement le détail de l'endroit où l'enfant buvait et de maintenir d'autres conditions, telles que la façon dont l'eau était traitée à la maison, n'avait pas d'impact significatif sur le résultat, suggérant que la réduction des niveaux de diarrhée infantile n'était pas (directement) causée par l'installation de tuyaux et de conteneurs en béton.
Cela reproduit le résultat de l'étude de 2020, qui a également utilisé un raisonnement contrefactuel. Mais ces chercheurs ont construit un modèle statistique sur mesure à la main juste pour poser cette question, dit Gilligan-Lee. En revanche, le modèle d'apprentissage automatique de l'équipe Spotify est à usage général et peut être utilisé pour poser plusieurs questions contrefactuelles sur de nombreux scénarios différents.
Spotify n'est pas la seule entreprise technologique à s'efforcer de créer des modèles d'apprentissage automatique capables de raisonner sur les causes et les effets. Au cours des dernières années, des entreprises telles que Meta, Amazon, LinkedIn et le propriétaire de TikTok, ByteDance, ont également commencé à développer la technologie.
"Le raisonnement causal est essentiel pour l'apprentissage automatique", déclare Nailong Zhang, ingénieur logiciel chez Meta. Meta utilise l'inférence causale dans un modèle d'apprentissage automatique qui gère le nombre et le type de notifications qu'Instagram doit envoyer à ses utilisateurs pour les inciter à revenir.
Romila Pradhan, scientifique des données à l'Université Purdue dans l'Indiana, utilise des contrefactuels pour rendre la prise de décision automatisée plus transparente. Les organisations utilisent désormais des modèles d'apprentissage automatique pour choisir qui obtient un crédit, un emploi, une libération conditionnelle, voire un logement (et qui n'en a pas). Les régulateurs ont commencé à exiger des organisations qu'elles expliquent le résultat de bon nombre de ces décisions aux personnes concernées. Mais reconstruire les étapes effectuées par un algorithme complexe est difficile.
Pradhan pense que les contrefactuels peuvent aider. Supposons que le modèle d'apprentissage automatique d'une banque rejette votre demande de prêt et que vous vouliez savoir pourquoi. Une façon de répondre à cette question est d'utiliser des contrefactuels. Étant donné que la demande a été rejetée dans le monde réel, aurait-elle été rejetée dans un monde fictif dans lequel votre historique de crédit était différent ? Et si vous aviez un code postal, un emploi, un revenu, etc. différents ? Construire la capacité de répondre à ces questions dans les futurs programmes d'approbation de prêt, dit Pradhan, donnerait aux banques un moyen d'offrir aux clients des raisons plutôt qu'un simple oui ou non.
Les contrefactuels sont importants car c'est la façon dont les gens pensent aux différents résultats, dit Pradhan : "Ils sont un bon moyen de saisir des explications."
Ils peuvent également aider les entreprises à prédire le comportement des gens. Parce que les contrefactuels permettent de déduire ce qui pourrait se passer dans une situation particulière, et pas seulement en moyenne, les plateformes technologiques peuvent l'utiliser pour classer les gens avec plus de précision que jamais.
La même logique qui peut démêler les effets de l'eau sale ou des décisions de prêt peut être utilisée pour affiner l'impact des listes de lecture Spotify, des notifications Instagram et du ciblage publicitaire. Si nous jouons cette chanson, cet utilisateur écoutera-t-il plus longtemps ? Si nous montrons cette image, cette personne continuera-t-elle à défiler ? "Les entreprises veulent comprendre comment donner des recommandations à des utilisateurs spécifiques plutôt qu'à l'utilisateur moyen", explique Gilligan-Lee.
"J'ai soudainement changé d'avis sur la question de savoir si ces choses vont être plus intelligentes que nous."
Hinton prendra la parole à EmTech Digital mercredi.
ChatGPT a suscité des spéculations sur l'intelligence artificielle générale. Mais la prochaine véritable phase de l'IA se situera dans des domaines et des contextes spécifiques.
Regardez Hinton s'entretenir avec Will Douglas Heaven, rédacteur en chef de MIT Technology Review pour l'IA, chez EmTech Digital.
Découvrez les offres spéciales, les meilleures histoires, les événements à venir et plus encore.
Merci d'avoir soumis votre e-mail !
On dirait que quelque chose s'est mal passé.
Nous rencontrons des difficultés pour enregistrer vos préférences. Essayez d'actualiser cette page et de les mettre à jour une fois de plus. Si vous continuez à recevoir ce message, contactez-nous à l'adresse [email protected] avec une liste des newsletters que vous souhaitez recevoir.