L’apprentissage machine en profondeur
Lorsque l’on présente à un enfant des images de chats et de chiens, celui-ci arrive généralement à les différencier avec très peu d’erreurs. Il est même capable de reconnaître si ce n’est ni l’un ni l’autre. Un modèle d’apprentissage automatique (agent IA) est capable de faire la même chose, mais, contrairement à la situation de l’apprentissage humain, l’IA a besoin de voir des centaines de milliers de photos de chats et de chiens (dans la phase d’entraînement) pour commencer à apprendre des motifs qui lui permettent d’identifier l’animal*. Après suffisamment d’entraînement, comme une personne étudiante, le modèle est évalué sur son apprentissage : on calcule son taux de « bonnes réponses » sur de nouveaux exemples de photos de chats et de chiens et, avec un peu de chance, il aura une aussi bonne note qu’une personne. On appelle cette phase d’évaluation, le test ou la validation.
* Les modèles d’apprentissage automatique ne sont pas « intelligents ». Si on les a entraînés sur des exemples d’images de chats et de chiens seulement, ils pourraient classifier, par exemple, une image de pingouin en chat ou en chien. L’IA ne peut résoudre que des problèmes sur lesquels elle a déjà été entraînée.
Quels sont donc les facteurs qui influencent la performance d’un modèle ? Il y en a deux : les données et l’algorithme.
En ce qui concerne les données, il s’agit surtout de quantité et de qualité. Pour l’exemple des images, une faible résolution pourrait avoir une conséquence négative sur la performance du modèle après l’entraînement. Donc ici, plus les données sont de qualité, plus la capacité d’inférence du modèle sera grande et inversement, plus les données d’entraînement sont de basse qualité ou corrompues, plus la capacité de l’IA de fournir des réponses de qualité diminue.
Pour les algorithmes, nous allons identifier les deux grandes familles d’apprentissage automatique les plus populaires : l’apprentissage automatique classique (depuis les années 1950) et l’apprentissage profond (deep learning). Ce dernier apparaît autour des années 1980.
L’intelligence artificielle est un ensemble de techniques qui permettent à une ou plusieurs machines de résoudre des problèmes plus ou moins complexes. |
L’apprentissage automatique est un ensemble de techniques inspiré par le domaine des statistiques, dans lequel l’ordinateur formalise des règles dynamiquement à partir de données. Néanmoins, elles nécessitent souvent l’intervention humaine quant à l’analyse des données. |
L’apprentissage profond est un ensemble de techniques inspiré par les neurosciences, dans lesquelles l’ordinateur détermine par lui-même les schémas d’apprentissage à partir des données. Dans ce schéma, l’intervention humaine est plus limitée. |
Cendre, Romain. (2021). Classification par méthodes d’apprentissage supervisé et faiblement supervisé d’images multimodales pour l’aide au diagnostic du lentigo malin en dermatologie [thèse de doctorat, Université de Bourgogne]. ResearchGate. https://www.researchgate.net/figure/Representation-des-relations-entre-intelligence-artificielle-apprentissage-automatique_fig18_349180505
L’apprentissage automatique classique
L’apprentissage automatique classique se base sur des algorithmes (des programmes) facilement interprétables pour résoudre des problèmes relativement simples, comme la prédiction du prix de l’immobilier, mais moins sophistiqués que la classification d’objets complexes tels que des images (par exemple, les chats et les chiens).
Prenons l’exemple de la prédiction du prix de l’immobilier. Les données auxquelles nous devons avoir accès sont le prix de vente et les caractéristiques : la superficie, l’adresse, le nombre d’étages, de pièces, de salles de bain, etc. Sans certaines d’entre elles, il est impossible pour le modèle d’apprentissage automatique classique d’apprendre à faire des prédictions.
Le deuxième ingrédient nécessaire à l’apprentissage automatique classique est l’algorithme de classification qui prédit la catégorie des données selon leur proximité les unes des autres dans une représentation graphique donnée. Pour mieux comprendre cela, supposons que l’on puisse visualiser toute personne vivante comme des petits points sur une carte du monde et supposons que les catégories (dites classes dans le jargon de l’apprentissage automatique) soient les nationalités. Si l’on prend un regroupement de 100 personnes sur la carte, les chances que ces individus aient la même nationalité (classe) sont très élevées. Ces chances diminuent plus le nombre de points augmente.
L’apprentissage profond
Maintenant, prenons le problème de la reconnaissance faciale (nécessaire pour déverrouiller votre téléphone). Pour le résoudre, quels algorithmes utiliser ? Quelles sont les caractéristiques ? Comment faire comprendre à la machine ce qu’est un nez, une bouche, des yeux, etc. ?
Une piste à suivre pour résoudre ce problème serait de s’inspirer du cerveau humain qui est déjà doté de cette capacité : c’est exactement ce que l’on fait en apprentissage profond !
Un modèle profond, contrairement à un modèle d’apprentissage automatique classique, ne va pas suivre un algorithme d’apprentissage précis. Il va se baser sur une architecture de réseau neuronal. Comme son nom l’indique, cette approche est inspirée de la biologie du cerveau. Chaque neurone reçoit des informations, les transforme grâce à des calculs puis les envoie à d’autres neurones. Les connexions entre les neurones peuvent être renforcées (amplifiées) ou affaiblies (réduites) selon leur importance, ce qui imite les synapses du cerveau. Cela permet au réseau de se concentrer sur les informations importantes et de les transformer pour obtenir des caractéristiques utiles.
Cependant, l’apprentissage profond n’est pas parfait, il a de nombreux inconvénients : un besoin en quantité de données exubérante pour permettre aux modèles d’apprendre des caractéristiques implicites, et un manque d’interprétabilité de l’algorithme et des opérations de calculs statistiques complexes qui se passent sous le capot du réseau de neurones. Pour cette raison, on continue d’utiliser l’apprentissage automatique classique pour les problèmes qui ne nécessitent pas de la puissance de prédiction des réseaux de neurones.