Une brève présentation du Machine Learning

Le machine learning, ou apprentissage automatique, est un concept indissociable de l'intelligence artificielle. Voici en quoi il consiste.

Une brève présentation du Machine Learning

En 2016, Microsoft testait sur Twitter sa nouvelle IA « Tay », un programme capable d’interagir avec la communauté. Se prenant rapidement au jeu, les internautes ont vite fait déchanter la jeune IA : après seulement 24h, elle commençait à déblatérer des phrases racistes, antisémites, et j’en passe, . Oui, oui vous ne rêvez pas ! Elle a bien déclaré : « I fucking hate feminists and they should all die and burn in hell.” Bonne ambiance…

Quelques exemples de propos tenu par Tay | © Sciences et Avenir
Quelques exemples de propos tenu par Tay | © Sciences et Avenir

Au-delà de ces paroles purement fallacieuses, de l’IA de Microsoft a néanmoins répondu à une attente : elle a appris, lu et répété ce que les internautes lui disaient en se nourrissant de chaque information. L’apprentissage automatique (ou Machine Learning en anglais) a fonctionné, et cette expérience en montre les possibilités exceptionnelles (et surtout les limites). Aujourd’hui, nous allons parler du Machine Learning, et du potentiel qu'a cette technologie.

D’où vient le terme Machine Learning ? Le terme est formulé en 1959 par Samuel Arthur, ingénieur chez IBM à l’origine du premier programme d’apprentissage automatique. Ce programme apprenait à jouer et à battre de vrais joueurs au jeu de dames, 40 ans avant que DeepBlue ne triomphe de Gary Kasparov aux échecs.

Arthur Samuel, pionnier de l'apprentissage automatique | © IBM
Arthur Samuel, pionnier de l'apprentissage automatique | © IBM

Pour faire simple, le Machine Learning est un domaine de l’intelligence artificielle où un programme, un système « apprend » à analyser, prédire et effectuer des tâches données à partir de données et d’instructions sous forme de langage informatique. Si l'on reprend le cas évoqué en introduction, le but de l'IA Tay était d’apprendre des réponses d’autrui sur Twitter, pour répondre plus précisément aux internautes et être capable de tenir une discussion. Plus on entraîne un programme sur des données spécifiques, organisées et traitées par une personne et plus le programme sera performant et précis dans son exécution.

Le Machine Learning repose donc énormément sur les banques de données que vous avez à votre disposition et sur le traitement de ces dernières. Cependant, il ne faut pas oublier que l'efficacité de cette technique est aussi déterminée par la capacité de vos programmes à « apprendre » - ou plus précisément à "exécuter votre code" - avec ce que vous leur mettez sous la dent. Votre IA n’est donc pas intelligente : elle effectue ce pourquoi vous l’avez programmée et s’améliore avec les données que vous lui fournissez !

Différentes étapes du machine learning | © HTTPCS by Ziwit
Différentes étapes du machine learning | © HTTPCS by Ziwit

Le Machine Learning est un sujet complexe et l'on pourrait passer des heures à essayer de donner une définition exhaustive. Pour rester à un niveau compréhensible, partons de ce que nous venons d'expliquer : l’IA « apprend » (ou plutôt s’entraîne) avec les données que vous lui fournissez. Plusieurs manières d'apprendre existent et voici les quatre plus connues :

  • L’apprentissage supervisé : Les données sont déjà sélectionnées et triées pour que l’algorithme s’entraîne à reconnaître uniquement le type de données que vous avez choisi
  • L’apprentissage non supervisé : Les données ne sont pas choisies et l’algorithme s’entraîne à associer les données entre elles.
  • L’apprentissage semi-supervisé : Dans ce cas, certaines données sont choisies et spécifiées à l’algorithme, tandis que d’autres non. C’est le mix des deux apprentissages précédents.
  • L’apprentissage par renforcement : Ici, on laisse l’algorithme faire et s’il réussit la tâche souhaitée, il est « récompensé », c'est-à-dire que l’exécution du code lui fait comprendre qu’il a réussi sa tâche. L'algorithme s’améliore également au fur et à mesure.

Comme on peut le voir avec ces définitions, les possibilités du Machine Learning sont multiples et, cette technologie peut servir dans plusieurs domaines : créer des schémas prédictifs pour observer l’évolution possible des ventes d'une entreprise, analyser des comportements humains en économie, reconnaître des visages humains (reconnaissance faciale), etc.

Retenez néanmoins une chose : sans une quantité suffisante de données, le Machine Learning est inopérant. De plus, la capacité de l'algorithme à faire la tâche que vous souhaitez dépend de la qualité de son écriture. Donc pas de panique: si vous programmez des algorithmes d’IA sans une équipe d'experts à vos côtés, ces programmes ne prendront pas le contrôle de votre ordinateur à votre insu !

Vous retrouverez en fin de bibliographie un cours d’initiation au Machine Learning réalisé par la plateforme OpenClassrooms en partenariat avec Centrale Supélec. En complément de cet article, ce cours vous permettra de bien comprendre les principes fondamentaux et les subtilités du Machine Learning.

Pierre M.


Sources