Du machine learning et des données. Découvrir #2

pixees Scienceparticipative

6 Apr 202009:36

Summary

TLDRLe machine learning, ou apprentissage automatique, repose sur des algorithmes qui apprennent à partir d'exemples et non de règles programmées à l'avance. Ce processus inclut l'apprentissage supervisé, où l'algorithme apprend avec des données étiquetées, et l'apprentissage par renforcement, où l'algorithme ajuste ses actions en fonction des retours reçus. Le deep learning, une méthode plus avancée, utilise des réseaux de neurones profonds pour traiter des données complexes comme des images. Cependant, l'efficacité des IA dépend de la qualité des données et des ressources nécessaires à leur formation, ce qui soulève des préoccupations éthiques et écologiques.

Takeaways

😀 L'intelligence artificielle (IA) repose sur deux approches d'apprentissage : l'apprentissage symbolique (basé sur des savoirs transmis) et l'apprentissage automatique (basé sur l'expérience).
😀 L'apprentissage automatique permet à une machine d'apprendre à partir d'exemples, en ajustant ses paramètres grâce à des approches statistiques sans avoir à être programmée explicitement.
😀 Un exemple simple d'apprentissage automatique : un botaniste observe la relation entre la hauteur et le diamètre des arbres, et l'IA peut prédire la hauteur d'un arbre en fonction de son diamètre grâce à des données d'entraînement.
😀 Le processus d'apprentissage automatique passe par deux étapes clés : l'entraînement (avec des données étiquetées) et la prédiction (l'algorithme fait des prédictions sur de nouvelles données).
😀 L'apprentissage par renforcement permet à une machine d'apprendre par essais et erreurs, ajustant ses actions selon des récompenses ou punitions, comme un enfant apprenant à faire du vélo.
😀 Le deep learning (apprentissage profond) repose sur des réseaux de neurones artificiels, qui imitent grossièrement le fonctionnement des neurones biologiques pour accomplir des calculs complexes.
😀 Les réseaux de neurones profonds utilisent plusieurs couches successives de neurones, permettant au modèle d'extraire progressivement des caractéristiques plus complexes et de réaliser des prédictions sur de nouvelles données.
😀 Les réseaux de neurones peuvent apprendre à reconnaître des objets dans des images (par exemple, des chats), même si l'algorithme ne connaît initialement que des données d'entraînement étiquetées.
😀 La qualité des données est essentielle : des données mauvaises, peu nombreuses ou mal annotées peuvent entraîner des prédictions erronées, ce qui souligne l'importance de collecter et d'annoter correctement les données.
😀 Les données peuvent provenir de différentes sources : capteurs, publications sur les réseaux sociaux, achats en ligne, etc. Ces données sont souvent collectées gratuitement en échange de services numériques, ce qui pose des questions éthiques.
😀 Les centres de données consomment énormément d'énergie pour stocker et traiter les données, ce qui soulève des préoccupations sur le rapport coût/efficacité de l'IA, et souligne l'importance de l'encadrement des pratiques de collecte de données, comme le RGPD.