Trouvez facilement votre prochaine lecture
8 livres de référence pour s'initier au machine learning sur de bonnes bases

8 livres de référence pour s’initier au machine learning sur de bonnes bases

Le machine learning, ou apprentissage automatique en français, est une branche de l’intelligence artificielle qui consiste à enseigner aux ordinateurs à apprendre à partir de données. En d’autres termes, au lieu de dire à un ordinateur comment résoudre un problème, on lui montre des exemples et il apprend à résoudre le problème lui-même.

Le machine learning est aujourd’hui central dans de nombreux domaines, notamment la médecine, la finance, les sciences, et même dans notre vie quotidienne avec des applications comme les recommandations de produits en ligne, la reconnaissance vocale ou encore la conduite autonome des véhicules.

Tour d’horizon des ouvrages de référence sur le sujet.

Voir aussi : livres sur le deep learning


1. Le machine learning avec Python (Sarah Guido, Andreas C. Müller)

Disponible sur Amazon Disponible à la Fnac

Entrez de plain-pied dans le monde fascinant la data science ! Vous aussi participez à la révolution qui ramène l’intelligence artificielle au cœur de notre société, grâce aux data scientists.

La data science consiste à traduire des problèmes de toute autre nature, en problèmes de modélisation quantitative, résolus par des algorithmes de traitement. Ce livre se présente comme une référence pour tous les développeurs, statisticiens ou chefs de projets ayant à résoudre des problèmes liés à la data science.

Au programme :

  • Pourquoi utiliser le machine learning
  • Les différentes versions de Python
  • L’apprentissage non supervisé et le préprocessing
  • Représenter les données
  • Processus de validation
  • Algorithmes, chaînes et pipeline
  • Travailler avec des données de type texte
  • Du prototype à la production.

Éditions FIRST INTERACTIVE ; 384 pages.

Cliquez sur les images pour voir un aperçu du livre


2. Machine learning avec Scikit-learn (Aurélien Géron)

Disponible sur Amazon Disponible à la Fnac

L’apprentissage automatique (machine learning) est aujourd’hui en pleine explosion. Mais de quoi s’agit-il exactement, et comment pouvez-vous le mettre en œuvre dans vos propres projets ?

La 3e édition de cet ouvrage de référence vous explique les concepts fondamentaux du machine learning et vous apprend à maîtriser les outils qui vous permettront de créer vous-même des systèmes capables d’apprentissage automatique.

Vous apprendrez ainsi à utiliser Scikit-Learn, un outil open source très simple et néanmoins très puissant que vous pourrez mettre en place dans vos systèmes en production.

Au menu :

  • Apprendre les bases du machine learning en suivant pas à pas toutes les étapes d’un projet utilisant Scikit-Learn et Pandas.
  • Ouvrir les boîtes noires pour comprendre comment fonctionnent les algorithmes.
  • Explorer plusieurs modèles d’entraînement, notamment les machines à vecteur de support (SVM).
  • Comprendre le modèle des arbres de décision et celui des forêts aléatoires, et exploiter la puissance des méthodes ensemblistes.
  • Exploiter des techniques d’apprentissage non supervisées telles que la réduction de dimensionnalité, la classification et la détection d’anomalies.

Tous les exemples de code sont disponibles en ligne sous la forme de notebooks Jupyter à l’adresse suivante : https://github.com/ageron/handson-ml3.

Éditions DUNOD ; 356 pages.

Cliquez sur les images pour voir un aperçu du livre


3. Machine learning avec R (Scott V. Burger)

Disponible sur Amazon Disponible à la Fnac

L’apprentissage automatique est un sujet intimidant jusqu’à ce que vous en connaissiez les principes fondamentaux. Si vous comprenez les principes essentiels du codage, ce livre d’introduction vous aidera à acquérir une base solide dans le domaine de l’apprentissage automatique. En utilisant le langage de programmation R, vous commencerez par apprendre à modéliser avec la régression, puis vous passerez à des sujets plus avancés tels que les réseaux de neurones et les méthodes arborescentes.

Finalement, vous plongerez dans le monde de l’apprentissage automatique. en utilisant le package caret associé au langage de programmation R. Une fois que vous aurez développé une réelle familiarité avec des sujets tels que la différence entre les modèles de régression et de classification, vous serez en mesure de résoudre de multiples problèmes d’apprentissage automatique.

L’auteur, Scott V. Burger, fournit également plusieurs exemples pour vous aider à bâtir une connaissance pratique de l’apprentissage automatique.

Au programme :

  • Explorez le domaine de l’apprentissage automatique, de ses modèles, de ses algorithmes et de l’entraînement des données
  • Comprenez les algorithmes d’apprentissage automatique supervisés et non supervisés
  • Examinez les notions statistiques utiles pour la conception de données à utiliser dans les modèles
  • Plongez dans les modèles de régression linéaire utilisés dans les affaires et la science
  • Utilisez des réseaux de neurones monocouches et multicouches pour calculer les sorties
  • Regardez comment fonctionnent les modèles arborescents, y compris les arbres de décision courants
  • Obtenez une vue complète de l’écosystème de l’apprentissage automatique en R
  • Explorez la puissance des outils disponibles dans le package caret de R.

Éditions FIRST INTERACTIVE ; 260 pages.

Cliquez sur les images pour voir un aperçu du livre


4. The Hundred-page Machine Learning Book en français (Andriy Burkov)

Disponible sur Amazon

L’édition française du best-seller « The Hundred-page Machine Learning Book » de Andriy Burkov.

Peter Norvig, directeur de recherche chez Google, co-auteur de « AIMA », le manuel d’IA le plus populaire au monde : « Burkov a entrepris une tâche très utile, mais incroyablement difficile, de réduire l’apprentissage machine à 100 pages. Il réussit bien à choisir les sujets – à la fois théoriques et pratiques – qui seront utiles aux praticiens, et pour le lecteur qui comprend que ce sont les 100 premières (ou en réalité 150) pages que vous lirez, et non les dernières, constitue une solide introduction dans le domaine. »

Aurélien Géron, ingénieur principal en intelligence artificielle, auteur du best-seller « Hands-on Machine Learning With Scikit-learn, Keras, and Tensorflow » : « L’ampleur des sujets couverts par le livre est incroyable pour seulement 100 pages (plus quelques pages de bonus !). Burkov n’hésite pas d’entrer dans des équations mathématiques: c’est une chose que les livres courts oublient généralement. J’ai vraiment aimé la façon dont l’auteur explique les concepts de base en quelques mots seulement. Ce livre peut être très utile pour les nouveaux venus sur le terrain, ainsi que pour les anciens qui peuvent tirer profit d’une telle vision du domaine ».

Karolis Urbonas, Head of Data Science, Amazon: « Une excellente introduction à l’apprentissage machine par un praticien de renommée mondiale. »

Chao Han, VP, Head of R&D, Lucidworks: « J’aurais aimé avoir un tel livre lorsque j’étais étudiant en statistiques et que je voulais apprendre l’apprentissage machine. »

Sujeet Varakhedi, Head of Engineering, eBay : « Le livre d’Andriy est fantastique, il va droit au but et permet de rentrer dans le sujet à la vitesse grand V dès la première page. »

Deepak Agarwal, VP of Artificial Intelligence, LinkedIn: « Un livre merveilleux pour les ingénieurs qui veulent incorporer de l’apprentissage machine dans leur travail quotidien sans nécessairement y consacrer beaucoup de temps. »

Vincent Pollet, Head of Research, Nuance : « Une excellente lecture pour débuter en apprentissage machine. »

Autoédition ; 200 pages.


5. Introduction au machine learning (Chloé-Agathe Azencott)

Disponible sur Amazon Disponible à la Fnac

Cet ouvrage s’adresse aux étudiantes et étudiants en informatique ou maths appliquées, en L3, master ou école d’ingénieurs.

Le machine learning est une discipline dont les outils puissants permettent aujourd’hui à de nombreux secteurs d’activité de réaliser des progrès spectaculaires grâce à l’exploitation de grands volumes de données.

Le but de cet ouvrage est de vous fournir des bases solides sur les concepts et les algorithmes de ce domaine en plein essor. Il vous aidera à identifier les problèmes qui peuvent être résolus par une approche machine learning, à les formaliser, à identifier les algorithmes les mieux adaptés à chaque problème à les mettre en œuvre, et enfin à savoir évaluer les résultats obtenus.

Les notions de cours sont illustrées et complétées par 85 exercices, tous corrigés.

Éditions DUNOD ; 272 pages.


6. Le machine learning avec Python pour les nuls (Luca Massaron, John Paul Mueller)

Disponible sur Amazon Disponible à la Fnac

Vous aussi participez à la révolution qui ramène l’intelligence artificielle au cœur de notre société, grâce à la data science, au machine learning et à Python son langage de référence.

Ce livre va tout d’abord vous faire découvrir tous les ingrédients qui font du machine learning l’outil indispensable du développement d’applications liées à l’intelligence artificielle. Dans un second temps, vous découvrirez le langage vedette du machine learning et de la data science, le bien nommé Python.

Au programme :

  • Découvrez toutes les applications du quotidien qui utilisent le machine learning
  • Découvrez les langages du machine learning : Python et R, afin de vous adresser aux machines qui effectueront des traitements sur les données
  • Comprendre la syntaxe du langage Python
  • Concevoir des programmes et simplifier le développement
  • Blocs de données, chaînes et dictionnaires
  • S’initier à la programmation procédurale et orientée objet.

Éditions POUR LES NULS ; 716 pages.


7. Le machine learning avec Python – De la théorie à la pratique (Madjid Khichane)

Disponible sur Amazon Disponible à la Fnac

Ce livre sur le machine learning avec le langage Python permet de disposer des connaissances théoriques nécessaires pour une compréhension approfondie du machine learning et d’appréhender les outils techniques utiles pour mettre en pratique les concepts étudiés. L’auteur y expose des exemples concrets sur les concepts de l’apprentissage automatique. Les lecteurs avertis trouveront dans ce livre une occasion d’aller plus loin dans leur compréhension des algorithmes du machine learning.

L’auteur commence par expliquer les enjeux de la data science ainsi que les notions fondamentales du machine learning avant de présenter la démarche théorique d’une expérimentation en data science avec les notions de modélisation d’un problème et de métriques de mesure de performances d’un modèle.

Le lecteur peut ensuite passer à la pratique en manipulant les bibliothèques Python Numpy et Pandas ainsi que l’environnement Jupyter. Il peut ainsi aborder sereinement les chapitres à venir qui lui feront découvrir les concepts mathématiques, et la pratique sous-jacente, relatifs aux algorithmes du machine learning tels que les statistiques pour la data science, les régressions linéaire, polynomiale ou logistique, les arbres de décision et Random Forest, l’algorithme K-means, les machines à vecteurs de support (Support Vector Machine), l’analyse en composantes principales, les réseaux de neurones ou encore le deep learning avec TensorFlow et le traitement automatique du langage (Natural Language Processing).

Des éléments complémentaires sont en téléchargement sur le site www.editions-eni.fr.

Éditions ENI ; 770 pages.


8. Machine learning – Implémentation en Python avec Scikit-learn (Virginie Mathivet)

Disponible sur Amazon Disponible à la Fnac

Ce livre présente à des personnes non data scientists, et sans connaissances particulières en mathématiques, la méthodologie du machine learning, ses concepts, ses principaux algorithmes et l’implémentation de ceux-ci en Python avec Scikit-learn.

Il commence par une présentation du machine learning puis de la méthode CRISP où chaque phase est détaillée avec ses différentes étapes. Les premiers chapitres s’intéressent donc aux phases de Business Understanding (compréhension métier), Data Understanding (ou compréhension des données) et de Data Preparation (préparation des données). Dans ces chapitres sont présentés des analyses statistiques de datasets, que cela soit sous forme numérique ou graphique ainsi que les principales techniques utilisées pour la préparation des données, avec leur rôle et des conseils sur leur utilisation.

Ensuite, plusieurs chapitres sont dédiés chacun à une tâche de machine learning : la classification, la régression, avec le cas particulier de la prédiction, ainsi que le clustering et plus globalement l’apprentissage non supervisé. Pour chaque tâche qui est présentée sont successivement détaillés les critères d’évaluation, les concepts derrière les principaux algorithmes puis leur implémentation avec Scikit-learn.

Pour illustrer les différents chapitres, les techniques et algorithmes présentés sont appliqués sur des datasets souvent utilisés : Iris (classification de fleurs), Boston (prévision de prix de vente d’appartements) et Titanic (prévision de la chance de survie des passagers du bateau). Le code Python est commenté et disponible en téléchargement (sous la forme de notebooks Jupyter) sur le site www.editions-eni.fr.

Éditions ENI ; 400 pages.

error: Contenu protégé