mercredi, 24 avril 2024

Critique de livre : Mathématiques pour l’apprentissage automatique

Cet article représente la prochaine installation de mes évaluations de livres avec un concentré sur les mathématiques de l’intelligence artificielle. Je suis stimulé par toutes les nouvelles ressources d’apprentissage qui font émerger un positionnement autour de ce sujet. Comme j’en parle à mes stagiaires, il est essentiel que tous les chercheurs en information maîtrisent les structures théoriques de notre domaine. Sans cela, nous sommes vraiment en train de deviner quand il s’agit d’effectuer des tâches telles que le réglage des hyperparamètres. « Mathematics for Machine Learning » de Marc Peter Deisenroth, A. Aldo Faisal et Cheng Soon Ong, publié par Cambridge University Press, est une méthode exceptionnelle pour découvrir les mathématiques derrière les modèles. Cette revue mettra en évidence toutes les méthodes que ce livre est unique parmi la concurrence. De tous les livres que j’ai lu jusqu’à présent, celui-ci est mon préféré. Continuez à lire pour découvrir pourquoi.

Comme indiqué dans la table des matières ci-dessous, ce livre offre une excellente protection pour des domaines très importants. J’ai découvert la partie I, Fondements mathématiques, un guichet unique pour toutes les connaissances mathématiques requises pour évaluer tous les sujets spécifiques au ML dans la partie II. Il n’y a vraiment pas besoin de plusieurs manuels sur l’algèbre linéaire et le calcul vectoriel par exemple. Vous pouvez rapidement vous familiariser avec ces sujets en consultant systématiquement les chapitres. J’apprécie également le développement judicieux des sujets car il est globalement logique d’obtenir une structure solide pour les mathématiques du ML.

Partie I : Fondements mathématiques

  1. Intro et inspiration
  2. Algèbre directe
  3. Géométrie analytique
  4. Décompositions matricielles
  5. Calcul vectoriel
  6. Possibilité et distribution
  7. Optimisation constante

Partie II : Problèmes centraux d’apprentissage automatique

  1. Quand les conceptions rencontrent les données
  2. Régression directe
  3. Réduction de la dimensionnalité avec l’analyse des éléments principaux
  4. Estimation de la densité avec des modèles de mélange gaussien
  5. Classification avec les machines à vecteurs de support

Lorsque je reçois un exemplaire de critique d’un nouveau livre de l’éditeur, je ne suis jamais sûr du niveau de qualité de publication que je peux rencontrer. Certains livres sont fragiles, certains sont mal édités et d’autres font des bêtises comme publier des visualisations de données couleur en noir et blanc. Par contre ce livre est magnifique ! La qualité de la production est vraiment élevée, et les chiffres, oh les chiffres ! Je n’ai jamais vu un livre de mathématiques prendre vie comme celui-ci, et des graphismes vibrants et bien pensés nourrissent les sens et aident à la communication d’un sujet aussi profond et technique. Chaque chapitre comprend une « carte mentale » qui est un aperçu de tous les sujets abordés et de la manière dont ils seront utilisés dans les chapitres suivants. Pourquoi tous les livres ne peuvent-ils pas inclure ce guide d’apprentissage utile ?

Le livre se compose de mathématiques extrêmement claires et succinctes sans aucun « agiter la main » dans les dérivations, mais chaque chapitre contient de nombreux longs  » Exemples » qui approfondissent la théorie. Encore une fois, les auteurs incluent de magnifiques visualisations conçues pour aider à la compréhension des mathématiques telles qu’elles sont représentées dans la figure voisine. De plus, chaque chapitre se compose d’exercices bien conçus pour aider le lecteur à affiner sa compréhension des sujets. Quelques-uns de mes traitements préférés dans le livre sont les suivants : décomposition de valeurs particulières (zone 4.5), gradients de fonctions vectorielles (zone 5.3), optimisation à l’aide de la descente de gradient (zone 7.1), régression linéaire bayésienne (section 9.3) et dimensionnalité Réduction avec PCA (Chapitre 10).

Le dernier facteur important pour aimer ce livre est qu’il est offert en téléchargement gratuit sur le site Web mis en place par les auteurs. Le site Web comprend également un certain nombre de didacticiels sur les ordinateurs portables Jupyter pour la découverte et les services, ainsi qu’une série de vidéos et de diapositives convaincantes de NeuralIPS 2020 sur la combinaison et la différenciation.

En conclusion, je suggère fortement ce livre à tout chercheur d’information souhaitant obtenir une structure d’entreprise sur le fonctionnement des algorithmes d’intelligence artificielle. Le scientifique de l’information qui assimile efficacement le matériel crucial de ce livre apparaîtra avec une nouvelle gratitude pour ce qui se passe à l’intérieur de la « boîte noire » des algorithmes les plus populaires.

C

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici