vendredi, 26 avril 2024

Adopter AutoML : faisons un test de réalité

Il n’y a pas de remède contre la maladie d’Alzheimer. Et si nous pouvions trouver un moyen de le détecter tôt ? La question a intrigué les scientifiques d’Imagia, qui ont ensuite utilisé l’apprentissage automatique de Google. (AutoML) pour réduire le temps de traitement des tests de 16 heures à une heure. PayPal a connu des avantages similaires. En 2018, avec H2O’s AutoML, PayPal a augmenté la précision de son modèle de détection des fraudes de 6 % et rendu le processus de développement du modèle six fois plus rapide.

Des histoires de réussite comme celles-ci ont inspiré 61 % des décideurs dans les entreprises utilisant l’intelligence artificielle (IA) pour adopter AutoML. Son adoption ne fera qu’augmenter car elle peut atténuer, dans une large mesure, les problèmes causés par le manque de data scientists. De plus, la capacité d’AutoML à améliorer l’évolutivité et à augmenter la productivité ne manquera pas d’attirer les clients.

Mais cela signifie-t-il que l’adoption d’AutoML est devenue incontournable ? Eh bien, c’est une énigme à laquelle la plupart des entreprises sont actuellement confrontées, et l’examen de cas réels pourrait être une solution.

En tant qu’ingénieur logiciel senior, j’ai travaillé avec plusieurs startups où l’IA a joué un rôle central. J’ai vu les avantages et les inconvénients et l’impact commercial. Mais avant d’aborder les cas d’utilisation, définissons d’abord ce qu’est AutoML, son statut actuel et ce qu’il peut et ne peut pas faire.

Qu’est-ce qu’AutoML ?

AutoML (apprentissage automatique de la machine) est la capacité d’un système à choisir automatiquement le bon modèle et à définir des paramètres pour fournir le meilleur modèle possible. Je me concentrerai uniquement sur les réseaux de neurones profonds dans cet article.

Dans les réseaux de neurones profonds, trouver la bonne architecture est toujours un défi majeur. Par architecture, j’entends les blocs de construction de base (par exemple, pour la reconnaissance d’image, les blocs de construction de base seraient la mise en commun maximale 3X3, la convolution 3X1, etc.) et l’interconnexion entre eux pour plusieurs couches cachées.

La recherche d’architecture neuronale (NAS) est une technique permettant d’automatiser la conception de réseaux de neurones profonds. Il est utilisé pour concevoir des réseaux qui sont comparables ou peuvent surpasser les architectures conçues à la main. Mais nous devons former un grand nombre de réseaux candidats dans le cadre du processus de recherche pour trouver la bonne architecture, ce qui prend du temps.

L’état actuel des plateformes disponibles

NAS joue un rôle central dans la formation du framework AutoML pour Amazon Web Services (AWS) et Google plate-forme cloud (GCP). Mais AutoML en est encore à ses balbutiements et ces plates-formes évoluent. Laissez nous discuter de ces deux célèbres frameworks AutoML.

Flux d’apprentissage machine automatisé. Image par l’auteur

GCP AutoML< /span>

GCP AutoML s’appuie sur le NAS et l’apprentissage par transfert. Le NAS recherche l’architecture optimale à partir d’un pool d’architectures en fonction des résultats de formation précédents. Initialement, des algorithmes d’apprentissage par renforcement ont été utilisés pour la recherche d’architecture.

Cependant, ces algorithmes ont tendance à être coûteux en termes de calcul en raison du grand espace de recherche. Récemment, il y a eu un changement de paradigme vers le développement de méthodes basées sur le gradient qui ont montré des résultats prometteurs. Mais ce qui se passe dans GCP AutoML n’est toujours pas aussi clair, et il s’agit plutôt d’une solution de boîte noire.

AWS AutoPilot< /span>

Le concept principal d’AWS Autopilot est de fournir une solution AutoML configurable. Chaque détail du cycle d’apprentissage automatique est exposé, de la transformation des données à la formation des modèles et au réglage des hyperparamètres. Contrairement à GCP AutoML, AWS Autopilot est une solution boîte blanche.

AWS Autopilot utilise différentes stratégies pour les pipelines de données et de ML (machine learning). Certaines de ces stratégies sont basées sur les déclarations if-else suggérées par les experts du domaine ; d’autres stratégies dépendent du choix des hyper-paramètres corrects (c’est-à-dire le taux d’apprentissage, le paramètre de sur-ajustement, la taille d’intégration) pour le pipeline.

Ce que peut AutoML faire et ce qu’il ne peut pas faire

Parfois, les gens disent qu’AutoML est le Saint Graal de l’IA/ML, un point de vue que je ne partage pas. Alors continuons :

  Ce qu’il peut faire Ce qu’il ne peut pas faire Se charge du prétraitement et de la transformation des données. Identifie les variables numériques et catégorielles et peut les gérer. Peut faire des erreurs, comme identifier à tort des caractéristiques numériques dans des données à faible cardinalité en tant que caractéristiques catégorielles. Impossible de vider les données et de supposer que cela fonctionnera sans problème. Extrait les fonctionnalités dans une certaine mesure. Dans les modèles dépendants du domaine, l’extraction de caractéristiques est nécessaire. La maîtrise du domaine reste un problème. Identifie les meilleurs hyper-paramètres. Peut faire une recherche de la meilleure architecture. AutoML ne peut pas fonctionner sur une petite quantité de données car il existe une restriction minimale des points de données. C’est exagéré pour les problèmes simples où nous utilisons la régression linéaire ou certains modèles de base. C’est une tâche qui prend du temps et peut entraîner des coûts élevés pour les problèmes simples et les problèmes avec une grande quantité de données.

Permettez-moi de partager quelques idées expérientielles, avec des exemples concrets, pour expliquer où AutoML était la bonne solution et où cela n’a pas fonctionné.

Cas d’utilisation 1 : Évaluer les performances d’un concessionnaire de l’industrie automobile

Nous avons dû produire une métrique pour évaluer les performances d’un revendeur avec des gigaoctets de données historiques telles que les ventes précédentes, les données de recensement, les données religieuses et les données géographiques. Nous avons utilisé AutoML et obtenu des performances comparables à celles de l’homme.

Cependant, nous avions besoin d’un spécialiste des données pour effectuer le prétraitement des données, l’ingénierie des fonctionnalités et la transformation. Il a fallu beaucoup de travail à AutoML pour déterminer quelles étaient les données importantes dans nos colonnes de données, car il y avait des milliers de colonnes. Même une expérience aurait pu entraîner des coûts énormes et gaspiller un temps précieux.

Cas d’utilisation 2 : prédiction du loyer de la propriété

Nous avons dû développer un outil pour prédire les loyers immobiliers, mais AutoML n’a pas donné de bons résultats, car le marché immobilier contient de nombreuses informations localisées (par état). En fait, nos tentatives ont échoué avec un modèle par région car il n’avait pas suffisamment de données (moins de 500 points de données) pour apprendre l’architecture. Un modèle simple de type XGBoost avec des fonctionnalités réduites s’est bien comporté par rapport à AutoML.

Dans les États où les données étaient suffisamment bonnes pour AutoML, notre modèle de prédiction s’est mieux comporté que la solution interne.

Cas d’utilisation 3 : Prédiction des classements TV

Dans le cas de la prédiction des classements TV, la même chose s’est produite. AutoML n’a pas réussi à capturer le comportement basé sur la tranche horaire sur plusieurs canaux. Par exemple, NICK est pour les enfants ; la plupart des enfants regardent des programmes l’après-midi, et les adultes regardent principalement MTV et ont un pic d’audience le soir. Il ne s’agit que d’un modèle simple, mais AutoML n’a pas été en mesure de capturer plusieurs modèles de plusieurs catégories dans un modèle.

AutoML remplacera-t-il vraiment DS ?

D’après mon expérience sur le terrain, je dirais « Non ». AutoML ne peut pas remplacer directement les data scientists. Mais cela peut être un outil utile pour les data scientists.

Où devrions-nous utiliser AutoML

La probabilité qu’AutoML fonctionne correctement sans aucune interférence humaine est plus élevée dans les scénarios où les problèmes sont connus dans la littérature. Dans des cas tels que la détection d’objets pour des objets génériques ou la classification d’images, vous pouvez utiliser AutoML, car ils sont déjà réglés avec une grande quantité de données. Cela peut également vous aider à développer des PoC rapides, qui peuvent ou non donner des performances raisonnables.

Où nous ne devrions pas utiliser AutoML

Parfois, nous avons besoin d’une ingénierie de fonctionnalités simple avec un modèle de régression linéaire simple pour des projets de ML réels. AutoML pourrait entraîner des coûts plus élevés dans ces cas, car il ne prend pas en charge l’ingénierie des fonctionnalités. En interne, il utilise un réseau neuronal profond, ce qui signifie qu’il existe une certaine ingénierie de fonctionnalités, mais pour cela, il faudra beaucoup de données. De plus, cela coûte cher si vous le comparez à l’approche de base. Et les performances du modèle sélectionné par AutoML devront être améliorées.

Les scénarios dans lesquels le problème est très spécifique à un domaine et nécessitent une certaine connaissance du domaine sont également susceptibles d’échouer avec AutoML. Voici les scénarios dans lesquels nous devrions utiliser AutoML et ceux dans lesquels nous devrions l’éviter : 

  AutoML  Modèle personnalisé  Sécurité et confidentialité  A un problème de sécurité car nous devons télécharger des données dans le cloud. C’est sûr. Nous pouvons également former des modèles personnalisés sur nos machines personnelles. Problème spécifique au domaine  AutoML ne fonctionne pas pour des problèmes spécifiques. Nous pouvons entraîner le modèle pour des problèmes spécifiques à un domaine. Contrainte budgétaire  AutoML est coûteux dans de nombreux cas, comme la régression linéaire. Son budget dépend des besoins. Moins de données  AutoML requiert un minimum de données. Cela peut affecter les performances mais il n’y a pas une telle restriction. Délai de mise sur le marché  En utilisant AutoML, nous pouvons terminer la tâche rapidement. Nous devons mettre en place un pipeline dans cette instance, ce qui prend du temps. Problème standard  En cas de problèmes standards, AutoML peut se terminer rapidement. Les modèles personnalisés prendront plus de temps pour trouver une architecture optimale. Ingénierie des fonctionnalités  AutoML ne peut pas aider à l’ingénierie des fonctionnalités lorsque nous avons besoin de connaissances du domaine pour les créer. Nous devons travailler séparément sur l’ingénierie des fonctionnalités ; alors nous pouvons alimenter AutoML. Solution Il donnera des solutions à partir d’approches déjà connues pour des problèmes existants. Les scientifiques des données peuvent essayer de nouvelles approches qui seront très spécifiques à l’énoncé du problème.

Conclusion

AutoML n’est pas une intelligence artificielle générale (AGI), ce qui signifie qu’il ne peut pas définir les énoncés du problème et les résoudre automatiquement. Cependant, il peut résoudre des problèmes prédéfinis si nous lui fournissons des données et des fonctionnalités pertinentes.

L’utilisation d’AutoML implique un compromis entre la généralisation d’un problème et la performance d’un problème spécifique. Si AutoML généralise sa solution, il doit alors faire des compromis sur les performances d’un problème spécifique (car l’architecture AutoML n’est pas adaptée à cela). Et la solution générale ne peut pas aider avec des problèmes spécifiques à un domaine où nous avons besoin d’une nouvelle approche pour les résoudre.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

xnxx sex download russianporntrends.com hardxxxpics saboten campus freehentai4u.com read manga porn rakhi sex photo ganstagirls.com nani sex video xxx indian girl video download elporno.mobi tamilauntycom bf hd video bf hd video porn555.me anyporn hd tamil beach sex erolenta.com xxx sex boy to boy bustyboobs pakistanixxxx.com nude sexy videos desi sex xvideos.com tubaka.mobi justdesi in free naked dance vegasmpegs.mobi eva grover desi ass lick eroanal.net 69 xvideo 4k xnxx thefuckingtube.com xxii roman numerals translation tamil nayanthara sex sexozavr.com indian porn videos tumblr كلبات سكس porn-arab.net نيك ف الكس y3df comics popsexy.net akhil wife hentai ahri wowhentai.net the sarashina bloodline