mercredi, 24 avril 2024

Microsoft présente l’API de classification de texte pour ML.NET

Crédit : Dreamstime

Microsoft a en fait dévoilé un aperçu du texte ML.NET Category API, une API prévue pour faciliter la formation de modèles de catégories de texte personnalisés à l’aide de la structure d’apprentissage automatique ML.NET open source.

Présentée le 14 juin, l’API de classification de texte ML.NET utilise des connaissant les stratégies, a déclaré Microsoft. ML.NET permet aux concepteurs d’intégrer des conceptions d’apprentissage d’appareils personnalisées dans les applications .NET. La classification de texte est le processus d’application d’étiquettes ou de catégories au texte.

Les cas d’utilisation courants consistent à classer les e-mails comme spam ou non, à analyser les sentiments comme positifs ou négatifs à partir des avis des clients et à utiliser des étiquettes pour prendre en charge les tickets.

L’API de catégorie de texte ML.NET est alimentée par la bibliothèque TorchSharp.NET, qui donne accès à la bibliothèque libtorch qui alimente le framework d’apprentissage de périphérique PyTorch. TorchSharp a des capacités de bas niveau pour former des réseaux de neurones à partir de zéro dans.NET. Pour ML.NET, une partie de la complexité de TorchSharp a été résumée pour rendre cette formation beaucoup plus facile.

En collaboration avec l’étude Microsoft Research, Microsoft a pris l’implémentation TorchSharp de NAS-BERT (Représentations d’encodeurs bidirectionnels de Transformers), une variante de BERT obtenue avec la recherche d’architecture neuronale, et l’a inclus dans ML.NET. À partir d’une variante pré-formée de ce modèle, l’API de classification de texte utilise les données de l’utilisateur pour ajuster le modèle existant plutôt que de développer un tout nouveau modèle à partir de zéro.

L’API de classification de texte devient une partie de les variantes 2.0.0 et 0.20.0 de ML.NET. En plus du package Microsoft.ML, il a besoin de Microsoft.ML.TorchSharp et soit de TorchSharp-cpu (si vous utilisez un processeur), soit de TorchSharp-cuda-windows, soit de TorchSharp-cuda-linux (si vous utilisez un GPU).

Les concepteurs peuvent utiliser le gestionnaire de plan NuGet dans Visual Studio ou la CLI .NET pour configurer les packages. Des exemples de code de l’API peuvent être trouvés dans le bloc-notes de l’API de classification de texte.

Microsoft a souligné qu’il existe encore des contraintes avec l’API, telles que l’impossibilité d’utiliser le Évaluer méthode pour déterminer les mesures d’évaluation. Des améliorations sont préparées pour l’API en plus de présenter d’autres API basées sur des scénarios.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici