mardi, 23 avril 2024

Quoi de neuf dans les services NLP AI de Microsoft Azure

Si vous souhaitez commencer à utiliser l’apprentissage automatique dans vos applications, Microsoft propose plusieurs méthodes différentes pour démarrer le développement. Une technologie clé, les Azure Cognitive Services de Microsoft , propose un ensemble de services de machine learning gérés avec des modèles pré-entraînés et des points de terminaison d’API REST. Ces modèles offrent la plupart des cas d’utilisation courants, du travail avec du texte et du langage à la reconnaissance de la parole et des images.

Le machine learning continue d’évoluer, avec la sortie de nouveaux modèles et de nouveaux matériels pour accélérer l’inférence. Microsoft met donc régulièrement à jour ses services cognitifs. La dernière mise à jour majeure, annoncée lors de la Build 2022, apporte de nombreux changements à ses outils pour travailler avec du texte, réunissant trois services différents sous un même parapluie. Alors que l’analyse de texte, QnA Maker et la compréhension du langage LUIS étaient des outils distincts, ils font désormais partie d’un ensemble d’outils de traitement du langage naturel pour vous aider à travailler avec les données stockées et les entrées utilisateur en temps réel.

Présentation du service cognitif pour le langage

Maintenant sous la marque Cognitive Service pour Language, les outils vous donnent accès à la fois à des fonctionnalités familières (après la migration vers les nouvelles API) et à de nouveaux services. La migration peut être complexe< /a>, car il y a des changements avec rupture entre les deux versions pour certains des services. Vous pouvez continuer à utiliser les anciennes API pour le moment, mais cela vaut la peine d’étudier le nouveau service pour les nouvelles applications et les mises à jour du code existant.

Les fichiers de configuration LUIS peuvent créer de nouveaux projets Conversational Language Understanding, bien que certaines entités ne soient pas prises en charge. Cela affectera les modèles qui ont été personnalisés. Bien que Microsoft suggère que ses nouveaux modèles de langage n’ont pas besoin de ces personnalisations, il vaut la peine de surveiller les performances des applications et de travailler avec les nouvelles API si vous rencontrez des problèmes avec le nouveau service.

Si vous avez utilisé le service de gestion des connaissances QnA Maker, vous trouverez peut-être préférable de créer de nouveaux services de questions-réponses personnalisés à partir du même matériel source. Vous pouvez copier des bases de connaissances entre les services pour apporter des suggestions déjà apprises, mais en pratique, il y a suffisamment de changements dans le modèle sous-jacent pour qu’un nouveau départ soit préférable.

Service cognitif pour le langage contient plusieurs nouvelles fonctionnalités qui n’étaient pas dans la plate-forme d’origine. Certains d’entre eux sont particulièrement utiles pour les applications d’entreprise, car ils permettent d’automatiser des scénarios réglementaires complexes dans lesquels les utilisateurs saisissent du texte libre (comme dans les chats ou les e-mails) et vous devez stocker ces interactions.

Identifier et supprimer automatiquement les PII

Une nouvelle fonctionnalité devrait être un gain rapide pour toute application qui traite des informations personnellement identifiables. Les informations personnelles sont très réglementées dans la plupart des juridictions, mais il est courant qu’un utilisateur inclue des détails de carte de crédit ou un numéro de sécurité sociale dans un e-mail ou un chat. Ceux-ci doivent être expurgés si vous archivez du contenu, et le L’outil d’identification PII dans Azure Cognitive Service for Language peut aider à identifier ces données.

Travail avec les outils de détection PII est une question de les intégrer dans votre workflow d’application, comme la plupart des services Azure. Commencez par créer une ressource Azure Language, qui hébergera votre point de terminaison de service et générera les clés appropriées pour le service. Vous pouvez désormais accéder à l’API REST pour le service d’identification PII, en l’adressant directement à l’aide d’appels HTTPS familiers avec des données JSON. Alternativement, il existe des SDK pour la plupart des langages et plates-formes courants qui encapsulent les appels d’API sous forme de méthodes, gérant l’accès, la demande et la réponse pour vous.

Si vous utilisez Python, Microsoft fournit une bibliothèque cliente pour ses outils d’analyse de texte qui peut être installée via pip. Une fois installée, la bibliothèque peut émettre vos clés d’accès et créer un objet client qui accède aux points de terminaison de reconnaissance PII. Vous devrez fournir du texte pour les PII que vous souhaitez masquer, par exemple, du contenu pouvant contenir des numéros de sécurité sociale, des numéros de carte de crédit ou des numéros de téléphone, et le système renvoie un objet texte avec des données masquées et un ensemble de scores de confiance. .

Ceux-ci vous aident à automatiser la rédaction de documents non structurés, en catégorisant la rédaction en fonction de vos exemples de documents. Le service peut reconnaître un ensemble de types d’entités communs : noms, numéros de téléphone, adresses (physiques et e-mail), identifiants numériques tels que des clés de produit ou des numéros de compte bancaire, et détails de carte de crédit.

Si vous utilisez cet outil avec des conversations, par exemple, dans le cadre d’un chatbot, vous pouvez utiliser une API alternative pour analyser une liste d’éléments de conversation pour PII, renvoyant des données de manière asynchrone. Cela signifie que vous ne pouvez pas expurger les données en temps réel ; au lieu de cela, il est destiné à traiter des discussions entières avant qu’elles ne soient archivées, ajoutant une étape de rédaction au flux de travail de votre application. Il peut même traiter la parole reconnue pour les PII, garantissant que les transcriptions ne contiennent pas d’informations sensibles et fournissant en même temps des codes temporels pour permettre la rédaction audio. Chaque appel à l’API PII conversationnelle contiendra un document avec une seule conversation. Actuellement, vous êtes limité à l’utilisation de l’anglais uniquement pour ce service.

Orchestrer les flux de travail à partir du chat

Microsoft continue d’étendre les outils disponibles dans ses services cognitifs, ajouter de nouvelles fonctionnalités à une cadence mensuelle au fur et à mesure du déploiement de nouveaux modèles. Un outil qui est récemment entré en disponibilité générale vous permet d’orchestrer le flux de travail sur plusieurs services à l’aide d’une API d’apprentissage automatique conversationnel pour extraire des informations du contenu, puis les transmettre aux services appropriés.

Cette approche nécessite un modèle personnalisé formé à partir de données balisées qui définissent les intentions et les actions. Vous créez le modèle dans Language Studio, un portail Azure qui fournit des outils pour former et tester votre modèle. Vous commencerez avec un schéma attaché à un projet de compréhension du langage conversationnel. Une fois formé, le modèle d’orchestration peut être utilisé pour acheminer les données d’un chatbot vers le service approprié.

Par exemple, vous pourriez avoir un robot RH en libre-service qui identifierait si vous posez une question qui doit être transmise à la base de connaissances RH ou si vous demandez un congé, auquel cas il extrairait des dates et les transmettre à une application de demande de calendrier de vacances. Les flux de travail comme celui-ci sont informels, et un chatbot fonctionnant dans Microsoft Teams permettrait au personnel d’accéder rapidement aux services sans interrompre d’autres tâches.

La taille des documents pouvant être envoyés au service linguistique est limitée. Vous pouvez envoyer cinq documents à la fois à l’API de reconnaissance PII, avec des limites de débit définies par votre niveau d’abonnement. Un document ne peut contenir que 5 120 caractères pour la rédaction synchrone, 125 000 caractères et 1 Mo pour tous les documents d’une requête asynchrone. Vous pouvez utiliser des appels d’informations de chaîne standard pour obtenir la taille du document avant de l’envoyer au service, en segmentant le contenu si nécessaire.

Une interface en langage naturel

Il est logique pour Microsoft de regrouper les différents services qui composent le nouveau service cognitif pour le langage. Les inclure dans un moteur de routage de flux de travail intelligent permet de coller les services dans le contexte de conversations informelles et non structurées. Les chatbots et autres services axés sur le contenu ont souvent été à usage unique et rigides, alors que les utilisateurs s’attendent à un environnement conversationnel capable de prendre en charge plusieurs tâches tout en protégeant leur vie privée.

Alors que nous automatisons de plus en plus de services de type centre d’assistance à l’intérieur et à l’extérieur de nos organisations, il est de plus en plus important de fournir une interface intelligente aux bases de connaissances et aux applications. Nous devons répondre aux attentes des utilisateurs, et des outils comme ceux-ci fournissent un échafaudage pour fournir des systèmes automatisés qui ne se sentent pas automatisés et peuvent répondre aux modes de communication informels. C’est une façon intéressante d’aborder le développement de l’interface utilisateur. Cet outil est beaucoup plus proche des interfaces utilisateur naturelles que Microsoft défend depuis une grande partie de la dernière décennie.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici