vendredi, 19 avril 2024

Protéger Internet avec le traitement du langage naturel

Le Web est l’innovation la plus prolifique de notre vie. Nous avons maintenant la capacité de nous connecter instantanément avec d’autres personnes à travers le monde, d’envoyer et de recevoir instantanément de l’argent, de trouver des détails sur tout ce qui se passe sous le soleil et de mener l’organisation d’une manière qui n’était pas possible auparavant. Avec toute sa magnificence, cependant, vient également un côté plus sombre. Avec un partage d’informations illimité, une réglementation minimale et un accès illimité à l’accès, le Web peut également servir les personnes malintentionnées.

Avec des organes directeurs souvent en retard, il incombe généralement de garder Internet en lieu sûr. des entreprises qui y vivent. Avec des réputations et même des enjeux fondamentaux dans de nombreux cas, ce n’est pas une option pour espérer que les mauvais acteurs n’attaqueront pas ou ne disparaîtront tout simplement pas. Heureusement, l’innovation s’est en fait développée pour aider à garder un œil sur ce qui se dit sur le haut-parleur Web qui pourrait être préjudiciable à l’organisation ou pire. Il s’agit de trouver les bons outils pour faire fonctionner le processus.

Comme vous pouvez l’imaginer, avec beaucoup d’informations et autant de sources de détails, la difficulté de repérer l’intention et l’émotion dans un texte totalement libre n’est pas une mince affaire. Le traitement du langage naturel (NLP) est construit pour cela. L’analyse des croyances – ou extraction de points de vue – utilise la PNL et l’apprentissage automatique pour traduire et classer les émotions en informations subjectives. Il est généralement utilisé dans les entreprises pour découvrir la croyance dans les médias sociaux, évaluer les antécédents de la marque et comprendre les clients, de la polarité – favorable, négatif, neutre – à la détection des sentiments – en colère, ravi, malheureux ou effrayé.

La PNL a le pouvoir d’aider les entreprises à trier une quantité de données autrement difficile, et la plupart du temps à identifier le motif derrière les mots. Mais cela est particulièrement crucial lorsque vous considérez les complexités du langage humain. Avec le contexte, le langage formel et informel, les fautes d’orthographe – souvent intentionnelles pour indiquer quelque chose de différent du mot d’origine – la précision finit par être importante, en particulier s’il y a des conséquences à ces actions. Le réseau social a été utilisé pour inciter à la violence, à la discrimination, à l’intimidation, à l’embarras et à la peine.

Même pour les cas moins graves, de nombreux outils de PNL proposés aujourd’hui peuvent être utilisés pour identifier automatiquement le ton du texte et des tâches plus difficiles, comme analyser le sentiment d’un texte entier avec des éléments particuliers. Ce que quelqu’un a pensé de la nourriture d’un établissement de restauration par rapport à son service ou à son coût – et si le texte semble ironique, faux ou contient un langage dangereux comme des menaces, des insultes, de l’obscénité ou des discours de haine.

Prenez la cyberintimidation par exemple. Plus de 40% des adultes ont personnellement été victimes d’une forme de harcèlement en ligne et 75% ont en fait été témoins de cyberintimidation. Ce nombre grimpe à 85% si l’on prend en compte les jeunes, ce qui montre clairement pourquoi il est très important de garder un œil là-dessus. La bibliothèque Spark NLP de John Snow Labs se compose d’un modèle de catégorie de texte multi-classes pouvant être entraîné qui utilise des incorporations de phrases universelles modernes comme entrée pour les classifications de texte. Le classificateur de fichiers utilise une conception d’apprentissage en profondeur et prend en charge jusqu’à 100 classes. Les conceptions pré-entraînées qui sont disponibles gratuitement avec la bibliothèque open source consistent en des détecteurs de cyberintimidation, de sectarisme, de sexisme ou de tweets menaçants.

Voyons comment cela fonctionne dans la vraie vie. Prenez le tweet suivant: « @AMohedin D’accord, nous avons des femmes physiquement inférieures et d’une certaine manière émotionnellement ou mentalement inférieures. » La conception du détecteur de sentiments a classé cela comme un tweet sexiste à 100%. D’un autre côté, prenons cet exemple: « Les gens de @LynnMagic pensent qu’impliquer l’association par le suivi est une mauvaise chose. Mais c’est d’une précision choquante. » Cela a été classé comme un tweet neutre. Comme vous pouvez l’imaginer, les niveaux de sexisme et de sectarisme, ou peut-être les ramifications des tweets neutres, diffèrent, mais c’est un bon point de départ pour garder un œil sur ceux qui franchissent fréquemment la ligne. Il est également essentiel de garder à l’esprit que meilleures sont vos données d’entraînement, meilleurs seront vos résultats, donc la PNL doit être constamment améliorée et affinée au fur et à mesure.

Comparable à la cyberintimidation, au contenu toxique est un autre domaine où la PNL peut aider à révéler des discussions dangereuses. Le matériel toxique peut être classé comme un langage qui induit la haine, l’insulte, l’obscénité ou les menaces. Dans ce cas, nous examinerons les commentaires sur les réseaux sociaux à l’aide du Multiclassifier DL de Spark NLP, un autre modèle pré-entraîné. C’est un vrai commentaire qui a été évalué comme dangereux, et plus spécifiquement, une menace, en utilisant la PNL: « Je suis également une marionnette chaussette de ce compte … SUPRISE !! -sérieusement, l’homme qui vous suivra sous le Web et te tuer.  » Bien que toutes les publications troublantes sur les réseaux sociaux ne soient pas fiables, ce type de commentaire peut nuire à votre entreprise, terrifier les gens ou, dans de nombreux cas, provoquer un préjudice réel, et cela vaut la peine de garder à l’esprit.

Les mêmes choix «fausses nouvelles», qui a en fait été un sujet particulièrement populaire ces derniers temps. Bien que ce ne soit probablement pas aussi destructeur que la cyberintimidation ou le contenu dangereux, il a le pouvoir d’inciter à un débat malsain, ce qui peut provoquer ces autres habitudes. La PNL peut également vous aider à parcourir le contenu des articles et les publications sur les réseaux sociaux en faisant la promotion pour identifier ce qui est authentique et ce qui ne l’est pas. Alors qu’un titre comme « White Home Makes Trade Pitch, With Concentrate On Moderates » serait classé comme de vraies nouvelles, « Morning Joe Ruins Corrupt Clinton Foundation (risible) » Overall Corruption « , » serait classé comme bidon.

De la cyberintimidation et des contenus préjudiciables aux fausses nouvelles, il est clair pourquoi nous devons garder une longueur d’avance sur les discussions potentiellement dangereuses en ligne. En réalité, une autre étude de Seat Research explique pourquoi la capacité de découvrir cela est si essentielle à la façon dont nous menons notre organisation et nous-mêmes sur Internet. Près de 40% des participants ont déclaré qu’ils s’attendaient à ce que l’avenir en ligne soit «davantage façonné» par des activités négatives, lorsqu’on leur a demandé s’ils pensaient que le discours public en ligne deviendrait essentiellement formé de mauvaises stars, de harcèlement, de trolls et d’un ton total de reproche, s’interroge et dégoût. C’est une perspective sombre, mais probablement pas loin de la réalité, en prenant spécifiquement en compte les événements existants au cours de l’année 2015.

Pour les entreprises, il est important de protéger vos sites Web, plates-formes, services et espaces sociaux. attirer et fidéliser les consommateurs. Les ramifications vont bien au-delà de l’entreprise. Le Web devrait être un endroit où les gens peuvent exprimer librement leurs points de vue, mais il en va de même pour les individus qui ne sont pas la proie, maltraités, mal informés ou calomniés par d’autres se cachant derrière un écran. Bien que l’on craigne à juste titre que les politiques puissent nuire à l’échange ouvert de concepts, de points de vue, de points de vue diversifiés et de discussions, la PNL est une étape dans les meilleures instructions pour aider à surveiller ce qui se passe en ligne sans enfreindre les droits privés ou permettre à du matériel toxique de rester ferme .

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici