samedi, 20 avril 2024

Les outils pour gérer les données non structurées

Dans la partie 1 de cet article, nous avons exploré la nature et l’ampleur des défis auxquels les entreprises sont confrontées face à l’essor des données non structurées. Nous avons rencontré Krishna Subramanian, président de Komprise – un spécialiste de la gestion des données non structurées – pour explorer ce défi.

Pendant que nous l’avions à la tête, nous avons demandé à Krishna de développer les moyens de transformer le chaos relatif inconnu des données non structurées en données non structurées gérées – les principes à l’œuvre et les outils qui ont rendu cela possible.

THQ :

Vous avez mentionné que les problèmes et les opportunités des données non structurées avaient pris le monde des affaires par surprise.

Les défis des données non structurées

KS :

Oui, tout le monde cherchait à gérer les données structurées au fur et à mesure de leur croissance, et soudain, il y a un nouveau problème de données à résoudre. Tout ce que nous n’avions pas réalisé exactement était des données parce qu’elles n’entraient pas dans une base de données – du coup c’est important.

THQ :

Nous avons discuté de l’importance d’avoir une visibilité sur les données dans la partie 1. Nous imaginons que c’est le premier outil dont vous avez besoin, l’outil qui vous montre ce que vous avez et où il se trouve. Et vous avez mentionné qu’il y avait un problème avec le déplacement des données ?

KS :

Oui, c’est une des principales conclusions de l’enquête que nous avons menée sur la gestion des données. Environ 43 % des entreprises tentent de transférer des données vers le cloud. Comment faites-vous cela sans perturber le fonctionnement de l’entreprise ou l’expérience de l’utilisateur ?

Nous avons mentionné l’exemple réel de l’hébergement de toutes vos photos sur votre téléphone portable, et le potentiel de les héberger toutes dans un stockage cloud à faible coût d’une manière qui, pour vous, le propriétaire du téléphone portable, ressemblait et se sentait comme bien que vous y accédiez directement sur votre téléphone – mais qui ne vous coûte pas d’espace de stockage sur votre téléphone. Imaginez cela à l’échelle de l’entreprise, et c’est le genre d’outil dont vous avez besoin pour créer ; quelque chose qui peut réussir sans que personne ne s’en aperçoive, sauf le directeur financier, qui voit la facture de stockage réduite.

Les avantages commerciaux de l’intégration de l’intelligence des données

L’astuce consiste à déplacer les données vers leur emplacement de stockage optimal sans perturber les utilisateurs. Parce que s’ils le savent, si cela empiète sur leur expérience, ils résisteront. Ils ne voudront pas que leurs données soient déplacées, et ils ne veulent certainement pas que toutes leurs applications commencent soudainement à se casser. Ils ne veulent pas chercher un fichier en particulier, et soudainement ne pas pouvoir le trouver parce que vous l’avez déplacé ailleurs.

THQ :

Et ils ne voudront surtout pas qu’il soit déplacé dès que vous dites que vous devez le déplacer.

KS :

Bien, exactement. Vous avez donc besoin d’un type de processus de déplacement transparent où il n’y a aucune interruption de ce que font les utilisateurs. Il semble donc que ce soit toujours local, mais il peut en fait être assis ailleurs. Exact.

THQ :

Alors, parlez-nous nous de la suite d’outils que nous ont réellement besoin de gérer des données non structurées.

KS :

Depuis des décennies, de nombreux produits sont conçus pour les données structurées. Il existe toute une variété d’outils pour analyser les données structurées, pour trier et placer les données structurées au bon endroit, pour exécuter des lacs de données sur des données structurées. Nous avons besoin d’outils similaires pour les données non structurées.

Les données visibles dépassent le cryptage et d’autres mesures de sécurité

Les gens ont toujours considéré les données non structurées comme un problème de stockage. « Oh, j’achèterai simplement le stockage le moins cher possible, et cela s’occupera de tout. »

Mais maintenant, les volumes de données sont trop importants. C’est allé au-delà d’un problème de stockage. Réaliser que la gestion des données nécessite de véritables outils de gestion des données pour les données non structurées est la première étape. Et ces outils doivent vous donner de la visibilité.

L’analyse en est un élément. Pouvez-vous évaluer ce qui se trouve dans ces environnements ? Pouvez-vous donner de la visibilité ? Pouvez-vous aider quelqu’un à planifier? Ensuite, il y a la question de savoir si vous pouvez fournir un mouvement de données automatisé basé sur des règles, afin que vous n’ayez pas à surveiller la solution. Vous devez être en mesure de dire simplement « Je veux que les données soient déplacées ici et je veux que leur cycle de vie soit géré de cette façon. Vous avez donc besoin d’outils d’analyse de données, d’outils de mobilisation de données, puis d’outils d’extraction de données, car finalement, pourquoi gardez-vous toutes ces données ?

Encore une fois, dans notre enquête, 43 % des personnes interrogées ont déclaré vouloir offrir davantage de libre-service aux utilisateurs de leur service pour les données non structurées. Et si vos données non structurées sont en désordre, vos utilisateurs ne savent probablement même pas qu’elles sont là. Alors, comment faciliter la recherche, l’appel et la recherche des données intéressantes, puis les utiliser dans une application de big data ou une application d’IA ou de ML, afin de mieux monétiser ces données ?

Ce sont les différentes façons dont la gestion des données non structurées évolue.

THQ :

Comment fait-onobtenir de la visibilité sur un problème de données de cette taille, qui ne cesse de croître ?

KS :

Vous devez disposer d’une solution basée sur des normes. Les environnements de stockage parlent tous des langages communs de nos jours. Il existe des langages de fichiers comme NFS et SMB, et des langages objet comme Amazon S3.

Ainsi, si vos outils peuvent communiquer avec divers environnements de stockage dans des langages communs, ils peuvent examiner ce qu’il y a à l’intérieur de ces environnements et fournir une analyse. Et si vous pouvez le faire, vous n’avez pas besoin d’une solution propriétaire pour chaque environnement. Vous pouvez disposer d’une solution indépendante qui fonctionne avec l’ensemble de votre centre de données et vos comptes cloud.

Cela devrait vous montrer combien de données vous avez, combien sont chaudes, combien sont froides, qui les utilise, toutes ces choses. Les informations sont là dans les métadonnées de tous ces fichiers et objets, mais vous avez besoin d’un moteur de requête qui peut rechercher à partir de cet environnement. C’est ainsi que vous pouvez résoudre ce problème.

THQ :

C’est ce que vous faites.

KS :

C’est ce que nous faisons.

Il s’agit de prendre le chaos et de donner le contrôle au client. Ils peuvent dire « Voici mes centres de données, et voici mes comptes cloud », et nous trouverons tous les environnements de stockage, trouverons les données qui s’y trouvent, les organiserons en fonction de qui les possède, de leur vitesse de croissance, etc.

Ensuite, le client peut définir des politiques. Tout ce qui a plus de trois ans, peut-être écrire une politique selon laquelle il va à Amazon Glacier. Tout ce qui est vraiment chaud et important, écrivez une politique pour le mettre sur votre stockage flash le plus cher, afin que les gens puissent vraiment en tirer profit. Pour d’autres données moins importantes, vous pouvez écrire une stratégie pour les placer dans un stockage à long terme standard. Vous définissez ces politiques, nous déplaçons les données en fonction de vos politiques afin qu’elles soient au bon endroit, et nous les déplaçons de manière transparente.

THQ :

Donc, ce que vous faites essentiellement, c’est prendre un énorme problème de données et créer une nouvelle architecture de données, régie par les politiques souhaitées par le client, une fois qu’il est conscient de toutes les données non structurées qu’il possède ?

KS :

Exactement. Nous leur permettons de faire évoluer leur architecture de données sans interruption.

THQ :

Selon vous, quelle est l’humeur générale du marché en ce qui concerne les données non structurées ?

KS :

Je pense que c’est une période très excitante sur le marché. Parce que même si ce problème s’est en quelque sorte glissé sur les gens, il y a beaucoup d’innovation en ce qui concerne la façon de le résoudre. Et pour moi, ce qui est le plus excitant, c’est l’IA, car l’IA et le ML nécessitent en fait des données non structurées, pas des données structurées. Pour avoir une IA ou un ML vraiment avancé, vous avez besoin d’une gestion des données non structurées, car vous devez importer des données non structurées dans ces systèmes. On a donc l’impression qu’il existe de multiples forces du marché en jeu qui en font un domaine d’innovation très excitant.

THQ :

Une ruée vers l’or des données non structurées, même.

KS :

Oui, ça l’est. C’est vraiment le cas.

.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici