Les informations non structurées sont devenues l’un des plus gros problèmes pour les services au cours des dernières années en raison de leur croissance rapide, et en 2022, elles ont commencé à être un problème pour lequel les services étaient à la fois facilement disponibles et rentables pour les entreprises au niveau de l’entreprise. Nous avons rencontré Krishna Subramanian, co-fondateur de Komprise, qui traite quotidiennement des informations non structurées pour les entreprises, afin de découvrir pourquoi il est dans l’intérêt des entreprises de gérer leurs données désorganisées plus rapidement, plutôt que plus tard.
THQ :
Simplement pour tous les débutants au problème– quel est le problème fondamental avec l’information non structurée ? Venons-en à cela, de quoi parlons-nous lorsque nous énonçons des « informations désorganisées » ?
KS :
Les données non structurées sont des informations qui ne rentrent pas bien dans une base de données, et qui ne sont pas ‘t réellement structuré en lignes et colonnes. Chaque photo sur votre téléphone, chaque radiographie, chaque IRM, chaque séquence du génome, toutes les données produites par les voitures autonomes, tout cela est une information désorganisée. Et peut-être plus pertinent pour un plus grand nombre d’organisations, le système expert (IA) et l’apprentissage automatique (ML) – ils dépendent d’informations non structurées et en produisent généralement également.
Les données désorganisées augmentent chaque jour à un rythme vraiment impressionnant évaluer. Aujourd’hui, 85 % des informations mondiales sont des données désorganisées.
Et cela fait plus que doubler, tous les deux ans.
THQ :
Sommes-nous tout simplement vieux, ou est-ce une chose relativement nouvelle ?
KS :
C’est absolument assez nouveau. Retournez une décennie et pratiquement personne ne comprendrait de quoi nous parlions. Les données non structurées à cette époque étaient très peu comparées aux données structurées.
THQ :
Parce qu’il faut penser à « l’information » à l’époque, vous deviez être le type de données qui rentre dans les bases de données ?
KS :
En partie, mais également l’omniprésence croissante de choses comme les smartphones, l’avancement des marques extrêmes -les nouvelles technologies comme l’IA et le ML, et la numérisation de données qui n’étaient pas numérisées auparavant – pensez aux informations de recensement, aux dossiers médicaux, à l’enregistrement des terres, tout ça.
THQ :
Alors depuis l’arrivée du cloud, essentiellement, nous sommes en fait devenus fous d’informations désorganisées. Et il y en a de plus en plus chaque jour. C’est nous qui jouons à l’avocat du diable, mais… pourquoi les organisations devraient-elles s’en soucier ? Sans parler d’établir une technique d’information non structurée pour gérer le problème ?
Beaucoup d’ordinateurs portables
KS :
Quelques de raisons. Lorsque nous disons qu’une grande quantité d’informations non structurées est produite, nous ne parlons pas simplement de niveaux de données « votre disque dur est plein ». À titre d’exemple, nous traitons avec Pfizer, la société pharmaceutique. Les scientifiques de Pfizer créent environ 10 To chaque jour.
THQ :
Nous vous parlons aujourd’hui via un ordinateur portable.
KS :
Vous en avez encore 4 utiles ? C’est de cela dont nous parlons – une routine de cinq ordinateurs portables par jour.
Vous vous réveillez demain, c’est encore 5 ordinateurs portables. Et le lendemain. Et le suivant.
THQ :
Ok, donc c’est beaucoup de données. J’ai compris.
KS :
Et la plupart des entreprises qui génèrent ce volume d’informations doivent conserver ces informations pendant au moins 25 ans.
THQ :
C’est… ça vaut 45 500 ordinateurs portables.
KS :
Donc, quand nous disons que c’est un problème qui devient trop énorme pour être ignoré, vous avez maintenant un idée de l’ampleur du problème.
THQ :
Beaucoup, beaucoup d’ordinateurs portables de problème.
KS :
Bien. Cependant, ce n’est qu’une partie du problème. Après tout, nous sommes dans les années 2020, vous ne conserveriez en fait pas toutes ces données sur une série illimitée d’ordinateurs portables. Il existe de nombreuses solutions de stockage plus efficaces.
Tout d’abord, récupérez vos informations
THQ :
Évidemment.
KS :
Quelles informations, quelles options ? Puisqu’ils ont tous des ramifications de coûts différentes. Quelles informations ont besoin d’un stockage à long terme coûteux et lesquelles ont besoin d’un stockage moins permanent ? Quelles sont les données chaudes ? Qu’est-ce qui est froid ?
THQ :
Comment sommes-nous censés le savoir ?
KS :
Précisément. Où sont toutes les données ? De nombreuses organisations ne sont pas sûres des informations dont elles disposent, sans parler des silos dans lesquels elles se trouvent.
THQ :
Donc, nous obtiendrons une stratégie d’informations non structurées, alors .
KS :
Précisément. Le problème est trop important pour être ignoré, et il peut également faire perdre de l’argent aux entreprises, jour après jour, semaine après semaine, si elles paient le gros prix pour stocker toutes leurs données comme si c’était exactement la même chose.
Je veux pour connaître le meilleur, cependant ?
THQ :
Constamment.
KS :
Si vous obtenez une méthode de données non structurées, vous ne pouvez pas simplement trouver toutes les données, vous ne pouvez pas simplement économiser de l’argent sur le stockage des informations, une fois que vous avez réellement mis une structure autour de vos informations non structurées, vous pouvez extraire les informations. Et si vous pouvez faire cela, vous pouvez transformer les informations en quelque chose qui génère des revenus.
L’argent pour les anciennes informations
THQ :
Donc, c’est essentiel dans en ce qui concerne le fait de ne pas gaspiller d’argent pour enregistrer par erreur les informations, et utile dans la mesure où cela vous rembourse le coût de le faire ?
Où en sommes-nous en termes d’organisations, de données non structurées, de sensibilisation et d’adoption de méthodes et de solutions ?
KS :
Eh bien, le fait est que c’est trop énorme pour l’ignorer maintenant. Ça va devenir de plus en plus impossible à négliger l’année prochaine. Et la technologie et l’expertise existent pour résoudre ce problème aujourd’hui, donc chaque jour que vous attendez, vous ne faites que nourrir le problème.
THQ :
Donc, fondamentalement, l’argument n’est pas t tellement pourquoi les entreprises devraient faire cela, c’est pourquoi ne le feraient-elles pas dès que possible, pour se débarrasser du singe du stockage et commencer à le faire payer ?
Comment fonctionne la solution
KS :
Exactement. De nos jours, les entreprises se noient sous des données désorganisées. Ils ne comprennent pas ce qui est important, ce qui n’a pas de valeur, des rançongiciels apparaissent et peuvent prendre leurs données. Ils doivent stocker ces informations et les sécuriser, ils doivent être certifiés conformes aux lois et réglementations.
THQ :
Alors, comment le problème est-il résolu ?
KS :
Les entreprises ont besoin d’innovation pour les aider, car l’ampleur de ce problème est trop importante.
La première chose qu’elles veulent, c’est une certaine automatisation, afin qu’elles puissent comprendre ce données dont ils disposent, à quelle vitesse cela augmente qui les utilise, où ils se trouvent, combien cela leur coûte et quelle est la position de sécurité sur leurs données.
THQ :
Alors , un audit complet des données ?
L’interview comme exemple
KS :
Bien. Et la deuxième chose qu’ils veulent, c’est la mobilisation des données. Comment pouvez-vous utiliser ces analyses pour déplacer les données au bon endroit au bon moment ? Le facteur essentiel est que les données ont en fait une valeur différente à différents moments de leur vie. Prenez cette conversation. Nous l’enregistrons pendant que nous parlons. Une fois que nous aurons l’enregistrement, vous écouterez peut-être l’enregistrement plusieurs fois entre maintenant et le moment où vous écrivez l’article, pour vous assurer que vous avez bien saisi les citations. Il a une grande valeur de pertinence jusqu’à ce que vous l’utilisiez pour composer votre article.
Et alors ? Le lendemain de sa mise en ligne sur le site Web, vous disposez d’une toute nouvelle version des données, dans le genre de l’histoire sur le site Web. Dans quelle mesure êtes-vous susceptible de revenir et d’écouter à nouveau l’enregistrement ?
Peut-être pourriez-vous le conserver pendant un certain temps, au cas où des inquiétudes surgiraient et qu’une personne interrogée dise « Je n’ai pas dit cela » ou » Vous avez interprété cela de manière incorrecte. » Si vous conservez l’enregistrement, vous pouvez revérifier la précision et soit modifier si nécessaire, soit dire « Vous avez dit exactement cela – je l’ai sur l’enregistrement. »
Dans un an environ ? Quelle est alors la valeur de pertinence de l’enregistrement ? Probablement beaucoup moins ? Dans ce cas, vous pourrez même supprimer les informations en toute sécurité, car vous en avez développé une autre variante dans l’article. En fait, de nombreuses entreprises conservent la plupart des informations à proximité simplement au cas où elles pourraient en avoir besoin plus tard. Mais la plupart des informations sont froides, elles ne sont jamais activement utilisées.
Mais si vous conservez des données froides sur un stockage coûteux, et que vous en conservez peut-être 3 ou quatre sauvegardes, et une copie de défense contre les ransomwares quelque part, c’est un beaucoup de coûts et d’infrastructures inclus dont ils n’ont probablement pas besoin, car ils enregistrent des informations froides. Ce n’est pas que vous ne protégez pas les données froides – si vous ne le faisiez pas, ce serait une cible facile pour les voleurs de données – mais s’il fait froid, vous pouvez réussir à adopter une méthode de gestion des données plus passive.
En supposant que vous sachiez qu’il existe, ce qu’il est et son niveau de chaleur. Si vous comprenez tout cela et que vous comprenez qu’il s’agit de données froides, vous pouvez les placer sur un stockage moins cher ou un stockage durable comme le cloud, où le cloud lui-même conserverait deux ou 3 copies des informations. Vous ne connaissez pas tous ces détails jusqu’à ce que vous commenciez la procédure de gestion des données.
Il y a la gestion active des informations et la gestion passive des données, et les dépenses des 2 sont très différentes. Et si vous comprenez vos données et que vous pouvez déplacer les bonnes données à l’endroit idéal au bon moment, vous pourriez économiser 70 à 80 % des coûts d’installation des données désorganisées. C’est la première chose que nos clients veulent faire.
Dans la partie 2 de cet article, nous approfondirons le processus de gestion désorganisée de l’information, son fonctionnement et la fin des données non structurées qui étouffent l’entreprise. être une source de carburant financier pour l’entreprise qui en est propriétaire.
.
Toute l’actualité en temps réel, est sur L’Entrepreneur