Bien que nous recevions divers messages de fournisseurs de cloud computing, nous disposons désormais d’informations suggérant que les défaillances du cloud public s’aggravent. L’Uptime Institute a récemment publié son rapport d’analyse des interruptions 2022 qui comprenait des conclusions telles que « les taux d’échec élevés restent une préoccupation ». Certes, une organisation sur 5 a signalé une panne « grave » ou « extrême » qui a entraîné des pertes financières importantes, des atteintes à la réputation, des manquements à la conformité ou, dans certains cas graves, des pertes de vie. Le rapport conclut qu’il y a eu une légère tendance à la hausse dans la prévalence des interruptions majeures au cours des 3 dernières années.
Je ne suis généralement pas du genre à sortir les guillemets, mais cette déclaration d’Andy Lawrence du L’Uptime Institute mérite d’être discuté : « Le manque d’amélioration des taux d’interruption globaux est en partie le résultat de l’ampleur des investissements financiers actuels dans l’infrastructure numérique et de toute la complexité associée à laquelle les opérateurs sont confrontés lors de leur transition vers des architectures hybrides et dispersées. »
La complexité n’est pas une nouvelle difficulté pour l’informatique. Cependant, nous avons récemment développé beaucoup plus de complexité grâce à des transformations numériques rapides et à la ruée vers le cloud et le multicloud en réaction à la pandémie. Ces facteurs ont entraîné un nouvel effectif élevé dans les types de systèmes qui prennent en charge les services. La plupart des entreprises ont indiqué qu’elles prenaient autrefois en charge environ 500 services cloud pour l’ensemble de l’entreprise et qu’elles prennent désormais en charge environ 3 000 services sur un déploiement multicloud.
Ces chiffres montrent que l’innovation ne cause pas les interruptions ; c’est la façon dont la technologie est utilisée et la quantité de technologie utilisée. Comme l’indique le rapport, près de 40 % des entreprises ont subi une panne majeure provoquée par une erreur humaine. Parmi ces événements, 85 % ont une source d’employés qui arrêtent de travailler pour suivre des procédures ou des défauts tout en faisant eux-mêmes des procédures et des procédures.
L’origine de la complexité est bien comprise. Il y a beaucoup plus de pièces mobiles à surveiller dans les architectures multicloud et cloud et des liquidités insuffisantes pour quadrupler le personnel d’exploitation. Cause, satisfaction de l’effet.
Pourquoi cette complexité se produit-elle en premier lieu ? De meilleurs outils d’exploitation sont désormais proposés, tels que AIops et des solutions de suivi multicloud inter-cloud. Ces outils permettent aux concepteurs et aux innovateurs d’utiliser les meilleures technologies pour créer et diffuser des technologies révolutionnaires. Les concepteurs peuvent déployer les choix optimaux pour les systèmes de stockage, les systèmes d’IA, les calculs, les bases de données, etc., qui peuvent provenir d’un ou (très probablement) de plusieurs fournisseurs de cloud.
Le résultat est une implémentation multicloud complexe et très hétérogène qui nécessite du personnel doté de compétences spécialisées pour exécuter efficacement et limiter la variété des défaillances. Paradoxalement, la plupart des entreprises informatiques ne peuvent pas obtenir l’approbation d’une augmentation du budget des opérations en raison du fait que le cloud computing promettait de rendre les opérations moins chères.
Quel est le service ?
Comme je l’ai précisé ici à plusieurs reprises, les couches d’abstraction et d’automatisation éliminent les êtres humains (et les erreurs humaines) de l’avant et le centre de toutes les procédures d’opérations. Ces couches incluent également des outils pour la préparation ou la replanification des opérations afin d’améliorer les opérations multicloud, ce qui peut faire passer votre jeu vidéo d’opérations au niveau supérieur.
Cela nous ramène au problème initial. Redémarrer les opérations cloud et multicloud pour incorporer des couches d’abstraction et d’automatisation équivaut à plus d’argent et de compétences. Jusqu’à ce que les entreprises atteignent un point de basculement où la complexité coûte plus cher à gérer qu’à traiter directement, nous verrons plus de pannes.
C’est dommage que nous fassions du mal simplement pour comprendre comment éviter de faire du mal. Malheureusement, nous avons été ici beaucoup de fois auparavant.
Toute l’actualité en temps réel, est sur L’Entrepreneur