jeudi, 28 mars 2024

Facebook attribue une panne à une erreur lors de la maintenance de routine

La panne mondiale qui a mis et ses autres plateformes hors ligne pendant des heures a été provoquée par une erreur lors de la maintenance de routine, a déclaré l’entreprise.

Santosh Janardhan, vice-président de l’infrastructure de Facebook, a déclaré dans un article que la disparition de Facebook, Instagram et WhatsApp n’était pas due à une activité destructrice, mais à une erreur de notre part. « 

« Le problème est survenu alors que les ingénieurs effectuaient des transactions quotidiennes avec le réseau mondial de fondations de Facebook ; les ordinateurs, les routeurs et les logiciels de ses centres d’information à travers le monde, en plus des télévisions par câble à fibre optique qui les relient. la disponibilité d’une capacité de dorsale mondiale, qui a supprimé par inadvertance toutes les connexions de notre réseau de base, déconnectant avec succès les centres de données dans le monde entier », a déclaré Janardhan mardi.

Les systèmes de sont conçus pour détecter de telles erreurs, mais dans ce cas, un Un bogue dans l’outil d’audit l’empêchait d’arrêter correctement la commande, a déclaré Janardhan.

Ce changement a également déclenché un deuxième problème qui a aggravé les choses en rendant difficile l’accès aux serveurs de malgré le fait qu’ils étaient fonctionnels .

Les ingénieurs se sont précipités pour résoudre le problème sur le site Web, mais cela a pris du temps en raison des couches de sécurité supplémentaires, a déclaré Janardhan.

« Les centres d’information sont difficiles à Entrer dans, et dès que vous êtes à l’intérieur, le matériel et les routeurs sont créés pour être difficiles à modifier même lorsque vous y avez un accès physique.

Dès que la connectivité a été restaurée, les services ont été ramenés lentement pour éviter les pics de trafic qui pourraient provoquer plus de plantages. »

« Il s’agissait d’une anomalie imprévue pour une mise à niveau d’entretien défectueuse pour supprimer le réseau fédérateur de Facebook, mais l’entreprise aurait très probablement pu éviter une situation dans laquelle ses serveurs ont été complètement mis hors ligne, ce qui rend difficile l’accès aux outils nécessaires pour le résoudre », a déclaré Angelique Medina, de ThousandEyes de Cisco Systems, une entreprise qui assure le suivi des interruptions Web.

« La grande préoccupation est de savoir pourquoi de nombreux outils et systèmes internes pourraient avoir une seule source de défaillance », a déclaré Medina.

aurait toujours été en panne depuis l’interruption du réseau, mais ils auraient pu gérer la défaillance plus tôt s’ils avaient accès.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici