lundi, 4 mars 2024

Comment déplacer l’IA vers la périphérie peut aider à résoudre la crise énergétique des centres de données

L’un des sujets les moins discutés à l’ère du détail est la dépense réelle de toutes les données que nous créons et prenons en compte. Notre classification pour conserver les informations n’aide pas – le « nuage » semble vaporeux et éthéré, et les interactions de l’utilisateur moyen avec lui sont développées pour être rapides, faciles, transparentes et pratiquement insignifiantes.

Notre photo psychologique est souvent celle d’un grand nombre de personnes qui dérivent au-dessus et autour de nous, quelque part dans le monde en ligne, sans lien avec notre monde, dont nous ne pouvons construire et manipuler les types qu’à travers les couches de verre. et du métal sur les écrans tactiles de nos téléphones portables et sur les claviers de nos ordinateurs, comme les ombres vacillantes sur les murs de la grotte proverbiale de Platon.

Mais naturellement, il y a un bilan physique bien réel et concret pour le cloud : l’énergie nécessaire au fonctionnement des serveurs sur lesquels les données sont sauvegardées et les applications sont exécutées, et les gaz à effet de serre produits qui en résultent.

Généralement, les centres d’information « hyperscale » utilisés par les grandes entreprises technologiques telles que Google, Meta, Apple et Amazon consomment entre 20 et 100 mégawatts d’énergie électrique chaque année, soit suffisamment pour alimenter jusqu’à 37 000 foyers. . Les entreprises technologiques sont heureuses de se vanter de leurs investissements financiers dans l’énergie solaire, éolienne, hydroélectrique et autres énergies renouvelables pour alimenter leurs centres d’information. La réalité est que les centres de données, comme la plupart des autres centres de données dans le monde, dépendent toujours des combustibles fossiles.

Événement

L’IA libérée

Une soirée unique d’informations et de réseautage sur invitation uniquement, créée pour les cadres supérieurs d’entreprise gérant des piles de données et des stratégies.

En savoir plus À mesure que la faim énergétique des centres de données augmente

, avec des projections

montrant un bond de 3 % à 4 % de l’énergie électrique internationale totale consommation d’ici 2030, les entreprises devraient découvrir des options. Une solution qui a émergé est celle d’une augmentation des investissements dans l’informatique de pointe, c’est-à-dire la libération d’ordinateurs, de capteurs et de serveurs à plus petite échelle, non pas dans un énorme centre d’information dédié quelque part, mais sur le terrain, dans les usines et les commerces de détail. des points de vente où le travail est effectué et où l’organisation se déroule physiquement. Dans le même temps, l’intérêt soudain des entreprises pour l’utilisation de l’IA générative a accru la demande en unités de traitement graphique (GPU) et en espace serveur nécessaire pour sauvegarder les vastes volumes de données indispensables à la formation des grandes entreprises. conceptions de langage (LLM) et autres modèles fondamentaux. Dans certaines méthodes, il s’agit d’une tendance inutile en termes de consommation d’énergie des bases de données et des centres d’information, car elle fonctionne comme une force compensatrice dans l’évolution vers des appareils à moindre consommation d’énergie. Ou est-ce que c’est le cas ? Un certain nombre d’entreprises ont en fait commencé à proposer des solutions de calcul et d’applications logicielles « IA à la pointe du progrès », dans le but de fournir aux entreprises la technologie nécessaire pour exécuter des applications d’IA sur le terrain, en supprimant une partie de la demande d’énergie du cloud et en minimisant les coûts. les besoins énergétiques totaux et, par conséquent, les émissions. L’avantage de pointe : des gadgets à faible consommation L’essentiel de l’attrait de l’informatique de pointe dépend de sa capacité à atténuer les défis énergétiques posés par

la vague d’amélioration numérique qui déferle sur le monde. En réduisant la quantité de données transférées sur les réseaux vers les centres de données centraux pour traitement, l’edge computing diminue la consommation. De plus, de nombreux appareils de périphérie ont une consommation bien

inférieure à celle de leurs homologues de centre de données ou de calcul centralisé. La technique de traitement localisé implique également que les données soient gérées plus près de l’endroit où elles sont créées ou nécessaires, minimisant ainsi la latence et économisant l’énergie. La transition vers l’informatique de pointe est plus qu’un simple

changement technique ; il s’agit d’un pas important vers un paysage informatique plus durable et plus économe en énergie. « L’IA à la pointe est sur le point de changer les entreprises en améliorant l’efficacité, en rendant possible la prise de décision en temps réel et en favorisant le développement », a écrit Krishna Rangasayee, PDG et fondateur de SiMa.ai, dans un e-mail adressé à

VentureBeat. Rangasayee s’appellerait SiMa.ai, une de cinq ans basée à San Diego, en Californie, qui crée sa propre application logicielle d’application d’IA par glisser-déposer et sans code et des puces pour appareils de pointe d’IA. En septembre 2023, SiMa a présenté Scheme Edgematic, une plate-forme permettant aux entreprises de créer et de publier rapidement et rapidement des applications d’IA sur des gadgets de pointe, en particulier celles exploitant les puces de silicium MLSoC de SiMa (fabriquées selon les spécifications du principal fournisseur Taiwan Semiconductor, TMSC). Actuellement, l’entreprise a fait ses preuves auprès de clients aussi importants que les États-Unis. force armée, révélant qu’une mise en œuvre de pointe sur un drone était capable d’augmenter la capture et l’analyse vidéo de 3 images par seconde jusqu’à 60. « Nous avons compris que ce qui fonctionnait pour l’IA et le ML dans le cloud serait rendu sans valeur à la périphérie. , nous avons donc décidé de surpasser les performances du cloud et de nous conformer aux contraintes de puissance de la périphérie », a déclaré Rangasayee. Les exigences de périphérie sont différentes de celles des centres de données. Lenovo est une autre entreprise qui poursuit l’IA à la périphérie pour minimiser les besoins en énergie tout en tirant parti de la
puissance analytique de l’IA. Bien que mieux connu des clients en tant que fabricant de PC et d’appareils, le nouveau service TruScale for Edge et AI de Lenovo, qui

a également fait ses débuts en septembre 2023, exploite l’expérience matérielle de Lenovo et la met

dans une nouvelle forme. facteur– le serveur ThinkEdge SE455 V3 équipé des processeurs AMD série EPYC 8004, créé pour fonctionner silencieusement dans l’arrière-plan de travail

d’un point de vente au détail, d’une épicerie et même sur un bateau de pêche industrielle au milieu de Océan Atlantique. Lenovo fournit également des logiciels, en particulier 150 solutions d’IA clés en main, via sa nouvelle offre SaaS TruScale for Edge et AI par abonnement.  » Les téléphones, tablettes, ordinateurs portables, caméras électroniques et unités de détection du monde entier doubleront les données mondiales au cours des deux prochaines années. rendre l’informatique en périphérie ou dans les zones éloignées essentielle pour respecter l’engagement de l’IA pour tous les services », a déclaré Scott Tease, superviseur général du HPC et de l’IA chez Lenovo. « Chez Lenovo, nous nous efforçons d’amener l’IA à tous les services. les informations via des solutions Edge-to-Cloud de nouvelle génération. « Selon les citations de Lenovo, au total, » 75 % du calcul « — le véritable mélange matériel/logiciel requis pour exécuter des applications — est sur le point d’évoluer vers la périphérie. Mais reconnaître que cette tendance est en train de se produire est une chose. C’est un autre ensemble de tâches, plus difficiles, que de créer les installations nécessaires pour que cela se réalise. »

L’innovation des serveurs nécessite d’être capable de résister à l’environnement, d’être compact et non envahissant tout en fournissant une informatique innovante et efficace fournissant des informations basées sur l’IA », a déclaré Tease. Comment souhaiteriez-vous votre bord : épais ou fin ? Splunk, la société d’applications logicielles de données d’entreprise récemment acquise par Cisco pour la somme incroyable de 28 milliards de dollars, fait la différence entre le « bord épais » et le « bord fin » et aide ses consommateurs à faire la distinction entre ces deux classifications de logiciels de calcul. — et déterminez ce qui leur convient le mieux.

Bien que la terminologie soit encore toute nouvelle et en constante évolution, le terme « bord épais » fait référence au type de services matériels/logiciels informatiques mentionnés par Lenovo ci-dessus dans cet article — celles où les informations sont traitées et évaluées sur site, ou à proximité de l’endroit où elles sont collectées. « Thin Edge » est une version dans laquelle des unités de détection et du matériel informatique plus petits et de moindre puissance sont installés pour collecter des informations, mais seules des opérations minimes sont effectuées. sur le site de collecte, et la majorité de la puissance de traitement est sauvegardée dans le cloud. Le tout nouveau Edge Hub de Splunk, un terminal informatique de pointe doté de son propre système d’exploitation lancé par l’entreprise en juillet, est spécialement conçu pour ce type d’implémentations. la puissance généralement fournie est suffisamment efficace pour faire fonctionner plusieurs des offres d’IA de Splunk aujourd’hui », a déclaré Hao Yang, responsable de l’IA chez Splunk, dans un e-mail fourni à VentureBeat. Splunk Edge Center. Cela permet de demander des modèles d’IA dans des cas d’utilisation qui doivent fonctionner sur des ressources plus restreintes et plus proches de la source d’informations. Les deux cas offrent aux entreprises la possibilité de réduire la consommation d’énergie de leur événement et traitement d’informations, mais il est clair que, de par la méthode qu’il est conçu et architecturé, le « bord épais » offre encore plus d’économies possibles en matière de coûts d’énergie. Quoi qu’il en soit, Splunk est prêt à soutenir les entreprises dans leurs versions épaisses et fines et à les optimiser de manière économe en énergie, même si elles cherchent à accepter des conceptions d’IA gourmandes en ressources. « Pour les gros modèles qui peuvent facilement fonctionner dans le cloud « , une stratégie fiable consiste en la quantification, de sorte que les principaux modèles d’IA fondamentaux avec des milliards de paramètres puissent être optimisés pour fonctionner sur un gadget de pointe tout en conservant la précision », a expliqué Yang. « Cela met également en évidence la nécessité de comprendre comment le matériel peut être amélioré pour l’IA et comment ajuster une conception pour tirer parti des différentes architectures matérielles des GPU (systèmes de traitement graphique) et des NPU. « Un principe important du point de vue de Splunk sur l’IA est celui de » l’humain dans le boucle. « Comme l’a déclaré Gary Steele, PDG de Splunk, dans une récente interview : » Vous n’allez pas simplement laisser un agent IA reconfigurer votre réseau. Vous allez être vraiment très réfléchi quant aux prochaines actions que vous entreprenez. les systèmes permettent aux entreprises de lancer une IA qui fait des suggestions mais qui, en fin de compte, laisse les gens responsables des choix. Ceci est particulièrement important pour les implémentations en périphérie,

où, mises à part les économies d’énergie, l’application d’IA a la possibilité d’affecter plus directement le lieu de travail étant donné qu’elle est située à l’intérieur et parmi celui-ci. Splunk souhaite également garantir que les entreprises sont prêtes à fournir leurs propres données distinctes pour affiner les applications d’IA qu’elles envisagent d’utiliser, car cela sera important pour le succès suprême d’une IA à la pointe de la technologie.

« De nombreux efforts de déploiement de l’IA échouent en raison du fait que les modèles de base doivent être améliorés avec des informations uniques », a déclaré Wang à VentureBeat. « Chaque entreprise est différente et Splunk Edge Hub offre cette capacité de collecter des données à partir de la périphérie et de garantir que l’IA remplira la tâche qu’elle est censée accomplir.

Cela témoigne de la valeur de Splunk dans le domaine de l’humain. la méthode de la boucle, et en s’assurant que pour déployer correctement l’IA, elle peut être comprise et modifiée. La prochaine étape vers l’IA à la pointe de la technologie et ce que cela signifie pour l’efficacité énergétique. Malgré l’ambiguïté réglementaire et les réticences des créatifs et des défenseurs, la ruée des entreprises vers l’adoption de l’IA ne révèle aucun signe de ralentissement. Cela incitera davantage d’entreprises à exécuter des conceptions d’IA à forte consommation d’énergie, ce qui pourrait augmenter de manière significative la consommation totale d’énergie des entreprises. Néanmoins, en examinant et en mettant en œuvre des services de pointe là et comment ils ont du sens, auprès de fournisseurs de confiance expérimentés dans la structure de tels déploiements, les entreprises peuvent tirer le meilleur parti de l’IA tout en gardant leur empreinte carbone légère, en utilisant l’énergie aussi efficacement que possible.

possible d’alimenter leurs toutes nouvelles opérations basées sur l’IA. De tels déploiements d’IA pourraient même les aider à améliorer encore davantage la consommation d’énergie en analysant et en recommandant aux entreprises des moyens de réduire encore davantage la consommation d’énergie des gadgets, en utilisant les données collectées sur site. Il existe de nombreux fournisseurs qui vendent des articles, mais il est clair que mettre l’IA à la pointe de la technologie est une voie avantageuse pour les entreprises qui cherchent à réduire leurs coûts d’énergie et leur impact environnemental. Et cela peut certainement alléger une partie de la charge des centres de données hyperscale. L’objectif de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur la technologie et les transactions d’entreprise transformatrices. Découvrez nos aperçus..

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici