mardi, 5 mars 2024

Windows 12 et la prochaine guerre des puces IA

Crédit : Mmaxer/ Shutterstock

Depuis plus d’un an, nous entendons effectivement des rumeurs selon lesquelles Windows 12, la prochaine version importante du système d’exploitation vénéré de Microsoft, pourrait arriver dès 2024. Comme toujours, Microsoft a refusé de vérifier ou de nier ces rapports. Lorsque le directeur financier d’Intel, David Zinsner, a récemment fait allusion à une version de Windows prévue l’année prochaine qui stimulerait les ventes de nouveaux PC (et donc de processeurs), les langues ont commencé à bouger.

Zinsner n’a pas eu l’intention de donner un coup de main à Microsoft. – il l’a fait par hasard lors d’une conversation avec un analyste monétaire lors de la Global Innovation Conference de Citigroup en septembre. Dans une transcription publiée par le site financier Looking for Alpha (inscription gratuite requise), il aurait déclaré : « Nous pensons en fait que 24 sera une assez bonne année pour les clients [ventes de processeurs], en particulier en raison de le rafraîchissement de Windows. Et nous pensons toujours que la base [PC] installée est assez ancienne et a besoin d’un rafraîchissement, et nous pensons que l’année prochaine pourrait être le début de cela, à condition que Windows soit le catalyseur. »

Beaucoup les experts ont conclu qu’il décrivait Windows 12, mais le mot personnel ici est « revitaliser » et non un numéro de version. Quoi que Microsoft ait prévu pour l’année prochaine, le label n’a pas d’importance. S’il nécessite un nouveau matériel, il s’agira d’une mise à niveau considérable du système d’exploitation Windows, mettant fortement l’accent sur (quoi d’autre ?) l’intelligence artificielle et bien au-delà des capacités du Copilot pour Windows existant, son outil d’IA générative.

« [C’est] quelque chose de beaucoup plus riche dans Windows qui entraînera des besoins de calcul plus élevés », a déclaré Bajarin. « Pour la première fois depuis longtemps, vous allez voir des applications logicielles qui nécessitent des niveaux de calcul que nous n’avons pas aujourd’hui, ce qui est formidable pour tout le monde dans le silicium. Une grande partie est basée sur toutes ces choses de l’IA. « 

GenAI sur le bureau ?

L’explosion des outils d’IA générative comme ChatGPT et Bard – et les grandes conceptions de langage (LLM) qui les sous-tendent – a induit des fermes de serveurs avec des milliers de GPU. Que pourrait apporter un ordinateur de bureau ? La réponse est complexe.

L’IA sur un client sera une inférence, pas une formation. La partie formation de genAI est la partie à forte intensité de processus. L’inférence est simplement une correspondance et nécessite un processeur beaucoup moins puissant.

Et les entreprises sont extrêmement réticentes à utiliser un cloud public pour partager ou utiliser les informations de leur entreprise dans le cadre de programmes cloud tels que ChatGPT. « Les choses importantes que j’entends régulièrement revenir de la part des DSI et des CSO sont la souveraineté et la confidentialité des informations. Ils souhaitent que les conceptions soient exécutées localement », a déclaré Bajarin.

La formation en IA est très coûteuse à mettre en œuvre, que ce soit dans le cloud ou dans le cloud. sur site, ajoute-t-il. L’inférence n’est pas aussi gourmande en énergie, mais elle utilise quand même beaucoup de jus à grande échelle.

À mesure que les conceptions deviennent plus efficaces et que les calculs s’améliorent, il est bien préférable d’exécuter l’inférence dans votre région, car il est plus abordable de l’exécuter sur du matériel local que sur le cloud. Ainsi, la souveraineté et la sécurité de l’information suscitent le désir de traiter l’IA localement plutôt que dans le cloud.

Une époque fascinante sur le marché des puces

Voici le rebondissement de l’intrigue. Intel et AMD ont en fait discuté de l’inclusion du traitement de l’IA dans les processeurs, Intel étant en tête pour le moment. Ils ont cependant de nouveaux concurrents. Le premier est Qualcomm, qui a acquis en 2021 une start-up de processeurs de bureau basés sur Arm appelée Nuvia pour 1,4 milliard de dollars. Il se prépare maintenant à lancer des puces de bureau pour concurrencer Intel et AMD sous la marque Snapdragon X Elite.

Bajarin a noté que le processeur Qualcomm AI était capable d’effectuer 45 AI TOPS (des milliards d’opérations par seconde). seul, et avec le CPU, il peut faire 75 TOPS. Le processeur le plus récent d’Intel est tout juste capable de gérer 10 TOPS et AMD n’a pas encore publié de chiffres.

« En ce qui concerne la partie essentielle pour l’IA, qui est le NPU (système de traitement neuronal), [La puce de Qualcomm] est bien plus performante que tout ce qui sera commercialisé par Intel ou AMD au cours des 12 prochains mois », a-t-il déclaré.

Et comme si cela ne suffisait pas, Reuters rapporte que Nvidia envisage de développer son propre processeur de bureau basé sur l’architecture Arm. Il dispose déjà d’un processeur pour serveurs appelé Grace Hopper. Il ne faudrait pas beaucoup d’efforts de la part de Nvidia pour réutiliser le processeur pour un ordinateur de bureau.

Et Microsoft a été extrêmement motivé en prenant en charge Arm à la fois sur le serveur et sur le bureau. Ainsi, à mesure que la bataille de l’IA se déplace vers le client et d’autres points de terminaison, la course à deux chevaux entre Intel et AMD se transforme soudainement en une course à quatre chevaux avec la contribution de Qualcomm et Nvidia.

Il semble donc que l’informatique aura plus d’options en ce qui concerne les systèmes de bureau. Cela peut être bon ou mauvais, selon votre point de vue.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici