mercredi, 24 avril 2024

Intel affirme que son accélérateur Gaudi2 est plus qu’un match pour le Nvidia A100

En bref : Intel a en fait attiré une rivalité entre son tout nouvel accélérateur Gaudi2 et le leader du marché maintenant âgé de deux ans, le Nvidia A100. Dans 2 standards adaptés à son créneau, le nouvel accélérateur au nom criard prend de l’avance.

Gaudi2 est produit Intel par Habana Labs, une société israélienne qu’il a obtenu fin 2019 pour 2 milliards de dollars. Habana fabrique en fait deux types d’accélérateurs spécialisés : certains pour l’entraînement des réseaux de neurones, comme Gaudi2 ; et d’autres pour les exécuter (c’est-à-dire les « inférer »), comme Goya et Greco.

Performances

Habana et Intel ont publié Gaudi2 en mai, mais ont attendu la semaine dernière pour publier leurs notes de référence dans la base de données publique MLPerf . Dans leurs graphiques, ils comparent les scores de leur système Gaudi2 aux notes publiques des systèmes équipés de l’A100 de Nvidia et Dell.

ResNet-50 teste la capacité du matériel à former une IA pour classer les images. Le système Gaudi2 de Habana n’a mis que 18 minutes à former l’IA pour qu’elle réussisse le test, dépassant facilement le système A100 de Nvidia, qui nécessitait pratiquement une demi-heure.

Gaudi2 de Habana Le système n’a pris que 17 minutes pour former le modèle BERT, battant le temps du système A100 de Nvidia d’environ une minute. BERT est une conception de traitement du langage naturel, et dans ce test, il s’entraîne avec de courts articles de Wikipedia.

Pour les deux normes, tous les systèmes utilisaient 8 accélérateurs/GPU. Le système de Habana a associé le leur à un ensemble de processeurs Intel Xeon 8380 à 40 cœurs et Nvidia a utilisé 2 processeurs AMD Epyc 7742 à 64 cœurs.

Spécifications

Gaudi2 comprend 24 TPC (cœurs de processeur tenseur ) et 2 MME (moteurs de reproduction matricielle) qui fonctionnent partiellement en parallèle. Il prend en charge un large éventail de types de données, notamment FP32, TF32, BF16, FP16 et FP8. Il dispose également d’un moteur multimédia dédié au traitement des médias audio et visuels en tant qu’entrées.

Pour la mémoire, Gaudi2 dispose de six piles de 16 Go de HBM2e totalisant 96 Go et 2,45 To/s de bande passante mémoire totale. A l’intérieur, il dispose d’un cache de 48 Mo. Pour la connectivité, il utilise une connexion x16 PCIe 4.0 et dispose de 24 ports RoCE2 100 Mbps (RDMA sur Converged Ethernet 2).

Concurrents

Habana a en fait clairement créé un véritable concurrent A100 pour Intel. Son timing pourrait être bien meilleur, étant donné que Nvidia a annoncé le H100 il y a 3 mois, mais les 2 sont des produits si différents que même s’ils peuvent remplir les critères, ils ne le sont peut-être pas vraiment pour les emplacements de carte mère.

Alors que l’A100 et le H100 sont des léviathans flexibles, Gaudi2 est un accélérateur structuré essayant de faire quelque chose de différent, et il sera fascinant de voir s’il réussit ou non.

Toute l’actualité en temps réel, est sur L’Entrepreneur

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici