Fabrication industrielle
Internet des objets industriel | Matériaux industriels | Entretien et réparation d'équipement | Programmation industrielle |
home  MfgRobots >> Fabrication industrielle >  >> Industrial Internet of Things >> Embarqué

Xilinx double Alveo HBM, ajoute le clustering pour les charges de travail HPC et Big Data

Lors de la conférence sur les supercalculateurs SC21 cette semaine, Xilinx a présenté sa carte d'accélérateur de centre de données Alveo U55C et une nouvelle solution de clustering basée sur des normes et basée sur des API pour le déploiement de FPGA à grande échelle. La société a déclaré qu'en permettant le clustering de centaines de cartes Alveo et la programmabilité de haut niveau de l'application et du cluster, cette nouvelle carte permet de faire évoluer les capacités de calcul d'Alveo pour cibler les charges de travail de calcul haute performance (HPC) plus facilement et plus efficacement qu'auparavant.

Xilinx a déclaré que la carte Alveo U55C est spécialement conçue pour les charges de travail HPC et Big Data, offrant la densité de calcul et la capacité HBM (mémoire à bande passante élevée) les plus élevées du portefeuille d'accélérateurs Alveo. Avec la nouvelle solution de clustering basée sur Xilinx RoCE v2, un large éventail de clients avec des charges de travail de calcul à grande échelle peuvent désormais mettre en œuvre un puissant clustering HPC basé sur FPGA en utilisant leur infrastructure et leur réseau de centre de données existants. D'un point de vue architectural, l'accélérateur basé sur FPGA prétend offrir les meilleures performances au moindre coût pour de nombreuses charges de travail gourmandes en calcul. Il introduit une méthodologie basée sur des normes qui permet la création de clusters Alveo HPC en utilisant l'infrastructure et le réseau existants d'un client.

La société a déclaré qu'il s'agissait d'un grand pas en avant pour une adoption plus large d'Alveo et de l'informatique adaptative dans l'ensemble du centre de données.

Dans une interview avec Embedded.com, Nathan Chang, chef de produit HPC pour les centres de données chez Xilinx, a déclaré :« Nous commençons à voir que le calcul n'est pas toujours le goulot d'étranglement. En fait, le plus souvent, il s'agit de la bande passante mémoire. De plus en plus de problèmes de calcul deviennent liés à la bande passante mémoire. Nous avons donc réduit notre carte à un seul emplacement et doublé le HBM de cette carte. Mais plus important encore, nous avons fourni la possibilité d'évoluer sur ces cartes, avec la possibilité de créer de grands clusters avec des centaines de cartes et de cibler tous les HBM sur ces cartes."

Il a poursuivi :« Déverrouiller la bande passante entre les grappes de cartes Alveo a toujours été un gros effort pour notre communauté. Les développeurs devaient créer des équipes, puis créer leurs propres conceptions de clusters pour répondre à leurs besoins. Nous proposons désormais un package de clustering basé sur des normes ouvertes, ce qui signifie que nous tirerons parti de RoCE v2 et du pontage de centre de données, sur Ethernet avec une bande passante de 200 Gbit/s dans chaque carte. »

« Cela signifie que dans l'infrastructure existante des centres de données, vous pourrez placer ces cartes dans des serveurs existants, les exploiter sur les réseaux Ethernet existants et rivaliser avec InfiniBand en termes de performances et de latence. »

« Un autre point clé est que non seulement nous créons de la place pour des charges de travail plus importantes, mais nous veillons également à ce que Vitis soit plus accessible à la communauté des développeurs. Vous n'avez plus besoin de comprendre RTL ou Verilog. Vous êtes capable de programmer des cartes Alveo et des cartes Alveo cibles avec des langages existants de haut niveau tels que C, C++ et Python. »

Fonctionnalités de l'Alveo U55C pour HPC et big data

La carte Alveo U55C combine de nombreuses fonctionnalités clés requises par les charges de travail HPC d'aujourd'hui. Il offre plus de parallélisme des pipelines de données, une gestion supérieure de la mémoire, un mouvement de données optimisé tout au long du pipeline et les performances par watt les plus élevées du portefeuille Alveo, selon Xilinx. La carte est un facteur de forme pleine hauteur et demi-longueur (FHHL) à un seul emplacement avec une faible puissance maximale de 150 W. Elle offre une densité de calcul supérieure et double le HBM2 à 16 Go par rapport à son prédécesseur, la carte Alveo U280 à double emplacement. Par conséquent, le nouveau U55C fournit plus de calcul dans un facteur de forme plus petit pour créer des clusters denses basés sur l'accélérateur Alveo. Cela cible les données de streaming haute densité, les calculs d'E/S élevés et les gros problèmes de calcul qui nécessitent une mise à l'échelle comme l'analyse de données volumineuses et les applications d'IA.

Tirant parti de RoCE v2 et du pontage de centre de données, couplé à une bande passante de 200 Gbit/s, la solution de clustering pilotée par API permet un réseau Alveo qui rivalise avec les réseaux InfiniBand en termes de performances et de latence, sans verrouillage du fournisseur. L'intégration MPI permet aux développeurs HPC de faire évoluer le pipeline de données Alveo à partir de la plate-forme logicielle unifiée Xilinx Vitis. En utilisant les normes et cadres ouverts existants, la société a déclaré qu'il était désormais possible d'évoluer sur des centaines de cartes Alveo quelles que soient les plates-formes de serveur et l'infrastructure réseau et avec des charges de travail et une mémoire partagées.

Les développeurs de logiciels et les scientifiques des données peuvent bénéficier des avantages d'Alveo et de l'informatique adaptative grâce à une programmabilité de haut niveau de l'application et du cluster utilisant la plate-forme Vitis. Xilinx a déclaré avoir investi massivement dans la plate-forme de développement et le flux d'outils Vitis pour rendre l'informatique adaptative plus accessible aux développeurs de logiciels et aux scientifiques des données sans expertise matérielle. Les principaux frameworks d'IA tels que Pytorch et Tensorflow sont pris en charge, ainsi que les langages de programmation de haut niveau tels que C, C++ et Python, permettant aux développeurs de créer des solutions de domaine à l'aide d'API et de bibliothèques spécifiques, ou d'utiliser des kits de développement logiciel Xilinx, pour accélérer facilement le HPC clé. charges de travail au sein d'un centre de données existant.

Qui utilise les cartes ?

Chang a déclaré que la société travaillait avec plusieurs organisations sur des conceptions de preuve de concept utilisant les cartes U55C.

L'un d'eux est le CSIRO, l'organisme de recherche national australien avec le plus grand réseau d'antennes de radioastronomie au monde, qui a utilisé le U55C plutôt que les GPU, car la carte Alveo permet une carte à un seul emplacement et ne nécessite pas de NIC (carte d'interface réseau). Le CSIRO utilise des cartes Alveo U55C pour le traitement du signal dans le radiotélescope à réseau de kilomètres carrés. Le déploiement des cartes Alveo en tant qu'accélérateurs connectés au réseau avec HBM permet un débit massif à grande échelle sur le cluster de traitement du signal HPC. Le cluster basé sur l'accélérateur Alveo permet au CSIRO de s'attaquer à la tâche de calcul massive consistant à agréger, filtrer, préparer et traiter les données de 131 000 antennes en temps réel. Les 460 Gbit/s de bande passante HBM2 sur le cluster de traitement du signal sont desservis par 420 cartes Alveo U55C entièrement mises en réseau sur des commutateurs 100 Gbit/s compatibles P4. Le cluster Alveo U55C offre des performances de traitement avec un débit global de 15 To/s dans une alimentation compacte et un encombrement économique. Le CSIRO est en train de terminer un exemple de conception de référence d'Alveo afin d'aider d'autres industries de radioastronomie ou adjacentes à obtenir le même succès.

Un autre exemple de cas d'utilisation est le logiciel de simulation de crash Ansys LS-DYNA, qui est utilisé par presque toutes les entreprises automobiles dans le monde. La conception de systèmes de sécurité et de structure repose sur les performances des modèles, car ils atténuent les coûts des essais de collision physiques avec des simulations de la méthode des éléments finis (FEM) de conception assistée par ordinateur. Les solveurs FEM sont les principaux algorithmes conduisant des simulations avec des centaines de millions de degrés de liberté, ces énormes algorithmes peuvent être décomposés en solveurs plus rudimentaires comme PCG, matrices creuses, ICCG. En évoluant sur de nombreuses cartes Alveo avec un pipeline de données hyper parallèle, LS-DYNA peut accélérer les performances de plus de 5 fois par rapport aux processeurs x86. Cela se traduit par plus de travail par cycle d'horloge dans un pipeline Alveo, les clients LS-DYNA bénéficiant de temps de simulation révolutionnaires. « Dans un esprit d'innovation incessante, nous sommes ravis de collaborer avec Xilinx pour accélérer considérablement les solveurs par éléments finis, qui peuvent représenter 90 % de la charge de travail de calcul pour la mécanique implicite, dans notre application de simulation LS-DYNA », a déclaré Wim Slagter , directeur des partenariats stratégiques chez Ansys. « Nous attendons avec impatience que l'accélération Xilinx nous aide dans notre mission de soutenir les innovateurs dans l'ingénierie de ce qui nous attend. »

Xilinx a cité un troisième exemple, celui de TigerGraph, un fournisseur d'une plate-forme d'analyse graphique de premier plan. La société utilise plusieurs cartes Alveo U55C pour regrouper et accélérer les deux algorithmes les plus prolifiques qui pilotent les moteurs de recommandation et de clustering basés sur des graphiques. Les bases de données graphiques sont une plate-forme perturbatrice pour les scientifiques des données. Les graphiques prennent les données des silos et mettent l'accent sur les relations entre les données. La prochaine frontière pour le graphique est de trouver ces réponses en temps réel. Alveo U55C accélère les temps de requête et les prédictions pour les moteurs de recommandation de quelques minutes à quelques millisecondes. En utilisant plusieurs cartes U55C pour augmenter l'analyse, la puissance de calcul et la bande passante mémoire supérieures accélèrent les requêtes graphiques jusqu'à 45 fois plus rapidement que les clusters basés sur CPU. La qualité des scores augmente également jusqu'à 35 %, ce qui se traduit par une plus grande confiance, réduisant considérablement les faux positifs à un faible chiffre.

La carte Alveo U55C est actuellement disponible sur le site Web de Xilinx et auprès des distributeurs agréés Xilinx. Il est également disponible pour évaluation via des fournisseurs de FPGA en tant que service basés sur le cloud public, ainsi que des centres de données de colocation sélectionnés pour des aperçus privés. Le clustering est disponible dès maintenant pour les aperçus privés, avec une disponibilité générale prévue au deuxième trimestre de l'année prochaine.


Embarqué

  1. TI :la technologie de résonateur BAW ouvre la voie aux communications de nouvelle génération
  2. MODULE DE DONNÉES :nouvelle technologie de collage pour les projets à haut volume
  3. Cervoz :SSD robuste de qualité militaire pour les applications critiques
  4. CEVA :processeur IA de deuxième génération pour les charges de travail des réseaux de neurones profonds
  5. Kontron :nouveau standard de calcul embarqué COM HPC
  6. acceed :modules d'E/S pour une communication de données évolutive
  7. Quatre grands défis pour l'Internet des objets industriel
  8. Les mégadonnées seront-elles une panacée pour les budgets de santé en difficulté ?
  9. Big Data vs Intelligence Artificielle