Neoclouds expliqué :pourquoi l'IA a besoin d'un cloud computing axé sur les GPU
Les charges de travail d’IA deviennent courantes dans pratiquement tous les secteurs. Mais à mesure que la demande en IA augmente, la pression sur les infrastructures augmente également. Malheureusement, les options traditionnelles pour accéder au calcul haute performance ne suffisent pas, ce qui conduit les entreprises à rechercher des alternatives. Certains se tournent vers les néoclouds, un nouveau type de fournisseur de services de calcul centré sur les offres centrées sur les GPU.
Ces nouveaux fournisseurs suscitent de plus en plus d'intérêt en raison d'une évolution de l'informatique ; celui caractérisé par une dépendance croissante à l’égard des GPU pour l’IA. Bien que les GPU soient bien adaptés pour répondre aux besoins de traitement parallèle de la formation et de l’inférence de l’IA, ils sont notoirement chers et rares. Un GPU haut de gamme peut coûter des dizaines de milliers de dollars, et ce seulement si une entreprise parvient à en trouver un. Les cycles d'approvisionnement sont longs, les délais de livraison sont imprévisibles et les équipes informatiques des entreprises ont souvent du mal à acquérir une capacité suffisante pour répondre à la demande.
Les fournisseurs de cloud hyperscale, tels qu'AWS, Google Cloud et Azure, ont cherché à combler cette lacune en proposant des instances GPU et des GPU en tant que service. Pour de nombreuses organisations, ce modèle fonctionne, mais seulement jusqu'à un certain point.
Les instances GPU basées sur le cloud offrent flexibilité, évolutivité et déploiement rapide. Mais à mesure que l’usage augmente, la facture augmente également. Le modèle de paiement à l'utilisation devient rapidement prohibitif à grande échelle, en particulier pour les charges de travail soutenues telles que la formation sur les grands modèles de langage (LLM), le réglage précis ou l'inférence en temps réel dans les applications d'entreprise.
En conséquence, de nombreuses organisations se retrouvent prises entre le marteau (infrastructure sur site rare et coûteuse) et l'enclume (coûts élevés des GPU dans le cloud public).
Entrez dans Neoclouds
Dans cet environnement, une nouvelle catégorie de fournisseur de calcul émerge :le fournisseur néocloud. Les fournisseurs d’infrastructures Neocloud proposent des calculs hautes performances, fortement centrés sur les GPU, à des tarifs plus abordables (du moins selon eux). Ils y parviennent en tirant parti d'origines non conventionnelles, de nouveaux modèles économiques et de différentes stratégies d'infrastructure.
Par exemple, certains néoclouds trouvent leurs racines dans le minage de cryptomonnaies. Lors du boom des cryptomonnaies de la dernière décennie, des milliers de mineurs dans le monde entier ont construit des centres de données équipés de serveurs GPU optimisés pour les opérations minières. Alors que le marché des cryptomonnaies se refroidissait et que le minage devenait moins rentable, ces opérateurs se sont retrouvés avec de grandes quantités de capacité GPU inutilisée. Plutôt que de laisser ce matériel se déprécier dans un entrepôt, certains ont réutilisé leur équipement pour les charges de travail d'IA, et c'est ainsi que le néocloud est né.
D'autres acteurs du secteur sont des startups spécialement conçues qui ont vu une opportunité d'offrir une alternative plus rentable aux hyperscalers en optimisant le rapport prix-performance et en contournant les frais généraux des opérations cloud existantes. Certains s'appuient sur des piles de logiciels open source et sont hébergés dans des centres de données à faible coût; d'autres regroupent la capacité GPU excédentaire sur des réseaux décentralisés, formant une sorte de « marché spot des GPU » que les entreprises peuvent exploiter à moindre coût.
Avantages du modèle Neoclouds
Pour les entreprises qui recherchent la puissance de calcul de l'IA sans les coûts exorbitants, les fournisseurs de néocloud affirment qu'ils peuvent offrir plusieurs avantages, notamment :
Coût inférieur par heure GPU :Les Neoclouds facturent souvent une fraction de ce que font les hyperscalers pour des instances GPU comparables. Ils affirment que leurs modèles opérationnels allégés et leurs stratégies de réutilisation du matériel se traduisent par de réelles économies.
Accès dédié :Dans de nombreux cas, les fournisseurs de néocloud offrent un accès nu dédié aux GPU, réduisant ainsi les conflits et garantissant des performances prévisibles.
Disponibilité rapide :Grâce à des processus d'approvisionnement et de provisionnement flexibles, les fournisseurs de néocloud affirment qu'ils peuvent souvent fournir de la capacité beaucoup plus rapidement que les fournisseurs traditionnels, aidant ainsi les équipes à itérer et à déployer des modèles d'IA sans délai.
Décentralisation et résilience :Certains néoclouds fonctionnent sur des modèles distribués, s'approvisionnant en calcul à partir de centres de données géographiquement divers ou de réseaux d'opérateurs indépendants.
Durabilité :La réutilisation du matériel existant, en particulier celui du secteur des cryptomonnaies, réduit les déchets électroniques et favorise des pratiques informatiques plus durables. Certains néo-clouds sont également hébergés dans des installations alimentées par des énergies renouvelables, réduisant ainsi davantage l'empreinte carbone.
Voir aussi : Changement du marché des GPU :tirer parti de la chute du crypto mining
Les GPU en tant que service, réinventés
À la base, les néoclouds représentent une nouvelle approche du modèle GPU-as-a-Service. Les entreprises considérées comme des fournisseurs de néocloud incluent CoreWeave, Crusoe, Lambda Labs, Nebius, Vast.ai et d'autres.
Ils sont moins concentrés sur le regroupement de GPU avec des services propriétaires et plus intéressés par la fourniture de calculs bruts et hautes performances à un prix qui rend l'IA à grande échelle viable pour un plus grand nombre d'entreprises.
En démocratisant l'accès à des GPU abordables, les fournisseurs de néocloud pensent qu'ils peuvent réduire les barrières à l'entrée pour les entreprises cherchant à créer ou à faire évoluer des applications d'IA. Les petites startups peuvent former des modèles personnalisés sans dépenser leur financement de démarrage. Les entreprises peuvent affiner les LLM sur leurs données propriétaires sans céder le contrôle ni dépenser trop. Et les instituts de recherche peuvent réaliser des simulations et des expériences sans être limités par des contraintes budgétaires.
Malgré ces avantages, les fournisseurs de néocloud sont susceptibles de rivaliser dans un avenir proche avec les hyperscalers sur le marché du GPU-as-a-Service. Ce marché était évalué à 3,23 milliards de dollars en 2023 et devrait atteindre 49,84 milliards de dollars d'ici 2032, soit un taux de croissance de 36 %, selon Fortune Business Insights. (Cette estimation inclut à la fois les hyperscalers et les néoclouds.)
Réflexions finales
Les besoins en calcul de l’IA continuent de croître. Les fournisseurs Neocloud sont une nouvelle génération de fournisseurs d'infrastructures cloud axés sur l'IA qui visent à répondre à ces besoins. Ils se différencient des hyperscalers traditionnels (tels qu'AWS, Azure et GCP) en se concentrant sur une disponibilité optimisée des GPU, une tarification flexible et des performances spécialisées pour les charges de travail IA/ML, entre autres fonctionnalités clés.
Cloud computing
- Choisissez le meilleur fournisseur de services cloud :12 choses à savoir !
- Tout ce dont vous avez besoin sur AWS Cloud
- Sécurité Azure :Bonnes pratiques à connaître
- Comment utiliser efficacement Azure DevOps ?
- Avantages et inconvénients du cloud public
- L'utilisation du SaaS et du cloud nécessite un traitement minutieux des données
- Guide des salaires 2024 dans le cloud computing :parcours de carrière et rémunération
- Risque de sécurité cloud auquel chaque entreprise est confrontée
- Qu'est-ce qu'un hyperviseur Bare Metal ? Un guide complet