World AI Cannes Festival 2024 : GIGABYTE et Arkane Cloud présentent le supercalculateur d’IA optimisé par les technologies GPU

A l’occasion de la 3e édition du World AI Cannes Festival, Gigabyte en dit plus sur son offre au service des entreprises ayant besoin de puissance de calcul pour exploiter sans compromis tout le potentiel de l’intelligence artificielle.

World AI Cannes Festival 2024

Qu’est-ce que le WAICF ?

Pendant 3 jours, Cannes devient la capitale mondiale de l’IA. En effet, cette année encore, les 200 plus grands décideurs et innovateurs en matière d’IA se rencontrent dans le cadre du World AI Cannes Festival. C’est l’occasion de discuter des innovations et des technologies les plus prometteuses en matière d’IA et analyser les stratégies et les cas d’utilisation de l’IA qui changent la donne.

Pourquoi GIGABYTE a-t-il choisi de participer ?

GIGABYTE a constaté une croissance exponentielle dans les segments de marché de l’IA et du HPC (High Performance Computing ou calcul haute performance), en particulier avec les demandes des fournisseurs de services cloud (CSP) et des opérateurs de centres de données qui travaillent avec des entreprises publiques et privées pour lancer des projets de supercalculateurs. À cet égard, GIGABYTE a décidé de mettre en avant son partenaire CSP pour le marché français, Arkane Cloud, afin de démontrer les avantages de l’infrastructure GPU Cloud d’Arkane, alimentée par les technologies GPU. L’objectif étant d’engager la conversation avec les utilisateurs finaux et les entreprises qui recherchent un Cloud IA souverain en France et dont les projets dépendent en grande partie du calcul par le GPU.

Gigabyte nvidia H100

Quelles sont les solutions présentées ?

GIGABYTE et Arkane Cloud présenteront du matériel de serveur GPU et une démonstration en direct du déploiement de Kubernetes dans un scénario multi-cloud en utilisant l’infrastructure d’Arkane Cloud. Ce dernier offrira des crédits GPU Cloud gratuits aux visiteurs qui viendront sur le stand pour découvrir l’offre.

Quels types d’applications nécessitent cette puissance de calcul ?

L’infrastructure d’Arkane Cloud est construite avec le matériel serveur GPU de GIGABYTE qui est conçu pour l’IA computing (la plus haute densité de GPU par système, pour un déploiement conteneurisé ou bare-metal), le High Performance Computing (comme la simulation scientifique), Virtual Desktop Infrastructure (pour une meilleure expérience de travail à distance pour les utilisateurs de graphiques lourds), Render Farm (pour le moteur de rendu centré sur le GPU, les flux de travail de post-production), et Edge Computing (inférence utilisant le GPU).

Pourquoi le partenariat avec Arkane Cloud est-il stratégique ?

Arkane Cloud s’appuie sur sa solide expérience en matière d’intégration de systèmes, de fourniture de solutions et de calcul par le GPU pour personnaliser son offre Cloud pour chacun de ses clients. La connaissance d’Arkane Cloud du marché français et son succès grandissant sur ce segment ont fait d’elle un partenaire fiable et compétent pour apporter de la valeur ajoutée au matériel serveur de GIGABYTE. Arkane Cloud bénéficie également du large portefeuille de modèles de serveurs de GIGABYTE qui peuvent tous être configurés pour les différents cas d’utilisation prévus. La flexibilité de la conception matérielle de GIGABYTE est un élément clé de la différenciation de l’offre d’Arkane Cloud par rapport à la concurrence.

serveur gigabyte ia

Quel est le rôle des GPU dans cette offre ?

Les technologies GPU permettent un parallélisme massif dans les calculs et la virtualisation des instances de calcul GPU pour prendre en charge des charges de travail mixtes. GIGABYTE a travaillé avec ses partenaires fabricants de GPU pour proposer des serveurs GPU dans tous les facteurs de forme et toutes les options de densité de GPU. Arkane Cloud bénéficie des certifications pour son savoir-faire technique sur le matériel serveur GPU de GIGABYTE pour garantir des performances optimales et une continuité de fonctionnement grâce à la qualité et à la fiabilité du matériel.

Quels sont les modèles de GPU utilisés dans l’infrastructure d’Arkane Cloud ? Pourquoi ?

Actuellement, des cartes GPU des multiples marques principales dans le marché mondial sont déployées parce qu’elles sont les plus polyvalentes pour toutes les charges de travail. Avec respectivement 24 Go et 16 Go de VRAM et leurs incroyables performances, elles peuvent être utilisées pour la génération d’IA comme la génération audio, la génération d’images et pour de petits LLM, mais aussi dans d’autres domaines comme le Cloud Gaming, le rendu 3D et la CAO.

Le déploiement d’une nouvelle gamme de produits interviendra dans les 3 mois qui suivent  :

  • Des GPUs en petit format pour l’IA et le graphisme, la vidéo
  • Des GPUs conçus pour l’IA et le rendu 3D
  • Des GPUs et des APUs ultra-performants pour les charges de travail lourdes (HPC et LLM).

L’idée étant d’apporter à tous les clients une solution complète pour tous leurs besoins en matière de calcul.

Image 1 : World AI Cannes Festival 2024 : GIGABYTE et Arkane Cloud présentent le supercalculateur d’IA optimisé par les technologies GPU
World AI Cannes Festival 2024 : GIGABYTE et Arkane Cloud présentent le supercalculateur d’IA optimisé par les technologies GPU.

Comment cela répond-il aux exigences de flexibilité des clients ?

Arkane Cloud et GIGABYTE collaborent pour choisir la configuration matérielle la plus adaptée au GPU Cloud d’Arkane, qui utilise les technologies GPU des multiples marques principales dans le marché mondial. Sur le plan matériel, les possibilités sont illimitées.

Arkane Cloud prévoit de développer une nouvelle ligne de produits avec les cartes les plus récentes, afin de donner aux clients la meilleure opportunité d’obtenir les équipements les plus efficaces du marché mondial pour leurs charges de travail.

Codesphere, en partenariat avec Arkane Cloud et GIGABYTE, transforme les technologies GPU cloud pour une plus grande flexibilité. La prochaine ligne de produits d’Arkane Cloud, composée de GPU de pointe, est conçue pour fournir aux clients les meilleures cartes pour leurs charges de travail.

Le partenariat avec Codesphere permet d’introduire une plateforme révolutionnaire qui simplifie le processus de développement de l’IA pour les entreprises travaillant sur les MLops.

Ensemble, ils ont les pionniers de l’autoscaling et de l’entraînement de modèles d’IA à grande échelle, offrant aux entreprises de multiples options pour le déploiement de l’intelligence artificielle.

En exploitant les capacités d’inférence réactive de Codesphere, telles que l’activation instantanée du démarrage à froid et la mise à l’échelle des ressources en temps réel, ils garantissent une expérience transparente et efficace pour les développeurs et éliminent le besoin de recourir à des experts coûteux. Cela souligne leur engagement en faveur de l’innovation et de la simplicité dans le développement de l’intelligence artificielle grâce aux puissantes capacités de Codesphere.

Quels sont les services associés proposés ?

Arkane Cloud ne se contente pas de louer des GPU, il offre des solutions MLOps pour développer des solutions dans le domaine de l’IA. Dans les prochains mois, une nouvelle fonctionnalité sera là pour aider les créateurs à obtenir la meilleure plateforme pour le rendu 3D.  L’objectif est d’offrir une gamme variée d’outils pour rendre votre voyage informatique aussi fluide que possible.

Solutions de stockage de données :
Les services de stockage prêts pour l’IA sont conçus pour stocker et gérer des ensembles de données en toute sécurité, en fournissant une base fiable pour vos besoins de calcul. Le stockage robuste des données garantit l’accessibilité et l’intégrité, et répond aux exigences des charges de travail complexes en matière d’IA et de HPC.

Réseau haute performance :
Arkane Cloud dispose de services de réseau de pointe pour faciliter le transfert rapide et sécurisé des données. Des réseaux à grande vitesse assure une performance optimale pour les tâches de calcul distribuées, répondant aux exigences des applications IA et HPC grâce aux commutateurs et aux cartes réseau Mellanox.

Plateforme MLOps avec solution de conteneurs :
La plateforme MLOps d’Arkane Cloud en collaboration avec Codesphere est conçue pour rationaliser le déploiement et la gestion des workflows d’apprentissage automatique. Les solutions de conteneurs fournissent un environnement cohérent et évolutif pour le déploiement des modèles d’IA. En encapsulant les dépendances dans des conteneurs, il est possible de garantir la reproductibilité et le déploiement transparent dans différents environnements. Qu’il s’agisse de pousser des modèles en production ou d’orchestrer des flux de travail complexes, leur plateforme MLOps assure un parcours fluide du développement au déploiement.

Flexibilité du paiement à l’usage :
L’engagement d’Arkane Cloud en matière de flexibilité s’étend à au modèle de facturation. Il s’agit simplement d’un paiement à l’usage. Cela signifie que vous ne payez que pour les ressources GPU que vous consommez, ce qui vous permet de faire évoluer votre infrastructure en fonction de votre utilisation réelle. Que vous soyez une startup avec des charges de travail fluctuantes ou une entreprise avec des besoins de calcul évolutifs, le modèle de paiement à l’utilisation vous permet de bénéficier d’une rentabilité et d’une prévisibilité financière. C’est comme si vous disposiez d’un compteur pour votre puissance de calcul – utilisez ce dont vous avez besoin et ne payez que ce que vous utilisez.

Comment fonctionne la tarification ?

Facturation horaire avec une précision de second niveau :
Arkane Cloud comprend que vos besoins informatiques peuvent varier, et propose un modèle de tarification qui s’aligne sur votre utilisation à la seconde près. Alors que l’utilisation est calculée sur une base horaire, le système de facturation fonctionne avec une précision de second niveau. Cela signifie que vous ne payez que pour la durée exacte de l’utilisation du GPU, ce qui vous offre une granularité inégalée dans la gestion des coûts.

Coûts de déploiement transparents :
Le coût de déploiement pour démarrer votre application est de seulement 0,7 $ par heure. Ce coût initial vous permet de disposer des clés de la gamme de GPU, prêts à déployer vos applications rapidement et efficacement. C’est comme si vous payiez un petit péage pour entrer dans un monde de merveilles informatiques.

Répliquez les GPU à votre guise :
Vous avez la possibilité de répliquer les GPU en fonction de votre charge de travail. Vous avez besoin d’une plus grande capacité de calcul ? Pas de problème ! Répliquez des GPU supplémentaires avec la facilité d’un copier-coller, en faisant évoluer votre infrastructure en fonction de vos besoins. Chaque GPU répliqué contribue à votre utilisation horaire, ce qui vous permet d’adapter précisément vos ressources aux exigences de vos applications.

GIGABYTE et Arkane Cloud offrent des crédits GPU Cloud GRATUITS. Réservez dès maintenant un rendez-vous pendant la WAICF Cannes 2024.

Cet article a été rédigé en partenariat avec Gigabyte.