Cette entreprise d’intelligence artificielle chinoise va-t-elle dépasser OpenAI ?

Cette intelligence artificielle chinoise utilise plus de 50 000 cartes graphiques Nvidia H100, de quoi l’entrainer assez solidement pour dépasser OpenAI ?

Selon Alexandr Wang, fondateur et PDG de Scale AI, le laboratoire chinois d’intelligence artificielle DeepSeek dispose d’un accès massif à des GPU NVIDIA H100 pour l’entraînement de ses modèles d’IA. Ces déclarations, faites lors d’une interview accordée à CNBC, mettent en lumière les capacités technologiques de DeepSeek, dont le modèle d’IA R1 rivalise avec les plateformes américaines telles que OpenAI et Meta.

DeepSeek R1 : un modèle à la pointe de l’innovation

Le modèle R1 de DeepSeek est présenté comme l’un des plus avancés au monde, rivalisant avec les meilleurs modèles américains, dont OpenAI o1 et Llama de Meta. Alexandr Wang a affirmé que R1 a obtenu des performances équivalentes, voire supérieures, lors du test d’IA le plus exigeant de sa société, nommé « Humanity’s Last Exam ». Ce test regroupe des questions complexes provenant de disciplines scientifiques comme les mathématiques, la physique, la biologie et la chimie, adaptées aux recherches les plus récentes.

Wang a également souligné que ce modèle marque une étape importante dans la compétition technologique entre les États-Unis et la Chine. Selon lui, la sortie de ce modèle le jour de Noël symbolise une volonté stratégique de la part de DeepSeek.

DeepSeek peut utiliser des GPU NVIDIA H100

Le laboratoire DeepSeek disposerait d’environ 50 000 GPU NVIDIA H100, d’après les déclarations de Wang. Les H100 font partie des GPU de la génération Hopper, actuellement les plus utilisés dans le monde pour l’entraînement des modèles d’intelligence artificielle. Ces puces, très recherchées, sont également soumises à des restrictions d’exportation imposées par le gouvernement américain, en raison de leur potentiel technologique.

cartes graphiques nvidia h100 deepseek

Face à ces restrictions, NVIDIA a développé des versions alternatives de ses puces, comme les H800 et A800, pour le marché chinois. Toutefois, ces dernières ont également été interdites à l’exportation en octobre 2023. Malgré cela, Wang estime que les laboratoires chinois disposent de stocks de H100 plus importants que prévu, même s’ils ne peuvent communiquer ouvertement à ce sujet en raison des contraintes réglementaires.

La Chine vs le géant OpenAI et surtout … les USA

Bien que DeepSeek ait accès à un large stock de GPU H100, Wang pense que la Chine pourrait rencontrer des difficultés à se procurer davantage de puces à l’avenir. Les restrictions sur les exportations imposées par les États-Unis devraient limiter l’accès aux technologies de pointe, ce qui pourrait freiner le développement des modèles d’IA chinois à long terme.

Le modèle R1 de DeepSeek et les ressources massives en GPU NVIDIA H100 du laboratoire témoignent des avancées significatives de la Chine dans le domaine de l’intelligence artificielle. Toutefois, les restrictions internationales pourraient limiter les ambitions chinoises dans un secteur marqué par une concurrence technologique intense entre les grandes puissances.