Voici pourquoi Grok 3 d’Elon Musk n’est finalement pas extraordinaire

xAI a lancé Grok 3, une IA qu’elle qualifie de plus intelligente au monde, mais les experts restent divisés sur ses capacités réelles.

Le 18 février 2025, xAI a officiellement lancé son modèle Grok 3 LLM lors d’une diffusion en direct animée par Elon Musk. L’entreprise décrit Grok 3 comme l’IA la plus intelligente au monde, une affirmation qui suscite des réactions mitigées parmi les experts.

Présentation de Grok 3

Grok 3 est désormais accessible à tous les abonnés Premium+. Selon xAI, ce modèle surpasse les versions publiques de tous les autres modèles, y compris DeepSeek-V3 et GPT-4o de chez OpenAI, dans les benchmarks de mathématiques, de sciences et de codage. Le modèle a obtenu un score sans précédent de 1 402 sur le benchmark Arena.

https://twitter.com/grok/status/1891792269667094530

Des réactions mitigées

Les marchés de paris, tels que Manifold Markets, prévoient que Grok 3 sera reconnu comme l’IA la plus puissante au monde, bien que la probabilité de cette reconnaissance ait diminué de 91 % à 78 % en raison de commentaires critiques émergents. Certains experts, comme Zihan Wang, ont souligné des erreurs dans les réponses de Grok 3 à des questions logiques simples. D’autres s’interrogent sur l’absence de scores sur des benchmarks comme FrontierMath, Arc-AGI ou HLE.

Une valorisation de xAI en hausse

Bloomberg a rapporté que xAI est en pourparlers avec des investisseurs pour lever jusqu’à 10 milliards de dollars dans un nouveau tour de financement, valorisant la startup à 75 milliards de dollars. Lors du dernier tour de financement, xAI avait levé 6 milliards de dollars pour une valorisation de 40 milliards de dollars.

100 000 GPUs pour xAI

Grok 3 a été formé sur 100 000 GPU, et xAI prévoit d’augmenter cette capacité. Cette expansion pourrait contribuer à la croissance prévue des revenus provenant de la vente de puces d’IA, que BESI estime à 227 milliards de dollars d’ici 2032.

En conclusion, bien que Grok 3 soit un modèle d’IA prometteur, les avis restent partagés quant à sa supériorité par rapport aux autres modèles existants.