{"id":900994,"date":"2025-02-25T07:40:00","date_gmt":"2025-02-25T06:40:00","guid":{"rendered":"https:\/\/www.tomshardware.fr\/?p=900994"},"modified":"2025-02-24T23:44:15","modified_gmt":"2025-02-24T22:44:15","slug":"deepseek-va-devenir-encore-plus-performant-avec-cette-mise-a-jour","status":"publish","type":"post","link":"https:\/\/www.tomshardware.fr\/deepseek-va-devenir-encore-plus-performant-avec-cette-mise-a-jour\/","title":{"rendered":"DeepSeek va devenir encore plus performant avec cette mise \u00e0 jour"},"content":{"rendered":"\n
DeepSeek, une entreprise chinoise sp\u00e9cialis\u00e9e dans l’intelligence artificielle, a r\u00e9cemment d\u00e9voil\u00e9 un projet innovant visant \u00e0 am\u00e9liorer les performances des GPU Hopper H800 de NVIDIA. Baptis\u00e9 FlashMLA, ce projet permet d’augmenter la puissance de calcul de ces GPU de mani\u00e8re significative, sans n\u00e9cessiter de modifications mat\u00e9rielles.<\/p>\n\n\n\n
DeepSeek<\/a> a r\u00e9ussi \u00e0 optimiser les GPU Hopper H800<\/a> en se concentrant sur l’efficacit\u00e9 logicielle. Gr\u00e2ce \u00e0 FlashMLA, l’entreprise affirme avoir atteint 580 TFLOPS pour les multiplications de matrices en BF16, soit environ huit fois plus que les standards de l’industrie. De plus, la bande passante m\u00e9moire a \u00e9t\u00e9 port\u00e9e \u00e0 3000 GB\/s, soit pr\u00e8s du double de la capacit\u00e9 th\u00e9orique maximale du H800. Ces am\u00e9liorations sont rendues possibles par une meilleure gestion de la m\u00e9moire et une allocation plus efficace des ressources lors des requ\u00eates d’inf\u00e9rence.<\/p>\n\n\n\n