Biren BR100 : un “GPGPU” chinois plus performant que l’A100 Ampere de NVIDIA

Le marché des accélérateurs de calculs GPGPU accueille deux nouvelles puces : les Biren BR100 et BR104. Et leurs caractéristiques sont particulièrement alléchantes.

Biren BR100 BR104
Crédit : Biren

Le constructeur chinois Biren, fondé en 2019, a profité de son évènement Biren Explore Summit 2022 pour dévoiler son BR100, une puce GPGPU basée sur une architecture propriétaire baptisée BiLiren. Sur le papier, celle-ci se veut plus performante que l’A100 de NVIDIA et son architecture Ampere. Attention toutefois, il ne s’agit ici nullement d’un chipset graphique mais bien d’une puce destinée aux calculs de type GPGPU, que l’on utilise par exemple pour de l’imagerie médicale ou dans les simulations moléculaires et physiques.

À lire > Guide d’achat processeurs : AMD Ryzen ou Intel Core, quel CPU acheter ?

77 milliards de transistors, 2 ExaFLOPs en INT8

Composée de 77 milliards de transistors gravés en 7 nm par TSMC, cette puce au design “chiplet” utilise la technologie de packaging 2.5D CoWoS du fondeur : elle regroupe ainsi dans un même puce les unités de calcul, 300 Mo de mémoire cache embarquée et 64 Go de mémoire HBM2e. Son interface Compute Express Link (CXL) autorise des échanges à 2,4 To/s avec le reste du système. Côté performances, Biren annonce que le BR100 atteint 2048 TOPS en INT8, 1024 TFLOPs en BF16 (BFLOAT16), 512 TFLOPs en TF32+ (Tensor Float 32) et 256 TFLOPs en FP32. C’est donc effectivement mieux que l’A100 de NVIDIA qui culmine à 1248 TOPs en INT8, 624 TFLOPs en BF16, 312 TFLOPs en TF32 ou encore… 19,5 TFLOPs en FP32 !

Biren BR100 BR104
Crédit : Biren

Biren en profite pour présenter également le BR104, un GPGPU basé sur la même architecture mais doté cette fois-ci d’un design monolithique. Moins complexe et n’embarquant que 150 Mo de cache et 32 Go de mémoire HBM2e, cette puce affiche logiquement des performances deux fois plus faibles que la BR100 : 1024 TOPS en INT8, 512 TFLOPs en BF16, 256 TFLOPs en TF32+ et 128 TFLOPs en FP32. Le TDP est annoncé à 300W, pour une bande passante avec le reste du système culminant à 1,14 To/s.

Biren BR100 BR104
Crédit : Biren

Le BR100 est proposé au format OAM (Open Accelerator Module) et un système de refroidissement personnalisé, tandis que le BR104 sera proposé sous la forme d’une carte d’extension classique PCI-Express. Le prix ainsi que la date de disponibilité de ces deux produits ne sont pas encore connus.

Source : EETrend