NVIDIA annonce ses méga GPUs B200 et GB200 dédiés à l'IA
À l'occasion dela GDC 2024, NVIDIA a officialisé ses GPUs B200 et GB200, dédiés à l'Intelligence Artificelle et dire qu'il s'agit de monstres de puissances est un doux euphémisme ! Les chiffres donnent le tournis, ne perdons pas de vue qu'il s'agit de puces spécifiques, très lointaines de nos GPUs personnels, le B200 a une conception de type MCM (multi-chip-module) et embarque donc deux dies, chaque die est composé de 104 milliards de transistors, grâce à la gravure TSMC N4P (4 nm), l'interconnexion prévue promet une bande passante de 10 To/s ! Chaque die dispose d'une interface mémoire de 4096 bits vers 96 Go de mémoire HBM3E (la bande passante maximale est de 8 To/s), soit un total de 192 Go pour la puce complète B200, NVIDIA a prévu une interface NVLink de 1,8 To/s pour la connectivité hôte ou la connectivité avec une autre puce B200. […]
Lire la suite