Vue lecture

À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative

Le peuple réclame les PetaFLOPS !!!
À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative

OpenAI présente sa première puce dédiée à l’inférence, développée avec Broadcom. L’entreprise affirme que les premiers tests se passent bien, mais ne donne aucun chiffre précis sur les performances, la consommation, etc. La photo d’un wafer permet de se lancer dans quelques analyses.

En octobre, nous apprenions qu’OpenAI et Broadcom travaillaient main dans la main pour développer des puces dédiées à l’intelligence artificielle. Contrairement aux GPU généralistes, il est ici question d’ASIC spécialisées.

Des algos à la puce, OpenAI passe en mode « full stack »

Ce n’est pas la première société à venir jouer sur les plates-bandes de NVIDIA. Google est déjà à sa huitième génération de TPU, Amazon et Microsoft sont aussi sur les rangs. C’est donc au tour d’OpenAI de se lancer. L’entreprise connait bien le sujet des IA génératives et de leurs besoins en calculs puisqu’elle était la première à se lancer avec ChatGPT (désormais en version 5.5).

Elle s’appuie sur la connaissance des LLM et de leurs besoins (passés, actuels et à venir) pour développer les fonctionnalités matérielles nécessaires. OpenAI se présente ainsi comme « full stack ». Sur la partie matérielle, le responsable d’OpenAI (Richard Ho) est un ancien de Google qui a passé plus de huit ans sur les TPU, il connait donc bien le sujet. Pour OpenAI, l’enjeu est double : se détacher de NVIDIA et de ses GPU, mais aussi avoir des puces plus spécialisées et optimisées afin de réduire la consommation (et donc le coût énergétique).

OpenAI affirme que sa « première génération d’accélérateurs offrira des performances par watt nettement supérieures à celles des accélérateurs de pointe actuels ». Sa puce a été « conçue dès le départ pour répondre aux besoins actuels et futurs des LLM », ceux d’OpenAI mais aussi les autres. Attention, cela ne veut pas dire que tout le monde pourra en profiter ; selon Reuters, les puces d’OpenAI seraient utilisées uniquement par OpenAI. Est-ce que ce sera une exclusivité totale, ou bien des puces seront-elles mises à disposition dans ses datacenters (comme le fait Google avec ses TPU) ? À voir…

OpenAI affirme que de premiers échantillons (samples) de Jalapeño « exécutent des charges de travail en machine learning en laboratoire à la fréquence et à la puissance prévues pendant la phase de production, y compris GPT‑5.3‑Codex‑Spark ». Aucun détail toutefois sur les performances ni sur les caractéristiques techniques.

On ne parle pour le moment que d’inférence, c’est-à-dire quand le modèle répond ; pas de la phase d’entrainement qui précède.

Caractéristiques techniques et performances ? Circulez, il n’y a rien à voir…

Il faut se contenter de promesses floues : « Bien qu’OpenAI mesure encore la performance finale, les premiers tests montrent que Jalapeño offrira des performances par watt nettement supérieures à l’état de l’art actuel ». Un rapport technique sera publié dans les prochains mois.

Hock Tan, président et CEO (équivalent de PDG) de Broadcom affirme qu’en « co-développant directement avec OpenAI notre puce de pointe, nous permettons le déploiement de centres de données à l’échelle du GW avec Microsoft et d’autres partenaires dès 2026 ».

Niveau partenariat, OpenAI cite également Broadcom sur la partie réseau avec son Tomahawk, dont la version 6 (102,4 Tb/s de bande passante totale) peut atteindre 1,6 Tb/s en Ethernet, 128 x 800 GbE, 256 x 400 GbE ou 512 x 200 GbE. C’est le double de la version 5, mais toujours sans savoir quelle version est utilisée.

Celestica est aussi cité comme partenaire, afin de « contribuer à l’industrialisation de la plateforme grâce à l’intégration de puces, de cartes, de baies, de réseaux haute performance et de systèmes de production évolutifs », précise OpenAI.

Maintenant que les présentations officielles sont faites, passons à la partie technique. Peu de données sont indiquées, mais la photo du wafer et de la puce d’OpenAI permet de se lancer dans quelques déductions et prospections.

Ce que nous apprend la photo officielle du wafer


Il reste 43% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

Tour d’horizon des forfaits fibre jusqu’à 8 Gb/s à moins de 30 €, sans engagement

Combat de BOFS
Tour d’horizon des forfaits fibre jusqu’à 8 Gb/s à moins de 30 €, sans engagement

Et de quatre augmentations… Lancée à 23,99 euros par mois, B&You Pure fibre Plus est désormais à 27,99 euros par mois. Nous avons décidé de refaire un tour des offres sans TV ni engagement à moins de 30 euros par mois avec RED by SFR, Sosh (Orange) et Free aux côtés de Bouygues Telecom. De quoi trouver l’offre qui vous conviendrait le mieux.

En novembre 2024, Bouygues Telecom mettait un coup de pied dans la fourmilière des offres fibres d’entrée de gamme avec son forfait Pure fibre à 23,99 euros par mois, sans engagement. Pour ce prix, de la fibre jusqu’à 8 Gb/s, et rien que de la fibre (pas de box TV, d’appels…).

Pure Fibre Plus : 23,99, 24,99, 25,99 et maintenant 27,99 euros par mois

En février, Bouygues Telecom « scindait » son offre en deux avec Pure Fibre à 2 Gb/s maximum (900 Mb/s en upload) et Pure Fibre Plus jusqu’à 8 Gb/s (1 Gb/s en upload), pour respectivement 24,99 et 25,99 euros par mois.

Lors du lancement, le fournisseur d’accès expliquait que les 8 Gb/s étaient disponibles via l’option « Débit + gratuite sur demande, sous réserve d’éligibilité et d’équipement compatible ». Plus qu’une segmentation, c’était la fin de la gratuité pour cette option.

Depuis, l’offre a augmenté à plusieurs reprises pour désormais arriver aujourd’hui à 27,99 euros par mois pour Pure fibre Plus (avec un débit théorique jusqu’à 8 Gb/s). L’offre Pure fibre (jusqu’à 2 Gb/s) est toujours à 24,99 euros par mois. Toutes les deux sont toujours sans engagement.

Qu’en est-il de la concurrence ? Nous avons fait un rapide tour d’horizon avec RED by SFR, Sosh (Orange) et Free avec sa Freebox Pop S. Point commun : pas d’engagement, un tarif de moins de 30 euros par mois (y compris au-delà de la première année) et pas de box TV.

B&You, RED (SFR), Sosh (Orange) et Free : notre tableau comparatif


Il reste 75% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

  •  

Top500 des supercalculateurs : la Chine reprend la tête, cinq machines exaflopiques

C’est l’édition six-seven (oui, j’ai honte)
Top500 des supercalculateurs : la Chine reprend la tête, cinq machines exaflopiques

Le Top500 permet de classer les machines les plus puissantes au monde. Elles doivent lancer des benchmarks et les envoyer pour être prises en compte. Un nouvel entrant arrive directement en première place (sans que ce soit une surprise) : LineShine, un supercalculateur chinois, sans GPU.

Le classement du Top500 se met à jour deux fois par an, en juin et novembre. La 67ᵉ édition vient d’être mise en ligne et, « pour la première fois depuis 2017, un système chinois domine le Top500 ». C’est un peu plus complexe, car depuis des années la Chine était aux abonnés absents. Selon plusieurs spécialistes, le pays resterait discret pour éviter que les États-Unis n’en profitent pour durcir les restrictions.

La Chine n’a que 31 machines dans le Top 500, mais écrase la concurrence

Jack Dongarra, cofondateur de Top500, expliquait durant l’été 2024 que « les Chinois ont des machines plus rapides, mais ils n’ont pas communiqué leurs résultats ». En juin 2020, 226 supercalculateurs chinois étaient présents dans le classement, contre 80 en juin 2024. Cette année, seules 31 machines sont dans le Top500.

Le Top 3 des pays comprend les États-Unis avec 161 supercalculateurs, le Japon avec 44 et l’Allemagne avec 41. La France est cinquième avec 21 machines, juste derrière la Chine qui occupe la quatrième place. Avec seulement 31 machines référencées, la Chine est tout de même 2ᵉ en puissance cumulée. C’est grâce à son supercalculateur LineShine, qui dépasse à lui seul le total des autres pays, sauf les États-Unis.

LineShine, nous en avions parlé en avril, quand le supercalculateur était apparu dans une publication scientifique. Elle n’était pas axée sur la machine, mais elle était utilisée pour entrainer un MLIP (Machine Learning Interatomic Potentials), avec des détails sur ses performances.

La barrière des 2 ExaFLOPS dépassée pour la première fois

La Chine a depuis décidé de transmettre les résultats de ses benchmarks au Top500 et elle prend donc la première place, avec une solide avance. Sur la base des données partielles de l’époque, nous avions estimé la puissance de calcul à 2,47 ExaFLOPS, nous n’étions pas loin.

LineShine est, quoi qu’il en soit, le premier supercalculateur à dépasser les 2 ExaFLOPS avec 2,198 ExaFLOPS pour être précis. Les États-Unis se bousculent derrière avec El Capitan à 1,809 ExaFLOPS, Frontier à 1,353 ExaFLOPS et enfin Aurora à 1,012 ExaFLOPS. L’Europe dispose d’une des cinq machines exaflopiques de ce classement avec JUPITER au centre de supercalcul de Jülich en Allemagne. Elle affiche une puissance de calcul de 1 ExaFLOPS tout juste.

Pas de GPU, c’est confirmé par le Top500

LineShine dispose de plus de 13,7 millions de cœurs CPU, des LX2 304C à 1,55 GHz dont nous avons déjà parlé. Le Top500 confirme l’absence de GPU : « Sur le benchmark HPL-MxP en précision mixte, LineShine a atteint 7,92 ExaFLOPS et se classe 4ᵉ. Un rapport de 3,6x modeste par rapport à son score HPL, qui indique une architecture exclusivement CPU, dépourvue d’accélérateurs dédiés à la basse précision ».

Les autres utilisent les GPU pour augmenter les performances en précision mixte. Sur le benchmark HPL-MxP (précision mixte), la première place revient à El Capitan avec 16,7 ExaFLOPS, soit un ratio de 9,2x par rapport à son score HPL. Aurora est deuxième avec 11,6 ExaFLOPS (ratio de 11,5x) et Frontière troisième avec 11,4 ExaFLOPS (ratio de 8,4x). LineShine n’est que quatrième avec 7,92 ExaFLOPS et un ratio de 3,6x, bien inférieur aux autres.

Le Top 10 a un autre nouvel entrant : HPC6, un supercalculateur HPE Cray EX235a avec plus de 3,1 millions de cœurs AMD EPYC de 3ᵉ génération et des Instinct MI250X en GPU. Sa puissance est de 0,6 ExaFLOPS. Il appartient à la société italienne Eni.

Le vénérable Fugaku qui avait pris la tête du classement en juin 2020 avec ses cœurs ARM est désormais en 9ᵉ position.

Green500 : la France toujours en tête, LineShine 50e

Terminons avec un mot sur le classement Green500, qui mesure les performances (sur le benchmark HPL) par watt d’énergie électrique consommée. La France est encore sur les deux premières places du podium avec KAIROS (CALMIP / Université de Toulouse – CNRS) et ROMEO-2025 (Centre HPC Bull). Les machines sont respectivement 445e et 192e au Top 500, mais la « faible » puissance électrique leur permet d’être en tête du Green500.

La France est également à la 9ᵉ place avec AMD Ouranos, tandis que l’Europe occupe bien le terrain avec neuf machines sur dix (si on compte Isambard-AI phase 1 au Royaume-Uni). Les États-Unis sont 10e avec Portage.

LineShine est 50ᵉ du Green500 avec une efficacité de 52,1 GigaFLOPS/watt, contre plus de 73 GigaFLOPS/watt pour KAIROS en tête de classement. El Capitan fait mieux avec la 28ᵉ place (60,9 GigaFLOPS/watt), Aurora 102ᵉ avec 26,1 GigaFLOPS/watt et enfin JUPITER 17ᵉ avec 63,3 GigaFLOPS/watt.

  •  

Top500 des supercalculateurs : la Chine reprend la tête, cinq machines exaflopiques

C’est l’édition six-seven (oui, j’ai honte)
Top500 des supercalculateurs : la Chine reprend la tête, cinq machines exaflopiques

Le Top500 permet de classer les machines les plus puissantes au monde. Elles doivent lancer des benchmarks et les envoyer pour être prises en compte. Un nouvel entrant arrive directement en première place (sans que ce soit une surprise) : LineShine, un supercalculateur chinois, sans GPU.

Le classement du Top500 se met à jour deux fois par an, en juin et novembre. La 67ᵉ édition vient d’être mise en ligne et, « pour la première fois depuis 2017, un système chinois domine le Top500 ». C’est un peu plus complexe, car depuis des années la Chine était aux abonnés absents. Selon plusieurs spécialistes, le pays resterait discret pour éviter que les États-Unis n’en profitent pour durcir les restrictions.

La Chine n’a que 31 machines dans le Top 500, mais écrase la concurrence

Jack Dongarra, cofondateur de Top500, expliquait durant l’été 2024 que « les Chinois ont des machines plus rapides, mais ils n’ont pas communiqué leurs résultats ». En juin 2020, 226 supercalculateurs chinois étaient présents dans le classement, contre 80 en juin 2024. Cette année, seules 31 machines sont dans le Top500.

Le Top 3 des pays comprend les États-Unis avec 161 supercalculateurs, le Japon avec 44 et l’Allemagne avec 41. La France est cinquième avec 21 machines, juste derrière la Chine qui occupe la quatrième place. Avec seulement 31 machines référencées, la Chine est tout de même 2ᵉ en puissance cumulée. C’est grâce à son supercalculateur LineShine, qui dépasse à lui seul le total des autres pays, sauf les États-Unis.

LineShine, nous en avions parlé en avril, quand le supercalculateur était apparu dans une publication scientifique. Elle n’était pas axée sur la machine, mais elle était utilisée pour entrainer un MLIP (Machine Learning Interatomic Potentials), avec des détails sur ses performances.

La barrière des 2 ExaFLOPS dépassée pour la première fois

La Chine a depuis décidé de transmettre les résultats de ses benchmarks au Top500 et elle prend donc la première place, avec une solide avance. Sur la base des données partielles de l’époque, nous avions estimé la puissance de calcul à 2,47 ExaFLOPS, nous n’étions pas loin.

LineShine est, quoi qu’il en soit, le premier supercalculateur à dépasser les 2 ExaFLOPS avec 2,198 ExaFLOPS pour être précis. Les États-Unis se bousculent derrière avec El Capitan à 1,809 ExaFLOPS, Frontier à 1,353 ExaFLOPS et enfin Aurora à 1,012 ExaFLOPS. L’Europe dispose d’une des cinq machines exaflopiques de ce classement avec JUPITER au centre de supercalcul de Jülich en Allemagne. Elle affiche une puissance de calcul de 1 ExaFLOPS tout juste.

Pas de GPU, c’est confirmé par le Top500

LineShine dispose de plus de 13,7 millions de cœurs CPU, des LX2 304C à 1,55 GHz dont nous avons déjà parlé. Le Top500 confirme l’absence de GPU : « Sur le benchmark HPL-MxP en précision mixte, LineShine a atteint 7,92 ExaFLOPS et se classe 4ᵉ. Un rapport de 3,6x modeste par rapport à son score HPL, qui indique une architecture exclusivement CPU, dépourvue d’accélérateurs dédiés à la basse précision ».

Les autres utilisent les GPU pour augmenter les performances en précision mixte. Sur le benchmark HPL-MxP (précision mixte), la première place revient à El Capitan avec 16,7 ExaFLOPS, soit un ratio de 9,2x par rapport à son score HPL. Aurora est deuxième avec 11,6 ExaFLOPS (ratio de 11,5x) et Frontière troisième avec 11,4 ExaFLOPS (ratio de 8,4x). LineShine n’est que quatrième avec 7,92 ExaFLOPS et un ratio de 3,6x, bien inférieur aux autres.

Le Top 10 a un autre nouvel entrant : HPC6, un supercalculateur HPE Cray EX235a avec plus de 3,1 millions de cœurs AMD EPYC de 3ᵉ génération et des Instinct MI250X en GPU. Sa puissance est de 0,6 ExaFLOPS. Il appartient à la société italienne Eni.

Le vénérable Fugaku qui avait pris la tête du classement en juin 2020 avec ses cœurs ARM est désormais en 9ᵉ position.

Green500 : la France toujours en tête, LineShine 50e

Terminons avec un mot sur le classement Green500, qui mesure les performances (sur le benchmark HPL) par watt d’énergie électrique consommée. La France est encore sur les deux premières places du podium avec KAIROS (CALMIP / Université de Toulouse – CNRS) et ROMEO-2025 (Centre HPC Bull). Les machines sont respectivement 445e et 192e au Top 500, mais la « faible » puissance électrique leur permet d’être en tête du Green500.

La France est également à la 9ᵉ place avec AMD Ouranos, tandis que l’Europe occupe bien le terrain avec neuf machines sur dix (si on compte Isambard-AI phase 1 au Royaume-Uni). Les États-Unis sont 10e avec Portage.

LineShine est 50ᵉ du Green500 avec une efficacité de 52,1 GigaFLOPS/watt, contre plus de 73 GigaFLOPS/watt pour KAIROS en tête de classement. El Capitan fait mieux avec la 28ᵉ place (60,9 GigaFLOPS/watt), Aurora 102ᵉ avec 26,1 GigaFLOPS/watt et enfin JUPITER 17ᵉ avec 63,3 GigaFLOPS/watt.

  •  
❌