Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

IA : Google présente Trillium, ses TPU de 6e génération

T là ou TPU là ?

Les Tensor Processing Unit sont des puces développées par Google pour l’intelligence artificielle, de l’entraînement à l’inférence. La société vient d’annoncer sa sixième génération, qu’elle présente comme 4,7x plus performante que la génération précédente.

Hier, lors de la keynote d‘ouverture de la conférence I/O, Google a tiré tous azimuts sur l’intelligence artificielle (nous y reviendrons). La société s’en amuse elle-même avec un décompte officiel : durant son discours, Sundar Pichai y a fait référence pas moins de 121 fois, c’est du moins le décompte fait par… une IA.

Mais pour utiliser des intelligences artificielles, il faut des machines capables de les entrainer et de les faire tourner. Si NVIDIA et ses GPU règnent en maitres sur le haut du panier dans le monde des datacenters, de nombreuses autres sociétés développent leurs propres puces. C’est le cas de Google avec ses Tensor Processing Unit (TPU). Il s’agit d’ASIC (circuits intégrés spécifiques aux applications) conçus « pour accélérer les charges de travail de machine learning ».

TPU v6 : 4,7x plus performantes que les v5e

La sixième génération a été annoncée hier. Elle devrait logiquement s’appeler TPU v6, mais Google n’utilise pas cette appellation dans son communiqué. L’entreprise se contente d’un nom de code : Trillium. Comme nous l’avions déjà détaillé, la précédente génération comportait deux versions : v5e et v5p. Les premières visent le meilleur rapport performances/prix, tandis que les secondes (lancées plus tard) misent tout sur les performances.

Bien évidemment, Google compare sa sixième génération de TPU aux v5e, pas aux V5p. Il est ainsi question d’un maximum de « 4,7 fois plus » de performances par puce, sans savoir à quoi cela correspond exactement.

Si on se base sur les 197 TFLOP du v5e en blfoat16, on arriverait à un maximum théorique de 926 TFLOP, soit deux fois plus que les performances du v5p. Mais le 4.7x pourrait aussi renvoyer à un cas particulier, impossible donc en l’état d’en savoir plus.

Quoi qu’il en soit, pour arriver à cette hausse des performances, Google explique avoir augmenté la taille de ses unités de multiplication matricielle (MXU) et la fréquence d’horloge de sa puce, sans préciser dans quelles mesures.

Bande passante HBM et ICI doublée

Google annonce aussi avoir « doublé la capacité et la bande passante de la mémoire HBM, ainsi que la bande passante Interchip Interconnect (ICI) par rapport au TPU v5e ». On passerait ainsi à 1 638 Go/s sur la mémoire (en prenant 819 Go/s pour le v5e) , ce qui reste en dessous des 2 765 Go/s du v5p.

La bande passante de l’ICI est de 1 600 Gb/s sur v5e, on doit donc arriver à 3 200 Gb/s sur Trillium (TPU v6), contre 4 800 Gb/s sur v5p.

Pour en terminer avec les chiffres, Google affirme que son TPU Trillium est « plus de 67 % plus économe en énergie que le v5e ». Mais comme l’entreprise ne donne pas de chiffre sur la consommation, impossible d’en savoir plus.

« Trillium est équipé de la troisième génération de SparseCore », un accélérateur permettant « d’accélérer l’intégration de charges de travail lourdes ». Google affirme que ses TPU Trillium « permettent de former plus rapidement la prochaine vague de modèles et de servir les modèles avec une latence réduite et un coût moindre ». Une phrase que l’on peut ressortir à chaque nouvelle génération.

Jusqu’à 256 TPU Trillium par pod

Ces TPU de la génération Trillium peuvent être assemblée par paquet de 256 pour former un pod, exactement comme les v5e. Les v5p peuvent s’agglutiner par paquet de 8 960 pour rappel, contre 4 096 pour les v4 et 1 024 pour les v3. Des centaines de pods peuvent s’interconnecter pour former un système capable de délivrer plusieurs péta-opérations par seconde.

Sundar Pichai a indiqué durant la conférence que Trillium sera disponible pour les clients d’ici à la fin de l’année, tout comme le CPU maison Axion d’ailleurs. Il faudra attendre début 2025 pour les GPU Blackwell de NVIDIA.

IA : Google présente Trillium, ses TPU de 6e génération

T là ou TPU là ?

Les Tensor Processing Unit sont des puces développées par Google pour l’intelligence artificielle, de l’entraînement à l’inférence. La société vient d’annoncer sa sixième génération, qu’elle présente comme 4,7x plus performante que la génération précédente.

Hier, lors de la keynote d‘ouverture de la conférence I/O, Google a tiré tous azimuts sur l’intelligence artificielle (nous y reviendrons). La société s’en amuse elle-même avec un décompte officiel : durant son discours, Sundar Pichai y a fait référence pas moins de 121 fois, c’est du moins le décompte fait par… une IA.

Mais pour utiliser des intelligences artificielles, il faut des machines capables de les entrainer et de les faire tourner. Si NVIDIA et ses GPU règnent en maitres sur le haut du panier dans le monde des datacenters, de nombreuses autres sociétés développent leurs propres puces. C’est le cas de Google avec ses Tensor Processing Unit (TPU). Il s’agit d’ASIC (circuits intégrés spécifiques aux applications) conçus « pour accélérer les charges de travail de machine learning ».

TPU v6 : 4,7x plus performantes que les v5e

La sixième génération a été annoncée hier. Elle devrait logiquement s’appeler TPU v6, mais Google n’utilise pas cette appellation dans son communiqué. L’entreprise se contente d’un nom de code : Trillium. Comme nous l’avions déjà détaillé, la précédente génération comportait deux versions : v5e et v5p. Les premières visent le meilleur rapport performances/prix, tandis que les secondes (lancées plus tard) misent tout sur les performances.

Bien évidemment, Google compare sa sixième génération de TPU aux v5e, pas aux V5p. Il est ainsi question d’un maximum de « 4,7 fois plus » de performances par puce, sans savoir à quoi cela correspond exactement.

Si on se base sur les 197 TFLOP du v5e en blfoat16, on arriverait à un maximum théorique de 926 TFLOP, soit deux fois plus que les performances du v5p. Mais le 4.7x pourrait aussi renvoyer à un cas particulier, impossible donc en l’état d’en savoir plus.

Quoi qu’il en soit, pour arriver à cette hausse des performances, Google explique avoir augmenté la taille de ses unités de multiplication matricielle (MXU) et la fréquence d’horloge de sa puce, sans préciser dans quelles mesures.

Bande passante HBM et ICI doublée

Google annonce aussi avoir « doublé la capacité et la bande passante de la mémoire HBM, ainsi que la bande passante Interchip Interconnect (ICI) par rapport au TPU v5e ». On passerait ainsi à 1 638 Go/s sur la mémoire (en prenant 819 Go/s pour le v5e) , ce qui reste en dessous des 2 765 Go/s du v5p.

La bande passante de l’ICI est de 1 600 Gb/s sur v5e, on doit donc arriver à 3 200 Gb/s sur Trillium (TPU v6), contre 4 800 Gb/s sur v5p.

Pour en terminer avec les chiffres, Google affirme que son TPU Trillium est « plus de 67 % plus économe en énergie que le v5e ». Mais comme l’entreprise ne donne pas de chiffre sur la consommation, impossible d’en savoir plus.

« Trillium est équipé de la troisième génération de SparseCore », un accélérateur permettant « d’accélérer l’intégration de charges de travail lourdes ». Google affirme que ses TPU Trillium « permettent de former plus rapidement la prochaine vague de modèles et de servir les modèles avec une latence réduite et un coût moindre ». Une phrase que l’on peut ressortir à chaque nouvelle génération.

Jusqu’à 256 TPU Trillium par pod

Ces TPU de la génération Trillium peuvent être assemblée par paquet de 256 pour former un pod, exactement comme les v5e. Les v5p peuvent s’agglutiner par paquet de 8 960 pour rappel, contre 4 096 pour les v4 et 1 024 pour les v3. Des centaines de pods peuvent s’interconnecter pour former un système capable de délivrer plusieurs péta-opérations par seconde.

Sundar Pichai a indiqué durant la conférence que Trillium sera disponible pour les clients d’ici à la fin de l’année, tout comme le CPU maison Axion d’ailleurs. Il faudra attendre début 2025 pour les GPU Blackwell de NVIDIA.

Bientôt des SOC MediaTek avec un iGPU NVIDIA ?

Si NVIDIA rencontre du succès dans de nombreux domaines, celui des consoles n'est plus le cas depuis quelques temps. NVIDIA a perdu Sony avec la PS4, qui a rejoint Microsoft dans le giron d'AMD, et Nintendo utilise désormais un SoC Tegra vieillissant pour la Switch. Et c'est bien ce qui semble déranger NVIDIA, alors même qu'AMD commence à faire son bonhomme dans un nouveau domaine : celui des consoles portables en x86. Les rouges travaillant également avec Samsung et potentiellement Qualcomm, c'est vrai MediaTek que les verts souhaiteraient se tourner pour s'attaquer au marché des consoles portables, en ARM. […]

Lire la suite

Palit présente des RTX 4060 Ti et RTX 4070 White

Palit dévoile de nouvelles cartes graphiques, les RTX 4060 Ti et RTX 4070 White, vous l'aurez compris, l'une des particularités réside dans la teinte du carénage, des ventilateurs et de la backplate. Tous ces éléments sont blancs, seul le PCB demeure noir, l'harmonie n'est donc pas totale ! Les deux cartes partagent des dimensions communes, 269.1 x 127 x 40.1 mm, pour une occupation double slots. Elles requièrent un connecteur 8-pin, proposent des sorties vidéo HDMI 2.1a et DP1.4a (x3). […]

Lire la suite

Des ventilateurs et kits AIO avec du pixel art animé chez Aigo

Récemment, Aigo a lancé de nouveaux produits dans sa gamme AIYOUNGO, dont de nouveaux boitiers avec une vue à 270 ° pour les composants. Un style qui se généralise de plus en plus, mais ce n'est finalement pas le point le plus important : la marque chinoise a également de nouveaux kits AIO à son catalogue, avec un style tout à fait unique. Dénommée Matrix Cube, après traduction, cette série se distingue par le top de l'ensemble pompe / waterblock qui embarque un éclairage sous forme de pixels, à l'image de la façade du très sympathique InWin 309. Avec bien entendu la possibilité d'animer les pixels pour se faire une machine vraiment unique ! […]

Lire la suite

Test intras Kiwi Ears Cadenza : Simple et efficace !

Zoup, ce matin on se penche sur une paire d'intras pour nos petites oreilles avec les Cadenza de la marque Kiwi Ears. Des modèles qui se branchent en jack 3.5 mm et qui exploite des petits HP de 10 mm. À 40 euros l'exemplaire, bien ou bien ? Réponse ici même : Test intras Kiwi Ears Cadenza ou alors sur la source. […]

Lire la suite

Google Will Use Gemini To Detect Scams During Calls

At Google I/O on Tuesday, Google previewed a feature that will alert users to potential scams during a phone call. TechCrunch reports: The feature, which will be built into a future version of Android, uses Gemini Nano, the smallest version of Google's generative AI offering, which can be run entirely on-device. The system effectively listens for "conversation patterns commonly associated with scams" in real time. Google gives the example of someone pretending to be a "bank representative." Common scammer tactics like password requests and gift cards will also trigger the system. These are all pretty well understood to be ways of extracting your money from you, but plenty of people in the world are still vulnerable to these sorts of scams. Once set off, it will pop up a notification that the user may be falling prey to unsavory characters. No specific release date has been set for the feature. Like many of these things, Google is previewing how much Gemini Nano will be able to do down the road sometime. We do know, however, that the feature will be opt-in.

Read more of this story at Slashdot.

Qualcomm annonce une compatibilité Linux de ses puces ARM

Minimachines.net en partenariat avec TopAchat.com

Jusqu’ici les puces ARM dédiées au monde PC sous Windows n’avaient pas l’ombre d’un début de support Linux. Un point noir pour de nombreux utilisateurs puisqu’après quelques années de bons et loyaux services sous Windows, certains voulaient basculer sous d’autres systèmes.

Quand Microsoft crée un goulet d’étranglement avec Windows, par exemple en créant des limitations liées au matériel pour installer la version 11 tout en indiquant la fin du support de la version 10, le recours habituel des utilisateurs est de basculer leur machine sous une distribution Linux. Des millions de PC sous processeurs x86 Intel ou AMD livrés sous Windows XP ou d’autres versions plus récentes fonctionnent ainsi toujours grâce à des distributions logicielles libres, gratuites et parfaitement maintenues question sécurité.

Mais pour toutes les machines vendues jusqu’ici avec des solutions ARM, les pilotes Linux n’étaient pas disponibles. Rendant le portages au mieux hasardeux, au pire impossibles. Et c’est assez logique, du moins chez Qualcomm. Son association avec Microsoft jusqu’en 2023 rendait les entreprises très liées. Microsoft s’était engagé a ne porter Windows sur ARM que pour ses puces. Et de son côté Qualcomm restait enfermé chez Microsoft.

Qualcomm annonce donc qu’avec la fin de son partenariat d’exclusivité, les puces Snapdragon X Elite vont s’ouvrir au monde Linux. Un support natif de différentes distributions sera assuré. Mieux encore, Qualcomm assure que ses puces seront compatibles avec un démarrage UEFI standard ce qui autorisera des utilisation s très classiques sans avoir a se casser la tête pour le contourner. Les pilotes des différents composants du SoC seront proposés : prise en charge de la partie audio et vidéo bien sûr mais également des éléments de stockage avec tous les raffinements du NVMe, la gestion fine des batteries et des réseaux filaires et sans fil. L’accélération vidéo dans chrome ou Firefox sera disponible et les fonctionnalités des cameras serot également prise en charge. 

Les utilisateurs pourront utiliser le système de boot Grub pour choisir quel système démarrer et donc avoir la possibilité de piloter un Windows et un Linux sur le même PC ARM. Une image expérimentale de Debian est d’ores et déjà disponible au téléchargement.

Ce projet de rendre les puces ARM complètement compatibles avec Linux est un vrai bon point pour Qualcomm. A terme cela ouvrira la porte au portage de tout système Linux vraiment facile. La portabilité se fera en deux temps avec une part des éléments pris en compte dans le noyau 6.10 de Linux et une autre dans le 6.11. Qualcomm indique que d’ici 2025 des processus d’installation grand public seront disponibles pour les PC sous Snapdragon X Elite.

C’est une excellente nouvelle qui va déverrouiller ces machines qui jusque là se comportaient plus comme des coffre forts que comme des PC classiques. La possibilité de choisir son système est une condition de base pour de nombreux utilisateurs avant de considérer ces engins à l’achat. Et cela même si pour le moment on reste toujours dans l’expectative des performances réelles de ces fameux nouveaux Snapdragon.

Qualcomm annonce une compatibilité Linux de ses puces ARM © MiniMachines.net. 2024.

Stack Overflow face à une révolte contre son accord avec OpenAI

La pile de données

Après la signature du contrat avec OpenAI permettant à l’entreprise d’entrainer ses grands modèles de langage sur les contenus publiés sur son site, Stack Overflow fait face à des utilisateurs mécontents qui ont essayé de supprimer leurs anciens posts. Le site a bloqué toutes les possibilités de retirer le contenu qu’il héberge.

En début de semaine dernière, Stack Overflow a annoncé la signature d’un contrat avec OpenAI. Mais depuis et comme l’a repéré The Verge, une partie de la communauté du site est en colère, certains utilisateurs s’opposent à ce que les questions et réponses qu’ils ont rédigées pendant des années soient vendues et utilisées pour alimenter l’entrainement des modèles d’OpenAI.

Ainsi, comme il l’explique sur son compte Mastodon, l’utilisateur benui a essayé en début de semaine dernière de supprimer ses réponses les mieux notées. Mais il s’est rendu compte que ce n’était pas possible, car Stack Overflow ne permet pas de supprimer des réponses acceptées considérant qu’elles participent à la connaissance bâtie par la communauté de ses utilisateurs.

Benui a finalement décidé de modifier ses réponses en les remplaçant par un message critiquant l’accord avec OpenAI. Mais il explique qu’une heure après, des modérateurs avaient remis la réponse initiale et suspendu son compte pour 7 jours.

Questions et réponses sous licence Creative Commons BY-SA

Depuis, d’autres utilisateurs ont aussi témoigné de cette impossibilité de manifester son refus de l’utilisation de son contenu dans le cadre de l’accord entre Stack Overflow et OpenAI.

Les conditions générales du site expliquent que « vous ne pouvez pas révoquer l’autorisation donnée à Stack Overflow de publier, distribuer, stocker et utiliser ce contenu et de permettre à d’autres personnes d’avoir des droits dérivés pour publier, distribuer, stocker et utiliser ce contenu ».

Le site impose aussi à tous ses utilisateurs de la licence Creative Commons 4.0 BY-SA qui est la licence la plus permissive. Cette licence, utilisée aussi par Wikipédia, permet à n’importe qui, dans n’importe quel but, même commercial, de réutiliser le contenu.

Rappelons aussi qu’il existe déjà depuis quelques années un outil permettant de télécharger l’intégralité de Stack Overflow. Ce projet a été mis en place en collaboration avec le français Kiwix et récupère (« scrap ») les questions/réponses du site pour créer des versions « hors ligne ».

Même sans les accords commerciaux de Stack Overflow, des entreprises peuvent se servir d’une version hors ligne comportant toutes les questions/réponses en licence Creative Commons BY-SA pour entrainer leurs modèles.

Des utilisateurs qui se sentent trahis

Mais Christian Hujer, utilisateur du site, explique sous l’annonce de Stack Overflow que le problème pour lui va au-delà des aspects légaux : « je me sens bafoué, trompé, trahi et exploité ». Lui aussi ajoute qu’il va supprimer son compte, même s’il sait que ses questions et réponses ne seront pas supprimées avec.

Cette fronde des utilisateurs de Stack Overflow n’est pas sans rappeler celle qu’a connue Reddit l’année dernière contre le passage de son API en payant. Le réseau social a finalement réussi à « normaliser » la situation après des mois de remous au sein de sa communauté. On ne sait pas si le mouvement de protestation de la communauté de Stack Overflow va suivre cette voie et à quelle vitesse, mais ce genre d’accords risque de freiner les utilisateurs à participer à la vie de plateformes de ce genre.

Quelles traces relient Dmitry Khoroshev au rançongiciel LockBit ?

Pinned

Accusé d’être le développeur et administrateur du rançongiciel LockBit, le Russe de 31 ans avait laissé de nombreuses traces révélant qu’il avait commencé à développer des logiciels malveillants dès l’âge de 18 ans, avant de se spécialiser dans les ransomwares sophistiqués codés en C et C++.

Les autorités britanniques et états-uniennes, pas plus qu’Europol, n’ont pas expliqué comment elles étaient arrivées à identifier Dmitry Yuryevich Khoroshev comme le principal développeur et administrateur du rançongiciel LockBit.

Pour autant, relève le journaliste Brian Krebs, connu pour documenter la cybercriminalité, le département du Trésor lui a associé deux adresses e-mail, un portefeuille Bitcoin, deux numéros de passeport russe, sa date de naissance (17 avril 1993) et même son numéro d’identification fiscale.

Poster US proposant une récompense de 10M$ pour toute information sur LockBitSupp

Une recherche dans la base de données de Constella (un « data lake » de 1 trillion – soit un million de millions, ou 1 000 000 000 000 – d’actifs compromis) permet par ailleurs de découvrir de nombreux documents officiels du gouvernement russe liés à Dmitri Yurievich Khoroshev. On y trouve aussi deux adresses email ayant fait de la publicité pour la vente d’escaliers en bois (webmaster@stairwell.ru et admin@stairwell.ru), qui utilisaient le même mot de passe : 225948.

DomainTools indique que le site stairwell.ru a été rattaché pendant plusieurs années à un certain « Dmitrij Ju Horoshev » et à l’adresse électronique pin@darktower.su. Selon Constella, cette dernière a été utilisée en 2010 par un certain Dmitry Yurievich Khoroshev de Voronezh, en Russie, pour enregistrer un compte chez le fournisseur d’hébergement firstvds.ru.

De Khoroshev à Pin puis NeroWolfe


Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

Test Kiwi Ears Cadenza : des intras simples et efficaces

On teste aujourd’hui les petits Cadenza de la marque Kiwi Ears, une marque à la notoriété vraisemblablement grandissante auprès des communautés avides de bons plans en termes d’audio, notamment et justement au sujet des casques IEMs (In-Ear Monitors, casques intra-auriculaires). Le Cadenza s’est notamment fait connaître pour son prix relativement ridicule : comptez une quarantaine d’euros pour vous les offrir. Bref, Voici sur notre avis sur les Kiwi Ears Cadenza, prêtés par Linsoul.

DIABLO IV inaugure sa saison 4

Diablo® IV s'est aventuré loin du royaume que vous avez arpenté la dernière fois. Retournez à Sanctuaire dès maintenant pour jouer à la saison 4 : Butin redynamisé et découvrir les changements apportés aux royaumes éternels et saisonniers dans la plus importante mise à jour depuis le lancement du jeu ! Galvanisez vos forces grâce aux changements permanents apportés aux systèmes d'objets, aux taux d'apparition plus élevés, au niveau de personnalisation accru des objets et plus encore. Bénéficiez d'une nouvelle expérience de progression en jeu grâce aux vagues infernales redynamisées, désormais disponibles dans tous les niveaux de monde et dotées d'une puissante boss inédite et de légions de nouveaux adversaires. Étoffez votre expérience de haut niveau avec le nouveau défi hebdomadaire, la fosse aux artifices, et découvrez des façons de jouer plus gratifiantes grâce aux modifications supplémentaires apportées au codex de puissance, aux affixes supérieurs et aux boss uniques. Ne manquez pas l'activité saisonnière des Loups de fer et le nouveau périple saisonnier, qui débordent de récompenses saisonnières dignes des Enfers que vous pourrez obtenir en jouant, dont 20 cendres fumantes, 5 ornements d'arme, 1 ensemble de tenue par classe, 1 portail de retour en ville, 1 trophée de monture et 1 titre. […]

Lire la suite

Et si NVIDIA présentait sa GeForce RTX 5090 au Computex 2024 ???

C'est donc la toute nouvelle rumeur folle qui court sur l'immense toile du net dans les milieux très informés du hardware, NVIDIA, ou plutôt l'homme au blouson noir, à savoir Jensen Huang pourrait présenter la GeForce RTX 5090 au prochain Computex. Dans les faits, cela est possible, tout d'abord, car Jensen tiendra une conférence de presse à Taipei le 2 juin prochain à 19 h 00. Ensuite, NVIDIA se doit d'être présent face à la concurrence et on sait que de nombreuses annonces seront faites au Computex 2024, notamment chez Intel et chez AMD. […]

Lire la suite
❌