Mistral lance sa nouvelle famille Mistral 3 et vante ses petits modèles

3 décembre 2025 à 12:58

Small si beautiful

Mistral lance sa nouvelle famille Mistral 3 et vante ses petits modèles

Après le lancement de nouvelles versions majeures chez pratiquement tous les acteurs de l’IA générative, Mistral dégaine sa famille de modèles ouverts Mistral 3. Bien que celle-ci comprenne un modèle multimodal, ce sont surtout les plus petits qui sont mis en avant.

L’entreprise française n’en démord pas : lancer des modèles géants n’est pas nécessairement ce qu’il y a de mieux pour les entreprises. Elle reste centrée sur sa stratégie de publication de modèles à poids ouvert, dans l’idée que le monde professionnel va s’en emparer, les personnaliser, les distiller ou les entrainer sur ses propres données.

Mistral veut régner sur les modèles ouverts

Dans l’annonce, on remarque tout de suite que les comparaisons se font uniquement avec d’autres modèles ouverts, comme DeepSeek (en version 3.1 ou 3.2 selon les cas, étrangement) ou Kimi-K2. Sans trop de surprises dans le cadre de ce type d’annonce, les modèles Mistral 3 arrivent premiers dans la plupart des benchmarks, toujours à prendre avec des pincettes.

La plupart des benchmarks de LLM ne s’appuient pas sur une méthode fiable

L’entreprise donne quelques informations supplémentaires sur son grand modèle Large 3. Par exemple, qu’il a été entrainé depuis zéro sur une infrastructure comprenant 3 000 GPU H200 de NVIDIA. Il s’agit également du premier modèle de type MoE (mixture-of-experts) de Mistral. Dans une version proposée au format NVFP4 (construite avec llm-compressor), Mistral affirme que son modèle peut fonctionner « efficacement » sur un nœud comportant huit puces A100 ou H100.

Cette approche permet pour rappel de dispatcher les requêtes vers des réseaux plus spécialisés du type de calcul lors de l’évaluation. Le principal avantage est une réduction de la consommation, le modèle n’activant qu’une partie des neurones pour traiter la demande (41 milliards de paramètres actifs sur 675 milliards au total). C’est le modèle présenté comme idéal pour les opérations lourdes, comme le développement et la création de contenus.

Mistral Large 3 se classe actuellement deuxième sur LMArena dans la catégorie des modèles ouverts sans capacités de raisonnement. La société ajoute que le développement de la nouvelle famille s’est fait en partenariat avec NVIDIA, aboutissant notamment à une « inférence efficace » pour TensorRT-LLM et SGLang.

La « petite » famille

Bien que Mistral aborde ses nouveautés du jour avec le modèle Large, ce sont surtout les petits modèles que la société met en avant. La série Ministral 3 comprend ainsi des variantes à 3, 8 et 14 milliards de paramètres, conçues pour l’informatique en périphérie (edge) et le fonctionnement local, toujours sous licence Apache 2.0. Tous ces modèles ont également des variantes de raisonnement, la version 14B atteignant par exemple 85 % sur le test AIME 25. Cette version, la plus volumineuse des trois, peut fonctionner sur une machine embarquant 24 Go de mémoire et un seul GPU.

Mistral semble particulièrement fière de ses petits modèles, assurant qu’ils offrent « le meilleur rapport coût/performance de tous les modèles open source » actuellement. Les versions classiques (sans raisonnement) sont au niveau ou dépassent les modèles concurrents, selon l’entreprise, tout en consommant « souvent » moins de jetons.

En tout, cette famille comprend trois modèles, les trois tailles étant disponibles dans des variantes Base (modèles de fondation pré-entrainés), Instruct (conçus surtout pour les chatbots) et Reasoning. Tous prennent en charge la vision, sont multilingues et fonctionnent avec des fenêtres allant de 128 000 à 256 000 jetons.

Guillaume Lample, fondateur de Mistral, a mis en avant la vision de l’entreprise auprès de plusieurs médias, dont TechCrunch et le Financial Times : « Nos clients sont parfois contents de débuter avec un très grand modèle de langage qu’ils n’ont pas besoin de peaufiner. Mais quand ils le déploient, ils réalisent que c’est cher et lent. Ils viennent alors nous voir pour affiner de petits modèles, afin de gérer leurs cas d’usage. Dans la pratique, la grande majorité des cas d’usage d’entreprises sont des choses que les petits modèles peuvent résoudre, surtout si vous les affinez ».

Comme le rappellent d’ailleurs nos confrères, cette orientation marquée vers les petits modèles capables de fonctionner localement rapproche l’entreprise de « l’IA physique ». Elle travaille par exemple avec Stellantis sur un assistant IA embarqué, avec la société allemande de défense Helsing sur des modèles vision-langage-action pour des drones, ou encore très récemment avec la Home Team Science and Technology Agency (HTX) de Singapour sur des modèles spécialisés pour robots.

Mistral lance sa nouvelle famille Mistral 3 et vante ses petits modèles

Next.ink

Par :Vincent Hermann

3 décembre 2025 à 12:58

Small si beautiful

Après le lancement de nouvelles versions majeures chez pratiquement tous les acteurs de l’IA générative, Mistral dégaine sa famille de modèles ouverts Mistral 3. Bien que celle-ci comprenne un modèle multimodal, ce sont surtout les plus petits qui sont mis en avant.

L’entreprise française n’en démord pas : lancer des modèles géants n’est pas nécessairement ce qu’il y a de mieux pour les entreprises. Elle reste centrée sur sa stratégie de publication de modèles à poids ouvert, dans l’idée que le monde professionnel va s’en emparer, les personnaliser, les distiller ou les entrainer sur ses propres données.

Mistral veut régner sur les modèles ouverts

Dans l’annonce, on remarque tout de suite que les comparaisons se font uniquement avec d’autres modèles ouverts, comme DeepSeek (en version 3.1 ou 3.2 selon les cas, étrangement) ou Kimi-K2. Sans trop de surprises dans le cadre de ce type d’annonce, les modèles Mistral 3 arrivent premiers dans la plupart des benchmarks, toujours à prendre avec des pincettes.

La plupart des benchmarks de LLM ne s’appuient pas sur une méthode fiable

L’entreprise donne quelques informations supplémentaires sur son grand modèle Large 3. Par exemple, qu’il a été entrainé depuis zéro sur une infrastructure comprenant 3 000 GPU H200 de NVIDIA. Il s’agit également du premier modèle de type MoE (mixture-of-experts) de Mistral. Dans une version proposée au format NVFP4 (construite avec llm-compressor), Mistral affirme que son modèle peut fonctionner « efficacement » sur un nœud comportant huit puces A100 ou H100.

Cette approche permet pour rappel de dispatcher les requêtes vers des réseaux plus spécialisés du type de calcul lors de l’évaluation. Le principal avantage est une réduction de la consommation, le modèle n’activant qu’une partie des neurones pour traiter la demande (41 milliards de paramètres actifs sur 675 milliards au total). C’est le modèle présenté comme idéal pour les opérations lourdes, comme le développement et la création de contenus.

Mistral Large 3 se classe actuellement deuxième sur LMArena dans la catégorie des modèles ouverts sans capacités de raisonnement. La société ajoute que le développement de la nouvelle famille s’est fait en partenariat avec NVIDIA, aboutissant notamment à une « inférence efficace » pour TensorRT-LLM et SGLang.

La « petite » famille

Bien que Mistral aborde ses nouveautés du jour avec le modèle Large, ce sont surtout les petits modèles que la société met en avant. La série Ministral 3 comprend ainsi des variantes à 3, 8 et 14 milliards de paramètres, conçues pour l’informatique en périphérie (edge) et le fonctionnement local, toujours sous licence Apache 2.0. Tous ces modèles ont également des variantes de raisonnement, la version 14B atteignant par exemple 85 % sur le test AIME 25. Cette version, la plus volumineuse des trois, peut fonctionner sur une machine embarquant 24 Go de mémoire et un seul GPU.

Mistral semble particulièrement fière de ses petits modèles, assurant qu’ils offrent « le meilleur rapport coût/performance de tous les modèles open source » actuellement. Les versions classiques (sans raisonnement) sont au niveau ou dépassent les modèles concurrents, selon l’entreprise, tout en consommant « souvent » moins de jetons.

En tout, cette famille comprend trois modèles, les trois tailles étant disponibles dans des variantes Base (modèles de fondation pré-entrainés), Instruct (conçus surtout pour les chatbots) et Reasoning. Tous prennent en charge la vision, sont multilingues et fonctionnent avec des fenêtres allant de 128 000 à 256 000 jetons.

Guillaume Lample, fondateur de Mistral, a mis en avant la vision de l’entreprise auprès de plusieurs médias, dont TechCrunch et le Financial Times : « Nos clients sont parfois contents de débuter avec un très grand modèle de langage qu’ils n’ont pas besoin de peaufiner. Mais quand ils le déploient, ils réalisent que c’est cher et lent. Ils viennent alors nous voir pour affiner de petits modèles, afin de gérer leurs cas d’usage. Dans la pratique, la grande majorité des cas d’usage d’entreprises sont des choses que les petits modèles peuvent résoudre, surtout si vous les affinez ».

Comme le rappellent d’ailleurs nos confrères, cette orientation marquée vers les petits modèles capables de fonctionner localement rapproche l’entreprise de « l’IA physique ». Elle travaille par exemple avec Stellantis sur un assistant IA embarqué, avec la société allemande de défense Helsing sur des modèles vision-langage-action pour des drones, ou encore très récemment avec la Home Team Science and Technology Agency (HTX) de Singapour sur des modèles spécialisés pour robots.

Noctua explique toutes ses dénominations, et ça ne fait pas de mal !

Hardware & Co - Actualités

Par :contact@hardwareand.co (David Sergent)

3 décembre 2025 à 12:17

Le 23 octobre 2005, Noctua voyait le jour et lançait son tout premier radiateur CPU sur le marché : le NH-U12. Nous sommes désormais 20 ans plus tard et la firme s'est imposée comme étant une référence mondiale de l'aircooling, probablement même LA référence mondiale. Au fil de toute ces années, l'e...

116° - [Prime] Lot de 4 Traceurs Localisateurs MiLi MiTag pour Android (Vendeur Tiers

Dealabs

3 décembre 2025 à 13:00

23,99€ - Amazon

【Étiquette intelligente Android】Le traceur MiLi Android garantit que vous ne perdrez plus jamais vos objets précieux. Utilisez l'application “Google L...

115° - 15 à 20% de remise sur toutes les précommandes Lego - Ex: Lego Harry Potter 76466 L’École des Sorciers Édition Collector

Dealabs

3 décembre 2025 à 12:55

135,99€ - LToys

Jusqu'au 1er janvier 2026, bénéficiez de 15 à 20% de remise sur les précommandes Lego, parmi les gammes Harry Potter, Star Wars, Marvel, Speed Champions, Disney...

112° - Pack 2 outils 18V RYOBI Rck182-242s - Perceuse visseuse, Meuleuse, 2 batteries (Via ODR 20€, Magasin participants) - Paris Rosa Parks - (75)

Dealabs

3 décembre 2025 à 12:54

139€ - Leroy Merlin

Lien de l'ODR : https://media.adeo.com/media/4930430/media.pdf

Les stocks sont visibles directement sur le site en choisissant votre magasin, exemple...

111° - Eau de toilette Hugo Boss Hugo Man - 75ml

Dealabs

3 décembre 2025 à 12:51

28,94€ - Parfumdo

HUGO Man est un classique contemporain, un parfum frais et audacieux pour les hommes modernes qui expriment leur individualité afin de vivre selon leurs règles ...

161° - Sélection d'articles de lingerie Undiz en promotion - Ex : Soutien-gorge push-up Celiniz - Lilas (du bonnet B au E)

Dealabs

3 décembre 2025 à 12:46

3,99€ - Showroomprivé

Nouvelle sélection Undiz chez Showroomprivé ! :)

> Parfois compliqué de trouver des tailles mais les prix ...

122° - Boîte à Outils Werckmann - 95 pièces

Dealabs

3 décembre 2025 à 12:43

29,77€ - Action

Description

Boîte incluse
Contient tout ce dont vous avez besoin pour bricoler : un niveau à bulle, un mètre ruban, un marteau d...

117° - Mini réfrigérateur Comfee RCD50WH2 - 43 L, Contrôle de Température, Compartiment Fraîcheur

Dealabs

3 décembre 2025 à 12:43

59,90€ - JoyBuy

Prix

129.99 euros sur Amazon

À propos de cet article

Taille compacte: Le modèle RCD50WH2(E) peut être placé d...

127° - [Nouveaux clients] 20% de réduction sur tout le site (via Newsletter)

Dealabs

3 décembre 2025 à 12:43

Philips

En cherchant une machine à café, j’ai débloqué une notification pour un code promotionnel de -20%. Pour que la notification s’affiche il faut balayer vers le ba...

123° - City-break à Budapest : 4 nuits au Mera Hotel 4★ | Petit-déjeuner inclus | 115€/pers

Dealabs

3 décembre 2025 à 12:41

330€ - Voyage privé

❄️ Budapest en hiver, ambiance cosy : Bon plan parfait pour un break chaleureux ✨

► Inclus

128° - Smartphone Xiaomi 17 Pro - 12 Go, 256 Go

Dealabs

3 décembre 2025 à 12:40

697€ - Trading Shenzen

Rom Chinoise avec langue anglaise Playstore installé et chargeur EU fourni
Le Xiaomi 17 PRO est équipé du tout dernier processeur Snapdragon 8 Elite Gen 5,...

126° - Montre Connectée Garmin Forerunner 970

Dealabs

3 décembre 2025 à 12:39

599,20€ - Au Vieux Campeur

REMISE IMMÉDIATE DE -20%.

La montre revient même à 569€ avec cashback wildilo

La Montre GPS Forerunner 970 est une montre de sport avec ...

186° - Robe Pull de Noël, Tailles du S au 3XL (Vendeur Tiers)

Dealabs

3 décembre 2025 à 12:35

16,99€ - Amazon

Matériau: Robe tricotée de Noël pour femme coupe ajustée est composée de 51.5% Viscose, 26.5% PBT, 22% Nylon, douce, légère, agréable pour la peau, conf...