Vue normale

IA générative : le RAG par l’exemple, avec 15 000 actus Next et Mistral 7B

29 juin 2026 à 13:27
Ça fait raguer mon Mac !
IA générative : le RAG par l’exemple, avec 15 000 actus Next et Mistral 7B

Nous avons passé à la moulinette du RAG le contenu de plus de 15 000 actus publiées sur Next ces dix dernières années. Le but ? En donner ensuite des morceaux à une IA générative pour qu’elle adapte ses réponses. Nous avons tout fait en local, sur un MacBook Pro avec Ollama et Mistral 7B.

Le Retrieval-Augmented Generation, ou génération augmentée par récupération en français, est une technique permettant à des IA génératives d’utiliser une base de connaissances pour répondre à des prompts. On utilise aussi très souvent son acronyme pour en parler : RAG.

Rag dans ma machine

Après les explications techniques et son principe de fonctionnement, nous vous proposons un exemple pratique. Nous avons récupéré le contenu de plus de 15 000 articles de Next sur une dizaine d’années pour l’associer à Mistral 7B, un LLM libre de 7,3 milliards de paramètres (sorti en 2023, désormais loin des ténors du moment qui ont au bas mot des centaines de milliards de paramètres, voire des milliers pour certains), sous licence Apache 2.0. Le RAG est agnostique du modèle d’IA générative, nous aurions évidemment pu en prendre un autre.

Dans notre cas, un traitement local était impératif. Nous avons utilisé un MacBook Pro avec un SoC M2 et 16 Go de mémoire partagée. Mistral 7B tourne dessus sans problème, avec de la marge pour exécuter d’autres applications en même temps. Côté logiciel, nous avons installé Ollama (open source, licence MIT). Nous l’avions déjà présenté dans un précédent tuto sur l’influence du GPU dans les performances des IA génératives.

Si les explications techniques ne vous intéressent pas, sautez directement à l’inter : « Concrètement, ça donne quoi d’utiliser le RAG ». Vous aurez des exemples de réponses à des prompts sur Mistral 7B avec et sans RAG (en local dans les deux cas).

Sous le capot pour la partie technique : Ollama, Mistral et Nomic

Passons rapidement (mais pas trop) sur les détails techniques, dont voici les grandes lignes : on télécharge le modèle d’IA générative avec la commande ollama pull mistral puis un autre modèle pour transformer le texte de nos actus en vecteurs (des nombres, qui sont ensuite utilisés par les algorithmes des IA génératives) avec ollama pull nomic-embed-text (on parle aussi d’embedding).

Un petit script permet de découper automatiquement le texte en plusieurs morceaux (chunks) qui sont ensuite transformés en tokens via nomic-embed-text. Cette indexation ne doit se faire qu’une seule fois. Dans notre cas, elle a pris environ trois heures (sur le MacBook Pro M2 avec plus de 15 000 articles). Pour ajouter de nouveaux articles par la suite, pas la peine de tout réindexer, il suffit de passer à la moulinette les nouveaux textes.

Passons aux choses sérieuses avec le déroulement d’un prompt. Le prompt est vectorisé, puis comparé à tous les vecteurs des morceaux des articles de notre base. Nous gardons les 10 meilleurs ; qui sont ensuite envoyés à Mistral en même temps que le prompt. Mistral va donc élaborer sa réponse en s’appuyant sur ses connaissances et les 10 morceaux des actus de Next.

On peut affiner le prompt pour lui demander de n’utiliser que les données de Next par exemple. Après, c’est un modèle statistique (comme toutes les IA génératives), donc statistiquement, il fait parfois n’importe quoi ; rien de neuf sous le Soleil.

Concrètement, ça donne quoi d’utiliser le RAG

Pour nos tests, nous utilisons donc Ollama sur notre MacBook Pro, sans aucune connexion à Internet, toutes les opérations se faisant en local.

Voici quelques prompts et les réponses de Mistral, avec ou sans RAG. Rappel important : nous n’avons pas spécialement cherché à optimiser les réponses (le prompt passé à Mistral avec le contenu des actualités jugé le plus intéressant pourrait être amélioré).

Nous vous proposons huit prompts, sur le logiciel, le droit, les réseaux sociaux, le hardware, l’informatique quantique… Les réponses sont, pour rappel, statistiques et peuvent donc par définition être totalement différentes pour un même prompt répété plusieurs fois. Nous livrons ici la première réponse proposée par l’IA générative.

Si vous avez des idées de prompts à tester, n’hésitez pas à les proposer en commentaire, suivant les cas je pourrai les lancer et donner les résultats dans une prochaine actualité

Passons aux choses sérieuses avec une première question soulevée par Vincent (il a la réponse, j’en suis certain ) ! Mais il est curieux de voir le résultat avec ou sans le contenu des actualités de Next… qu’il a pour la plupart rédigées.

Puis-je avoir une synthèse des défauts de Windows 11 ?

Réponse de Mistral avec RAG sur les actus Next :


Il reste 80% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

☕️ Au tour de l’Insee de se faire pirater, les données de 12 800 agents exfiltrées

29 juin 2026 à 07:37


Dans un communiqué publié le vendredi 26 juin dernier, l’Institut national de la statistique et des études économiques (Insee) annonce un incident de cybersécurité sur l’annuaire de ses agents, avec une fuite de données.

« Cette violation concerne l’identité d’environ 12 800 personnes travaillant, ayant travaillé à l’Insee ou issues des corps de l’Insee, ainsi que leurs coordonnées professionnelles ». L’institut affirme qu’aucun mot de passe, coordonnée personnelle ou bancaire, numéro de Sécurité sociale ou information de santé n’a été récupéré par les pirates.

Il ajoute n’avoir relevé aucune trace d’une « compromission des données collectées par l’Insee auprès des entreprises ou des personnes »… mais « l’institut recommande cependant aux entreprises comme aux particuliers la plus grande prudence en cas de réception d’un message qui semblerait provenir d’un agent de l’Insee ».

Comme la loi l’y oblige, l’incident a été signalé à la CNIL. L’Insee affirme aussi qu’une plainte a été déposée auprès du procureur de la République.

Illustration : Flock

L’Insee est le dernier d’une (trop) longue liste d’administrations et services de l’État piratés ces derniers mois. Il y a moins de deux semaines, c’était la plateforme JeVeuxAider.gouv.fr qui reconnaissait que « 550 000 comptes sont concernés par une extraction de données en lecture seule ». Cela concernait des noms, emails, numéros de téléphone, dates de naissance et historiques d’engagement des utilisateurs.

Début juin, c’était la messagerie sécurisée Tchap qui était victime d’un incident de sécurité. En avril, c’était l’ANTS avec au moins 11,7 millions de comptes. Suite à cela, Sébastien Lecornu a présenté le plan du gouvernement pour essayer de stopper l’hémoragie.

Le phénomène n’est pas nouveau… En 2024, France Travail faisait « all-in » avec des données de 43 millions de personnes potentiellement dérobées.

☕️ Au tour de l’Insee de se faire pirater, les données de 12 800 agents exfiltrées

29 juin 2026 à 07:37


Dans un communiqué publié le vendredi 26 juin dernier, l’Institut national de la statistique et des études économiques (Insee) annonce un incident de cybersécurité sur l’annuaire de ses agents, avec une fuite de données.

« Cette violation concerne l’identité d’environ 12 800 personnes travaillant, ayant travaillé à l’Insee ou issues des corps de l’Insee, ainsi que leurs coordonnées professionnelles ». L’institut affirme qu’aucun mot de passe, coordonnée personnelle ou bancaire, numéro de Sécurité sociale ou information de santé n’a été récupéré par les pirates.

Il ajoute n’avoir relevé aucune trace d’une « compromission des données collectées par l’Insee auprès des entreprises ou des personnes »… mais « l’institut recommande cependant aux entreprises comme aux particuliers la plus grande prudence en cas de réception d’un message qui semblerait provenir d’un agent de l’Insee ».

Comme la loi l’y oblige, l’incident a été signalé à la CNIL. L’Insee affirme aussi qu’une plainte a été déposée auprès du procureur de la République.

Illustration : Flock

L’Insee est le dernier d’une (trop) longue liste d’administrations et services de l’État piratés ces derniers mois. Il y a moins de deux semaines, c’était la plateforme JeVeuxAider.gouv.fr qui reconnaissait que « 550 000 comptes sont concernés par une extraction de données en lecture seule ». Cela concernait des noms, emails, numéros de téléphone, dates de naissance et historiques d’engagement des utilisateurs.

Début juin, c’était la messagerie sécurisée Tchap qui était victime d’un incident de sécurité. En avril, c’était l’ANTS avec au moins 11,7 millions de comptes. Suite à cela, Sébastien Lecornu a présenté le plan du gouvernement pour essayer de stopper l’hémoragie.

Le phénomène n’est pas nouveau… En 2024, France Travail faisait « all-in » avec des données de 43 millions de personnes potentiellement dérobées.

❌