Vue normale

Dans la fonction publique, l’expérimentation de « L’Assistant » laisse sceptique

26 juin 2026 à 15:46
Mouais bof
Dans la fonction publique, l’expérimentation de « L’Assistant » laisse sceptique

La généralisation du déploiement de l’agent IA « L’Assistant » de la DINUM pour tous les agents publics a été annoncée par Sébastien Lecornu. Mais les résultats de l’expérimentation, sans être négatifs, montrent qu’il sera difficile de généraliser son utilisation à la place d’autres outils d’IA générative.

La semaine dernière, le Premier ministre, Sébastien Lecornu, a fait une série d’annonces sur l’intelligence artificielle, dont la généralisation de l’accès au projet « L’Assistant » qui doit équiper tous les agents de la fonction publique. Après dix mois de beta test, les agents ayant donné leur avis semblent l’avoir bien accueilli, mais ils sont finalement peu nombreux par rapport au nombre de beta testeurs affichés par le ministère.

Ce service est un chatbot opéré par la DINUM pour que les agents publics français « dialogu[ent] avec des modèles d’intelligence artificielle générative dans un environnement sécurisé ». On imagine que l’idée est de réduire le « shadow AI » (l’utilisation de bots IA commerciaux dans les bureaux, sans être passés par un contrat) qui se pratique dans les bureaux de la fonction publique.

Mais le but est peut-être aussi d’éviter les déconvenues comme celle du projet HéphAIstos, destiné aux hauts fonctionnaires de Bercy, qui repose sur des modèles de l’entreprise chinoise Qwen AI. Certains utilisateurs ont relevé, rapporte l’AFP, des « réponses orientées » ou « biaisées » sur des sujets relatifs à la Chine.

Le CNRS, comme d’autres institutions françaises, avait fait le choix de signer un contrat avec Mistral, au risque d’un déploiement du chatbot qualifié à l’époque de « pas sérieux ». Ici, la DINUM et le gouvernement ont pris les devants avec un outil maison, une expérimentation pendant dix mois et une évaluation menée par des chercheurs en sciences sociales de l’INRIA, l’INSA Rennes et du CNRS.

Un chiffre de beta testeurs répondant pas si important qu’affiché

La direction interministérielle de la transformation publique a partagé à la fin de cette expérimentation les résultats de l’évaluation [PDF]. Alors que le ministère affiche que le projet a été « expérimenté pendant dix mois auprès de 10 000 agents issus de six ministères (Justice, Finances, Éducation nationale, Culture, Enseignement supérieur et Recherche, Services du Premier ministre) », remarquons d’abord que le document précise que c’est le nombre de licences déployées par la DINUM.

Il explique que plusieurs questionnaires ont été envoyés entre décembre 2025 et juin 2026, mais seulement aux ministères économiques et financiers et au ministère de la Justice. Chez les premiers, 1 359 agents ont accepté de participer à l’évaluation en décembre 2025, 874 d’entre eux ont fait un retour en mars et seulement 465 ont répondu au questionnaire de fin d’expérimentation. Du côté du ministère de la Justice, il n’y a eu que 700 retours en janvier et le document n’évoque aucun retour de questionnaire de fin d’expérimentation de la part des services du garde des Sceaux, Gérald Darmanin.

L’évaluation a aussi été faite en prenant en compte 20 entretiens qualitatifs semi-dirigés et trois focus-groups en présentiel.

Des répondants qui jugent que l’Assistant répond moins bien à leurs besoins que les autres IA génératives

Sachant cela, les répondants sont majoritairement satisfaits de l’outil : 65 % recommanderaient l’Assistant IA à un collègue et 75 % estiment qu’il est utile pour leur métier. Mais ils sont une courte majorité à affirmer qu’ils utilisent moins souvent des solutions non souveraines dans le cadre professionnel grâce à l’Assistant. Et encore plus difficile à avaler pour le projet, « 57 % considèrent que les autres IA génératives répondent mieux à leurs besoins ».

On le voit aussi dans les réponses concernant les freins à l’usage : le manque de confiance dans la fiabilité des réponses est ce qui revient en premier. La méconnaissance des fonctionnalités adaptées aux spécificités de leurs métiers arrive juste après.

Finalement, ces résultats de l’expérimentation ont de quoi laisser sceptique sur les capacités réelles de l’Assistant à remplacer le shadow AI dans les bureaux des ministères.

Dans la fonction publique, l’expérimentation de « L’Assistant » laisse sceptique

26 juin 2026 à 15:46
Mouais bof
Dans la fonction publique, l’expérimentation de « L’Assistant » laisse sceptique

La généralisation du déploiement de l’agent IA « L’Assistant » de la DINUM pour tous les agents publics a été annoncée par Sébastien Lecornu. Mais les résultats de l’expérimentation, sans être négatifs, montrent qu’il sera difficile de généraliser son utilisation à la place d’autres outils d’IA générative.

La semaine dernière, le Premier ministre, Sébastien Lecornu, a fait une série d’annonces sur l’intelligence artificielle, dont la généralisation de l’accès au projet « L’Assistant » qui doit équiper tous les agents de la fonction publique. Après dix mois de beta test, les agents ayant donné leur avis semblent l’avoir bien accueilli, mais ils sont finalement peu nombreux par rapport au nombre de beta testeurs affichés par le ministère.

Ce service est un chatbot opéré par la DINUM pour que les agents publics français « dialogu[ent] avec des modèles d’intelligence artificielle générative dans un environnement sécurisé ». On imagine que l’idée est de réduire le « shadow AI » (l’utilisation de bots IA commerciaux dans les bureaux, sans être passés par un contrat) qui se pratique dans les bureaux de la fonction publique.

Mais le but est peut-être aussi d’éviter les déconvenues comme celle du projet HéphAIstos, destiné aux hauts fonctionnaires de Bercy, qui repose sur des modèles de l’entreprise chinoise Qwen AI. Certains utilisateurs ont relevé, rapporte l’AFP, des « réponses orientées » ou « biaisées » sur des sujets relatifs à la Chine.

Le CNRS, comme d’autres institutions françaises, avait fait le choix de signer un contrat avec Mistral, au risque d’un déploiement du chatbot qualifié à l’époque de « pas sérieux ». Ici, la DINUM et le gouvernement ont pris les devants avec un outil maison, une expérimentation pendant dix mois et une évaluation menée par des chercheurs en sciences sociales de l’INRIA, l’INSA Rennes et du CNRS.

Un chiffre de beta testeurs répondant pas si important qu’affiché

La direction interministérielle de la transformation publique a partagé à la fin de cette expérimentation les résultats de l’évaluation [PDF]. Alors que le ministère affiche que le projet a été « expérimenté pendant dix mois auprès de 10 000 agents issus de six ministères (Justice, Finances, Éducation nationale, Culture, Enseignement supérieur et Recherche, Services du Premier ministre) », remarquons d’abord que le document précise que c’est le nombre de licences déployées par la DINUM.

Il explique que plusieurs questionnaires ont été envoyés entre décembre 2025 et juin 2026, mais seulement aux ministères économiques et financiers et au ministère de la Justice. Chez les premiers, 1 359 agents ont accepté de participer à l’évaluation en décembre 2025, 874 d’entre eux ont fait un retour en mars et seulement 465 ont répondu au questionnaire de fin d’expérimentation. Du côté du ministère de la Justice, il n’y a eu que 700 retours en janvier et le document n’évoque aucun retour de questionnaire de fin d’expérimentation de la part des services du garde des Sceaux, Gérald Darmanin.

L’évaluation a aussi été faite en prenant en compte 20 entretiens qualitatifs semi-dirigés et trois focus-groups en présentiel.

Des répondants qui jugent que l’Assistant répond moins bien à leurs besoins que les autres IA génératives

Sachant cela, les répondants sont majoritairement satisfaits de l’outil : 65 % recommanderaient l’Assistant IA à un collègue et 75 % estiment qu’il est utile pour leur métier. Mais ils sont une courte majorité à affirmer qu’ils utilisent moins souvent des solutions non souveraines dans le cadre professionnel grâce à l’Assistant. Et encore plus difficile à avaler pour le projet, « 57 % considèrent que les autres IA génératives répondent mieux à leurs besoins ».

On le voit aussi dans les réponses concernant les freins à l’usage : le manque de confiance dans la fiabilité des réponses est ce qui revient en premier. La méconnaissance des fonctionnalités adaptées aux spécificités de leurs métiers arrive juste après.

Finalement, ces résultats de l’expérimentation ont de quoi laisser sceptique sur les capacités réelles de l’Assistant à remplacer le shadow AI dans les bureaux des ministères.

(màj) La Maison-Blanche demande à OpenAI de retarder GPT-5.6 pour examen

26 juin 2026 à 09:22
Brouillard de guerre
(màj) La Maison-Blanche demande à OpenAI de retarder GPT-5.6 pour examen

Le gouvernement américain aurait exigé d’OpenAI une période d’examen similaire pour son futur modèle GPT-5.6. Les performances atteindraient le niveau de Mythos et Fable d’Anthropic et feraient donc l’objet d’une analyse des risques. Seuls des acteurs triés sur le volet y auraient actuellement accès.

Mise à jour 19h30 – OpenAI a lancé ce vendredi soir GPT-5.6… mais uniquement à destination d’une poignée d’organisations et d’entreprises ayant reçu l’aval du gouvernement américain. Trois versions du LLM sont proposées : Sol (la plus puissante), Terra (équilibre performances/efficacité) et Luna (plus rapide et meilleur marché). L’objectif est de déployer ce modèle plus largement dans les prochaines semaines.

Article d’origine – OpenAI aurait accepté d’échelonner la sortie publique de son prochain modèle, GPT-5.6. C’est ce qu’affirme The Information dans un article du 25 juin, relayé par divers autres médias. Le gouvernement Trump aurait officiellement demandé à l’entreprise de retarder cette disponibilité et de lui donner un délai de 30 jours pour examiner la situation. Durant cette période, l’accès ne serait confié qu’à une poignée de partenaires sélectionnés avec soin, le temps que la Maison-Blanche étudie les implications pour la sécurité nationale.

Dans le sillage du décret présidentiel

Le 2 juin, Donald Trump a signé un décret présidentiel (executive order) intitulé « Promoting Advanced Artificial Intelligence Innovation and Security ». Il demande aux entreprises d’IA de soumettre volontairement leurs modèles les plus puissants à un examen gouvernemental jusqu’à 30 jours avant leur publication publique. Il prévoit également la création d’un AI cybersecurity clearinghouse (bureau central de la cybersécurité de l’IA) et mandate des benchmarks classifiés pour évaluer les capacités cyber des modèles.

Cet executive order stipule explicitement que rien dans son texte ne saurait être interprété comme autorisant la création d’une exigence gouvernementale de licences, de pré-autorisation ou de permis pour le développement, la publication ou la distribution de nouveaux modèles. La participation est formellement volontaire. Du moins, sur le papier.

En outre, le cadre opérationnel du décret n’est pas établi. Benchmarks classifiés, liste de modèles concernés, procédures d’évaluation : rien n’est encore fixé. Un groupe multi-agences dirigé par les secrétaires au Trésor, à la Guerre et à la Sécurité intérieure dispose de 60 jours (soit jusqu’au 31 juillet 2026) pour concevoir ce cadre.

Mythos et Fable en ont fait les « frais »

Il n’aura pas fallu dix jours pour qu’Anthropic essuie les plâtres du décret. Le gouvernement américain, invoquant ses pouvoirs en matière de sécurité nationale, a émis une directive de contrôle des exportations ordonnant la suspension immédiate de tout accès à Fable 5 et Mythos 5 pour tout ressortissant étranger, où qu’il se trouve dans le monde, jusqu’aux employés d’Anthropic eux-mêmes.

Anthropic a reçu l’ordre le 12 juin. Le courrier ne contenait aucune raison précise à cette préoccupation gouvernementale. Anthropic, incapable de filtrer ses utilisateurs par nationalité, a fini par appliquer la seule solution qui s’adressait à elle : couper l’accès à tout le monde.

Dans son communiqué du même jour, l’entreprise explique que le gouvernement semble alors penser que Fable 5 a été « jailbreaké », permettant d’outrepasser ses limites. Fable est pour rappel une version de Mythos protégée en théorie par des garde-fous. Mythos n’étant accessible qu’au travers du projet Glasswing, composé d’une quarantaine d’organisations triées sur le volet, un tel jailbreak représentait effectivement un sérieux problème.

Mais Anthropic a vivement contesté le bien-fondé de la mesure : l’entreprise estimait que le jailbreak cité par le gouvernement était étroit et ne déverrouillerait les capacités cybersécurité de Mythos que dans un cas spécifique, pas de façon universelle. Elle ajoutait que le même jailbreak pouvait être utilisé pour obtenir des capacités similaires d’autres modèles publiquement disponibles, dont GPT-5.5 d’OpenAI, qui n’était pourtant pas concerné par de tels contrôles.

La décision s’est inscrite en outre dans un contexte politique tendu : les principaux conseillers tech de Trump, notamment l’ex-czar de l’IA David Sacks (Palantir) et le sous-secrétaire à la Défense Emil Michael, ont publiquement attaqué Anthropic et ses dirigeants. Sacks a accusé Anthropic d’être « woke » et « gauchiste » et de se livrer à une « stratégie sophistiquée de capture réglementaire fondée sur la peur », comme le rappelait Fortune le 13 juin. En mars 2026, le Pentagone avait déjà qualifié Anthropic de « risque pour la chaîne d’approvisionnement », et Anthropic poursuit le gouvernement en justice pour tenter de faire annuler cette désignation, les procédures étant toujours en cours.

Anthropic, OpenAI : même combat ?

Les deux cas ne sont toutefois pas les mêmes. Pour OpenAI, il s’agit cette fois d’une demande formelle avant le lancement du modèle. Pour Anthropic, l’ordre avait été donné a posteriori.

Si OpenAI veut commercialiser son modèle, elle doit soumettre à la Maison-Blanche les clients potentiels, qui seront approuvés ou pas après examen. Selon l’article de The Information, GPT-5.6 est estimé au même niveau que Mythos en capacités avancées de cybersécurité.

Toujours selon nos confrères, Sam Altman aurait communiqué la situation aux employés d’OpenAI via une note de service. Les responsables fédéraux approuveraient l’accès « client par client pendant cette période de prévisualisation », suivie « quelques semaines plus tard » d’une publication plus générale du modèle 5.6. Ce dernier pourrait alors sortir en juillet. « Nous avons clairement indiqué au gouvernement américain que ce n’est pas notre modèle préféré à long terme, et nous travaillerons avec lui et d’autres acteurs de l’industrie pour trouver une approche plus durable pour les futures publications », indiquerait également la note.

Un fonctionnement pérenne ?

Si la mesure doit s’appliquer désormais sur tout nouveau modèle issu d’une grande société américaine, les conséquences pourraient être multiples. Financièrement d’abord, car ces entreprises ont besoin de vendre des abonnements pour prétendre un jour à toute forme de rentabilité. Dans un domaine où la concurrence est très active et où la Chine peut dégainer à tout moment un modèle capable de faire fléchir la capitalisation boursière d’une société comme NVIDIA, ces retards ne peuvent être que mal vécus par Anthropic et NVIDIA.

Au-delà d’éventuelles manœuvres politiques, la situation illustre aussi l’ambivalence de la situation. D’un côté, un décret mettant l’accent sur la participation volontaire. De l’autre, une mise en œuvre finalement contraignante. L’absence de cadre clair génère de la confusion chez les entreprises, qui ne savent pas qui ou quelle agence gère effectivement la régulation. Par exemple, la demande adressée à OpenAI provenait directement de la Maison-Blanche, tandis que l’interdiction d’exportation pour Anthropic est venue du ministère du Commerce.

L’épisode d’Anthropic a également souligné la dépendance extrême que les entreprises ou d’autres structures peuvent ressentir quand un acteur aussi important désormais coupe les vannes. La clientèle ne peut que s’inquiéter quand un outil aussi majeur que Claude (ou en l’occurrence l’une de ses variantes) peut disparaitre sans préavis par simple décision politique.

C’est une nouvelle fois un enjeu de souveraineté numérique, comme l’a abordé récemment le Conseil de l’IA et du Numérique. Dans un document (PDF), celui-ci notait (point 4) que la vision américaine de cette notion se rapprochait « paradoxalement et étroitement de la vision chinoise ».

(màj) La Maison-Blanche demande à OpenAI de retarder GPT-5.6 pour examen

26 juin 2026 à 09:22
Brouillard de guerre
(màj) La Maison-Blanche demande à OpenAI de retarder GPT-5.6 pour examen

Le gouvernement américain aurait exigé d’OpenAI une période d’examen similaire pour son futur modèle GPT-5.6. Les performances atteindraient le niveau de Mythos et Fable d’Anthropic et feraient donc l’objet d’une analyse des risques. Seuls des acteurs triés sur le volet y auraient actuellement accès.

Mise à jour 19h30 – OpenAI a lancé ce vendredi soir GPT-5.6… mais uniquement à destination d’une poignée d’organisations et d’entreprises ayant reçu l’aval du gouvernement américain. Trois versions du LLM sont proposées : Sol (la plus puissante), Terra (équilibre performances/efficacité) et Luna (plus rapide et meilleur marché). L’objectif est de déployer ce modèle plus largement dans les prochaines semaines.

Article d’origine – OpenAI aurait accepté d’échelonner la sortie publique de son prochain modèle, GPT-5.6. C’est ce qu’affirme The Information dans un article du 25 juin, relayé par divers autres médias. Le gouvernement Trump aurait officiellement demandé à l’entreprise de retarder cette disponibilité et de lui donner un délai de 30 jours pour examiner la situation. Durant cette période, l’accès ne serait confié qu’à une poignée de partenaires sélectionnés avec soin, le temps que la Maison-Blanche étudie les implications pour la sécurité nationale.

Dans le sillage du décret présidentiel

Le 2 juin, Donald Trump a signé un décret présidentiel (executive order) intitulé « Promoting Advanced Artificial Intelligence Innovation and Security ». Il demande aux entreprises d’IA de soumettre volontairement leurs modèles les plus puissants à un examen gouvernemental jusqu’à 30 jours avant leur publication publique. Il prévoit également la création d’un AI cybersecurity clearinghouse (bureau central de la cybersécurité de l’IA) et mandate des benchmarks classifiés pour évaluer les capacités cyber des modèles.

Cet executive order stipule explicitement que rien dans son texte ne saurait être interprété comme autorisant la création d’une exigence gouvernementale de licences, de pré-autorisation ou de permis pour le développement, la publication ou la distribution de nouveaux modèles. La participation est formellement volontaire. Du moins, sur le papier.

En outre, le cadre opérationnel du décret n’est pas établi. Benchmarks classifiés, liste de modèles concernés, procédures d’évaluation : rien n’est encore fixé. Un groupe multi-agences dirigé par les secrétaires au Trésor, à la Guerre et à la Sécurité intérieure dispose de 60 jours (soit jusqu’au 31 juillet 2026) pour concevoir ce cadre.

Mythos et Fable en ont fait les « frais »

Il n’aura pas fallu dix jours pour qu’Anthropic essuie les plâtres du décret. Le gouvernement américain, invoquant ses pouvoirs en matière de sécurité nationale, a émis une directive de contrôle des exportations ordonnant la suspension immédiate de tout accès à Fable 5 et Mythos 5 pour tout ressortissant étranger, où qu’il se trouve dans le monde, jusqu’aux employés d’Anthropic eux-mêmes.

Anthropic a reçu l’ordre le 12 juin. Le courrier ne contenait aucune raison précise à cette préoccupation gouvernementale. Anthropic, incapable de filtrer ses utilisateurs par nationalité, a fini par appliquer la seule solution qui s’adressait à elle : couper l’accès à tout le monde.

Dans son communiqué du même jour, l’entreprise explique que le gouvernement semble alors penser que Fable 5 a été « jailbreaké », permettant d’outrepasser ses limites. Fable est pour rappel une version de Mythos protégée en théorie par des garde-fous. Mythos n’étant accessible qu’au travers du projet Glasswing, composé d’une quarantaine d’organisations triées sur le volet, un tel jailbreak représentait effectivement un sérieux problème.

Mais Anthropic a vivement contesté le bien-fondé de la mesure : l’entreprise estimait que le jailbreak cité par le gouvernement était étroit et ne déverrouillerait les capacités cybersécurité de Mythos que dans un cas spécifique, pas de façon universelle. Elle ajoutait que le même jailbreak pouvait être utilisé pour obtenir des capacités similaires d’autres modèles publiquement disponibles, dont GPT-5.5 d’OpenAI, qui n’était pourtant pas concerné par de tels contrôles.

La décision s’est inscrite en outre dans un contexte politique tendu : les principaux conseillers tech de Trump, notamment l’ex-czar de l’IA David Sacks (Palantir) et le sous-secrétaire à la Défense Emil Michael, ont publiquement attaqué Anthropic et ses dirigeants. Sacks a accusé Anthropic d’être « woke » et « gauchiste » et de se livrer à une « stratégie sophistiquée de capture réglementaire fondée sur la peur », comme le rappelait Fortune le 13 juin. En mars 2026, le Pentagone avait déjà qualifié Anthropic de « risque pour la chaîne d’approvisionnement », et Anthropic poursuit le gouvernement en justice pour tenter de faire annuler cette désignation, les procédures étant toujours en cours.

Anthropic, OpenAI : même combat ?

Les deux cas ne sont toutefois pas les mêmes. Pour OpenAI, il s’agit cette fois d’une demande formelle avant le lancement du modèle. Pour Anthropic, l’ordre avait été donné a posteriori.

Si OpenAI veut commercialiser son modèle, elle doit soumettre à la Maison-Blanche les clients potentiels, qui seront approuvés ou pas après examen. Selon l’article de The Information, GPT-5.6 est estimé au même niveau que Mythos en capacités avancées de cybersécurité.

Toujours selon nos confrères, Sam Altman aurait communiqué la situation aux employés d’OpenAI via une note de service. Les responsables fédéraux approuveraient l’accès « client par client pendant cette période de prévisualisation », suivie « quelques semaines plus tard » d’une publication plus générale du modèle 5.6. Ce dernier pourrait alors sortir en juillet. « Nous avons clairement indiqué au gouvernement américain que ce n’est pas notre modèle préféré à long terme, et nous travaillerons avec lui et d’autres acteurs de l’industrie pour trouver une approche plus durable pour les futures publications », indiquerait également la note.

Un fonctionnement pérenne ?

Si la mesure doit s’appliquer désormais sur tout nouveau modèle issu d’une grande société américaine, les conséquences pourraient être multiples. Financièrement d’abord, car ces entreprises ont besoin de vendre des abonnements pour prétendre un jour à toute forme de rentabilité. Dans un domaine où la concurrence est très active et où la Chine peut dégainer à tout moment un modèle capable de faire fléchir la capitalisation boursière d’une société comme NVIDIA, ces retards ne peuvent être que mal vécus par Anthropic et NVIDIA.

Au-delà d’éventuelles manœuvres politiques, la situation illustre aussi l’ambivalence de la situation. D’un côté, un décret mettant l’accent sur la participation volontaire. De l’autre, une mise en œuvre finalement contraignante. L’absence de cadre clair génère de la confusion chez les entreprises, qui ne savent pas qui ou quelle agence gère effectivement la régulation. Par exemple, la demande adressée à OpenAI provenait directement de la Maison-Blanche, tandis que l’interdiction d’exportation pour Anthropic est venue du ministère du Commerce.

L’épisode d’Anthropic a également souligné la dépendance extrême que les entreprises ou d’autres structures peuvent ressentir quand un acteur aussi important désormais coupe les vannes. La clientèle ne peut que s’inquiéter quand un outil aussi majeur que Claude (ou en l’occurrence l’une de ses variantes) peut disparaitre sans préavis par simple décision politique.

C’est une nouvelle fois un enjeu de souveraineté numérique, comme l’a abordé récemment le Conseil de l’IA et du Numérique. Dans un document (PDF), celui-ci notait (point 4) que la vision américaine de cette notion se rapprochait « paradoxalement et étroitement de la vision chinoise ».

❌