Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs
Confrontation au réel ?
GitHub vient de changer sa manière de facturer son service Copilot pour les développeurs. Se basant sur l’usage réel, ce nouveau système de facturation a surpris beaucoup de développeurs utilisant l’IA générative dans leur travail au quotidien. L’adoption d’autres approches devient nécessaire.
Ce 1ᵉʳ juin, GitHub Copilot est passé à un nouveau système de facturation qui embarrasse quelque peu les développeurs habitués à l’ancien système qui les laissait utiliser des modèles moins gourmands sans entamer leurs quotas. Résultat : dès le premier jour et en quelques requêtes, certains ont déjà atteint le maximum de leur crédit mensuel.
Comme nous l’expliquions fin avril, Microsoft a basculé la facturation de GitHub Copilot vers une tarification basée sur l’usage réel. Jusque-là, les utilisateurs n’étaient limités que sur l’utilisation des nouveaux modèles, celle des modèles moins puissants était comprise dans le prix de l’abonnement sans restriction. Maintenant, chaque formule prépayée est accompagnée d’une enveloppe de « crédits IA » qui sont décomptés, que l’utilisateur choisisse un modèle très puissant ou pas. Le décompte dépend quand même du modèle utilisé et du nombre de tokens consommés, donc de la complexité de la requête, comme l’explique GitHub dans sa documentation.
« Un changement radical »
Même si GitHub a prévenu un mois à l’avance, la bascule est radicale pour les aficionados de GitHub Copilot. « Il s’agit là d’un changement radical, passant d’un « abonnement prévisible » à un service « à la consommation » stressant qui, au lieu de m’aider, nuit à ma productivité », réagit un utilisateur sur le forum de GitHub Copilot, « en tant que développeur professionnel abonné à l’offre Copilot Pro+ (39 $/mois), je trouve que le rythme de consommation actuel est tout à fait insoutenable et qu’il constitue une dévalorisation directe du service pour lequel je paie ». Il explique qu’« en seulement deux heures de travail de développement aujourd’hui », il a utilisé 8 % de ses crédits mensuels.
On peut trouver un peu partout sur les réseaux sociaux, par exemple sur Reddit, d’autres témoignages. Sur X, un développeur explique : « J’ai utilisé 5 000 jetons sur 7 000 pour deux commits, l’un avec Opus 4.8 (niveau moyen) et l’autre avec GPT 5.5 (niveau élevé). De bons résultats dans les deux cas, mais j’ai l’impression qu’Opus était un peu moins coûteux ».
Dans nos contacts, un développeur s’est aussi rendu compte que sa première requête du jour lui avait coûté 18 % de son quota de son forfait Copilot Pro. Elle concernait la découpe d’un fichier JS de 1500 lignes en plusieurs et l’ajout d’une logique (une checkbox en front-end). « C’est quand même une « grosse » requête, donc ce n’est pas si étonnant que ça utilise 500 tokens sur les 1500, nous explique-t-il, mais le choc est brutal ».
Un autre utilisateur ajoute sur le forum de GitHub : « dans un nouveau projet, j’ai remplacé le code de vérification envoyé par e-mail pour la fonction « mot de passe oublié » par un lien de réinitialisation direct. Ce changement m’a coûté 270 jetons IA, soit environ 18 % de ma limite sur Copilot Pro ». L’agent IA lui a fait d’autres suggestions qui ne correspondaient pas à sa demande et qui lui ont coûté des crédits pour rien.
Et comme le remarque ArsTechnica, de nombreux développeurs avaient déjà partagé sur Reddit le mois dernier des estimations de l’explosion de leur facture à utilisation constante :

Mais certains nuancent fortement le problème : « Il y a un monde entre ceux d’entre nous qui travaillent toute la journée sans pour autant avoir beaucoup de temps libre, et ces captures d’écran. J’ai du mal à croire que cela soit dû à des différences de complexité dans la charge de travail », estime l’un d’entre eux. «La seule façon d’en arriver à une telle situation, c’est de se lancer dans du « vibe coding » avec une multitude d’itérations superflues. C’est tout à fait abordable, même pour les petites structures, si on l’utilise comme un outil, quel que soit le fournisseur », ajoute-t-il. Un autre s’étonne aussi : « Je craignais d’utiliser beaucoup de crédits, mais après avoir vu certains de ces exemples, BON SANG ! Vous vous contentez d’utiliser un micro pour parler à l’ordinateur ? Vous savez vraiment coder ? Ou vous vous contentez de dicter des instructions ? Ou, comme on dit… « Vibe code le »… ».
Alors que, jusque-là, les formules d’abonnement permettaient à nombre d’utilisateurs de l’IA générative de l’employer de manière exploratoire, pour voir ce qu’ils pouvaient obtenir avec un simple prompt, quitte à l’optimiser petit à petit, les pratiques vont devoir évoluer si GitHub reste sur sa ligne.
Une adaptation nécessaire
Plusieurs solutions sont possibles. Ainsi, la première est d’aller voir ailleurs, mais les concurrents vont aussi devoir mettre en place des modèles économiques pour rapprocher ne serait-ce qu’un peu le prix d’utilisation de son coût réel. Anthropic a déjà changé le sien récemment.
Une autre solution envisageable est d’apprendre de l’expérience. Ainsi, au lieu de partir de manière exploratoire à chaque fois, s’appuyer sur ce qu’on a pu apprendre de l’utilisation de l’outil pour lui faire générer le plus rapidement possible ce que l’on veut. Les utilisateurs d’IA générative s’échangent déjà des prompts optimisés. Cette solution se confronte à deux choses.
D’abord, l’offre de GitHub évoluant rapidement, l’expérience est très rapidement remise en question par les nouveautés introduites ou les modèles qui seront petit à petit supprimés. On se rappelle de l’émotion de certains utilisateurs de GPT-4o lorsqu’OpenAI a fait le choix de débrancher le modèle, à l’été 2025 d’abord, puis définitivement le 13 février 2026.
Ensuite, le partage de prompts optimisés sur des forums ne revient-il pas, finalement, à faire revivre un Stack Overflow qui ne contiendrait pas du code mais des prompts ? C’est dans l’air du temps, avec des plateformes qui se lancent pour des échanges/ventes de prompts.
Les développeurs, qui ont les capacités techniques de le faire, peuvent aussi envisager plus sérieusement de faire tourner des IA en local (ou sur des VPS avec un GPU). Il faudra toutefois se tourner vers des modèles disponibles et qui ne seront pas toujours à la pointe, mais dont ils maitrisent l’utilisation et le coût.
























