
Les services d’IA ne cessent de m’étonner. Pour avoir vécu la bulle Internet de 2001-2002, je peux qu’être attentif au parfum actuel qui se dégage de ce marché. Parfum d’autant plus vif et tenace qu’il semble être largement multiplié par des investissements colossaux. En ce moment, on sent que le marché de l’IA commence à s’effriter. La rentabilité des investissements devient longue et assez délicate. Et c’est pour cela que cette histoire est savoureuse.
Imaginez-vous commerçant ou fournisseur de service en train de faire votre « Business Plan » et de le présenter à la banque pour trouver les fonds nécessaires pour vous établir. Il est prévu quelques années difficiles au début, on ne trouve pas forcément sa clientèle immédiatement et il faut faire ses preuves. Mais, au bout de quelques trimestres ou années, on estime pouvoir dégager des bénéfices et donc rembourser la banque correctement sur un plan étalé sur quelques temps. On tend son dossier au banquier, il dit « non » et ensuite on hypothèque sa baraque pour se jeter à l’eau. Ou on retourne à son poste salarié en mâchouillant ses illusions perdues.

Maintenant, imaginez vous être, je ne sais pas, développeur d’applications. Et vous proposeriez un business plan ou vous vendriez des forfaits de prestation de service à 250$ à diverses sociétés. En gros, vous leur apportez de l’aide en ligne en les corrigeant ou en réalisant leur code. Seulement voilà, vous êtes malin et vous vous dites qu’au lieu de répondre vous-même, vous allez faire appel à des développeurs indépendants au travers d’une plateforme commune. Le client pose sa question, un développeur répond. Tout le monde est content. Il y a pourtant un petit hic dans votre business plan. Votre banquier est en train de le lire quand vous le voyez soulever un sourcil interrogateur. Il pose son doigt sur votre tableau présentant vos recettes et pointe un léger détail. La courbe des bénéfices s’enfonce irrémédiablement vers des pertes et à une vitesse vertigineuse.
Parce que le coût du salaire versé à vos développeurs pour assurer la tâche d’aide à ces entreprises est évalué à 15 000$. Ce qui pose un petit problème avec une perte nette de 14 750$ par abonnement vendu. Après que vous vous soyez baissé pour éviter le fauteuil, pourtant vraiment très lourd, que votre banquier vient d’envoyer voler dans la pièce, vous prenez vos affaires et vous partez rapidement.

Tes calculs sont pas bon KevIA
C’est du moins ce que l’on serait tenté de penser dans une économie logique. Mais, comme pour la bulle internet des années 2000, avec l’IA nous ne sommes pas dans une économie logique. La société Augment Code propose peu ou prou cela, une aide au développement. Mieux, elle n’a pas besoin de développeurs à payer pour aider les boites. Non, elle fait appel à une IA qui rend ce service pour elle. Seulement voilà, Augment Code n’a pas de gros serveurs pour ses calculs, elle sous traite cette partie à Anthropic pour exploiter son IA Sonnet 4.5. C’est cette autre société qui héberge l’IA pour éviter les frais inhérents à ce genre d’investissement.

Et Augment Code propose un forfait de 250$ pour un mois d’accès à son IA. Ce forfait baptisé « 250$ Max » permet ensuite de poser toutes les questions ou de demander le traitement de n’importe quelle tâche à leur IA. Vous voyez le problème ? Augment Code propose d’un côté un service avec un prix fixe et attractif et de l’autre se fournit chez un autre prestataire qui va lui facturer les services à la tâche et non pas au forfait. La société indique devoir changer son « business model » parce que, par exemple, un de ses clients au forfait de 250$ a réussi l’exploit de poser 335 requêtes par heure, 24h/24 pendant 30 jours. Un total qui a fini par couter 15 000$ à Augment Code. Une perte sèche de 14 750$ sur le mois, exactement comme dans l’exemple de notre banquier à la chaise volante.
On imagine bien qu’aucun humain ne peut réussir à poser 355 questions par heure, soit près de 6 questions par minute, 24H/24 et 7J/7. Ce qu’a fait le client d’Augment Code est simplement d’optimiser au mieux son forfait. Il lui a probablement suffi de son côté de coder une solution pour collecter toutes les questions et demandes d’aide de ses propres codeurs. Solution logicielle qui va les stocker dans une pile de travail avant de les soumettre petit à petit à l’IA. Les résultats collectés étant ensuite renvoyés localement aux différents développeurs au fur et à mesure des réponses de l’IA. Simple et très efficace puisque, au lieu de prendre plusieurs abonnements à 250$, la boite peut épauler des dizaines de salariés avec un seul forfait.
Augment Code a donc décidé de changer son modèle. Oubliant les plans « All Inclusive » pour des solutions par « jetons » où on paiera en fonction de sa consommation. On achètera un nombre de jetons que l’on dépensera ensuite au fur et à mesure de son utilisation. Ainsi les 255 600 questions posées jour et nuit sur un simple abonnement à 250$ se transformeront en un tarif logiquement au-dessus des 15 000$ du simple coût de traitement facturé par la société qui exécute cette IA. Il faut en effet payer les salariés d’Augment Code et quelques autres détails de charge, de marketing et de dettes…
Reste à savoir si la société va conserver sa clientèle. Si énormément de sociétés de développement ont dû trouver absolument fantastique cette opportunité à 250$, ils ne seront peut-être plus aussi enchantés par le même service proposé beaucoup plus cher. Pour faire passer la pilule, Augment Code va proposer des crédits offerts de transition et explore des moyens de baisser ses coûts en changeant partiellement de fournisseurs avec GPT-5. Elle a également décidé de proposer un système d’évaluation de l’aide demandée. Une tâche simple ne coutera que quelques crédits quand un ordre plus complexe alourdira fortement la note. Cela ne va pas rendre le suivi des coûts de développement facile pour les prestataires qui se servent du service et qui vont devoir les refléter à leur tour ces augmentations à leurs clients. Imaginez l’impact pour la société tierce, tout au bout de la chaine, à qui ont dit que la facture s’alourdit.
Évidemment, il faudra un certain temps avant qu’Augment Code retrouve un équilibre financier avec ces changements. Éponger les dettes accumulées sera déjà une tâche difficile. Mais le plus drôle dans cette histoire n’est pas vraiment situé à cet étage. Le plus drôle, c’est que ce qui arrive à Augment Code n’est qu’une maquette, un modèle réduit de ce qu’il se passe à l’échelle supérieure. Anthropic et OpenAI sont tout à fait dans le même schéma. Mais à des échelles encore plus monstrueuses encore. Eux aussi ont investi des milliards et des milliards de dollars dans des serveurs pour se développer et pour le moment, les sociétés ne sont pas rentables et brûlent le cash de leurs investisseurs. À un moment, il va bien falloir inverser cette tendance.
On verra bien ou tout cela nous mènera. Mais quand je croise cette idée avec celle d’une IA dédiée locale, déposée sur un petit serveur au sein même d’une boite de développement, je n’imagine plus une bulle, mais une vraie soirée mousse.
L’IA ou comment vendre 250$ quelque chose qui vous coûte 15000$ © MiniMachines.net. 2025