M. Anderson, surpris de me voir ?
Google a ouvert hier soir sa conférence Next Cloud 25. L’entreprise avait pris le train de l’IA avec un peu de retard, mais semble aujourd’hui à nouveau sur les rails. Elle dispose désormais d’une offre complète et structurée et compte faire savoir qu’elle est prête pour « l’ère de l’inférence », avec un accent mis sur les agents.
Pour l’édition 2025 de la conférence Cloud Next, l’entreprise avait de quoi être plus sereine que l’année dernière. La situation de Google a été assez complexe jusqu’à présent, donnant l’impression que la firme courait systématiquement après Microsoft. En un an pourtant, la donne a quelque peu changé et Google peut se targuer d’avoir rejoint les hautes sphères avec les performances de son Gemini 2.5 Pro. Ce dernier est d’ailleurs disponible depuis peu pour Deep Research chez les personnes abonnées à Gemini Advanced.
La conférence est cependant là pour montrer aux entreprises et développeurs indépendants que Google est un acteur plus que crédible dans le domaine de l’IA, et plus particulièrement dans celui des agents. Ces derniers, fonctionnant comme des modules autonomes et indépendants capables de réaliser des missions, sont désormais au cœur de la stratégie du géant de la recherche, qui se rêve champion de l’IA.
Agents : la grande offensive
Une partie des annonces à la Google Cloud Next 25 était liée au matériel, avec notamment l’annonce de son nouveau TPU Ironwood. Nous avons détaillé hier soir les progrès réalisés par Google, même si la firme s’est servie de gros chiffres qui, sans précision, ne valent pas dire grand-chose pour l’instant.
En revanche, autour des agents, les annonces sont nombreuses, particulièrement les systèmes multi-agents, qui semblent être désormais au cœur de la stratégie de Google. On commence par une série d’améliorations pour Agentspace, service lancé l’année dernière pour simplifier la création d’agents par les utilisateurs finaux. Par exemple, l’intégration avec Chrome Enterprise, permettant l’utilisation d’Agentspace depuis la barre de recherche.
Surtout, Google lance plusieurs services pour fluidifier encore un peu la création d’agents. Agent Gallery permet ainsi de parcourir et adopter les modules disponibles. La galerie fonctionne comme une place de marché, les agents pouvant être construits par Google, des sociétés partenaires ou même d’autres employés. Agent Designer est de son côté une interface no-code pour créer des agents, à partir de modèles et avec possibilité de connecter le tout aux données de l’entreprise.
On continue avec AI Agent Marketplace, qui est cette fois une vraie place de marché. Contrairement à la Gallery, les sociétés tierces pourront proposer leurs propres agents et éventuellement les facturer. Enfin, un agent Deep Research est disponible en version finale, avec les mêmes missions d’exploration des sujets et de synthèse de rapports, tandis qu’un agent Idea Generation, se destine au développement et à l’évaluation des idées.
Tout ce qui touche à Gemini et à Agentspace sera bientôt disponible sur Google Distributed Cloud.
Et du côté développeurs ?
Si Agentspace vise les utilisateurs finaux, Google avait aussi des annonces pour les développeurs, en particulier Vertex AI Agent Builder. Le nom ne représente pas tout à fait ce que fait le service. S’il s’agit bien de construire des agents, c’est aussi une plateforme d’orchestration pour les systèmes multi-agents. Google glisse au passage que la plateforme Vertex AI a vu son utilisation multipliée par 20 au cours de l’année écoulée.
Agent Builder table sur l’existant et vient se présenter comme une pièce manquante du puzzle. Il met l’accent sur les frameworks open source et peut bien sûr se connecter aux données de l’entreprise, y compris avec des sources comme BigQuery et AlloyDB. Les agents peuvent être construits sur du stockage NetApp existant, sans duplication de données et Google fournit une centaine de connecteurs pour des applications d’entreprise. Agent Builder intègre également Agent Garden, une réserve de modèles, exemples, outils et autres composants prêts à l’emploi. Sont aussi présentes des capacités de débogage, de traçage et d’optimisation.
Google a présenté dans la foulée son propre framework open source, l’Agent Development Kit (licence Apache 2.0). Il n’est pour l’instant prévu que pour Python, mais d’autres langages seront supportés plus tard. Google affirme que l’ADK permet de créer un agent en moins de 100 lignes de code, mais encore faut-il savoir de quel type d’agent on parle. L’ADK joue lui aussi la carte de l’ouverture avec la possibilité de se connecter à Google Search, des moteurs RAG, tous les outils Google Cloud, tous les outils conformes MCP (Model Context Protocol) ou encore à des outils tiers comme LangChain, CrewAI et GenAI Toolbox for Databases. Lui aussi intègre l’Agent Garden.
Un runtime dédié et un protocole pour l’interopérabilité
Si vous en avez assez des agents, ce n’est pas fini. Google a en effet un runtime dédié pour les agents en production. Nommé simplement Agent Engine, un moteur entièrement géré intégrant la galaxie Vertex AI. Il doit servir à déployer, gérer et mettre à l’échelle les agents construits avec l’ADK ou d’autres frameworks comme LangGraph et Crew AI. Il intègre également des outils pour l’évaluation des performances, la surveillance et le traçage des comportements.
Mais c’est surtout le nouveau protocole Agent2Agent (A2A) qui résume le mieux la stratégie de Google. Ce protocole ouvert (lui aussi sous licence Apache 2.0) a été développé avec une cinquantaine de partenaires, dont Atlassian, Box, Cohere, Intuit, Langchain, MongoDB, PayPal, Salesforce, SAP, ServiceNow, UKG, Workday, ou encore des cabinets de conseil comme McKinsey.
A2A permet aux agents d’exposer leurs capacités, de négocier les modalités de collaboration avant d’interagir puis d’établir une communication sécurisée après accord. Google le présente comme le complément naturel du protocole MCP, qui lui a été pensé pour la connexion des modèles aux outils et données (OpenAI le comparait récemment à un hub USB pour l’IA). On pourrait également comparer A2A à Matter. Sans surprise, Agentspace et tous les autres produits annoncés prennent en charge A2A.
Une série d’agents prêts à l’emploi
Si Google a largement orienté sa conférence sur la facilité à créer des agents, la firme avait les siens propres à mettre en avant, notamment deux dédiés à la sécurité. Alert Triage est ainsi chargé d’enquêter sur les alertes, d’analyser le contexte et de fournir une conclusion. Malware Analysis fait ce que son nom annonce : analyser le code potentiellement malveillant. Il peut lancer des scripts de désobfuscation et présente un rapport. Tous deux font partie de la plateforme Google Unified Security.
On trouve également tout une série d’agents pour les données. Google en propose ainsi pour la création de catalogues, la génération de métadonnées et de pipelines, le maintien de la qualité, pour servir de partenaire de codage dans les notebooks ou encore l’analyse conversationnelle dans Looker.
Côté développement, Gemini Code Assist dispose désormais d’agents pouvant décomposer les requêtes faites en langage naturel en solutions à étapes et fichiers multiples. Une interface de type Kanban permet d’interagir avec les agents et de surveiller leur travail. Des intégrations sont en outre possible avec Atlassian, Sentry et Sneak.
Google propose aussi des agents pour l’engagement client, notamment la Customer Engagement Suite. On y retrouve des outils pour créer des agents virtuels, donc en interface directe avec la clientèle. Les points mis en avant sont très semblables à ceux récemment abordés par Amazon Web Services pour son modèle Nova Sonic : voix plus humaines, support de la vidéo en streaming, compréhension des émotions pour adapter la conversation, etc.
Gemini 2.5 Flash entre en piste
Alors que Gemini 2.5 Pro Experimental vient d’arriver dans Deep Search avec, selon Google, des gains très significatifs sur les résultats d’analyse, l’éditeur lance la version Flash de son modèle. On reste sur un modèle de « raisonnement », mais il propose une solution plus efficace – donc moins onéreuse – au détriment de la précision.
Google met en avant un calcul « dynamique et contrôlable », avec la possibilité pour les développeurs d’ajuster le temps de traitement en fonction de la complexité des requêtes. La société affirme que le nouveau modèle est idéal pour les applications à haut volume et fonctionnant en temps réel, notamment le service client et l’analyse de documents.
On a en outre appris que les modèles Gemini seront bientôt proposés sur la solution sur site Google Distributed Cloud. La firme indique à ce sujet que les clients ayant des exigences strictes en matière de sécurité pourront profiter des derniers apports de ses modèles.
Des doutes planent toujours sur la stratégie de Google
Les annonces présentent un visage stratégique cohérent, avec de nombreux produits conçus pour fonctionner ensemble, à l’instar de ce que Microsoft sur Azure ou Amazon Web Services. Pour autant, on peut émettre les mêmes doutes.
Google a ainsi beau fournir une multitude d’outils et services pour avancer sa vision d’un monde fonctionnant avec de multiples agents, les entreprises doivent avancer avec précaution. Le déploiement, la gestion, la surveillance et surtout l’optimisation d’un tel système demandent une planification soignée. C’est un défi opérationnel majeur, dans le sens où l’on ne peut pas transiter d’une traite vers un tel écosystème sans en mesurer les risques, notamment parce que le TCO (coût total de possession) peut être difficile à évaluer.
Outre les questions classiques de bénéfice attendu et d’enfermement dans un seul écosystème, la facilitation mise en avant par Google pose aussi question. Particulièrement Agentspace, que la firme imagine entre toutes les mains. Or, si créer des agents devient très simple, les risques liés sont toujours là, surtout s’ils sont connectés aux données de l’entreprise. Il est possible de faire fuiter par mégarde des informations, surtout avec l’arrivée d’A2A. Une entreprise pourrait se retrouver avec tout un lot d’agents plus ou moins bien pensés, qui nécessiteront tous du temps de calcul, avec les frais que cela suppose.
Il est difficile pour l’instant de savoir si la vision de Google correspond à une vraie demande, tant l’éditeur semble vouloir induire une envie de changement. Encore faut-il que les avantages soient clairs et que les clients s’y retrouvent. Au-delà de l’enthousiasme affiché par Google et des travaux et coûts engendrés, la question du retour sur investissement reste centrale. Elle s’accompagne d’ailleurs d’autres interrogations sur la fiabilité de l’ensemble, la sécurité des données, voire l’impact social d’un tel chantier.