☕️ Face à Gemini 3 Pro, Anthropic dégaine son Claude Opus 4.5
Anthropic était manifestement prête : une semaine après le lancement en grande pompe de Gemini 3 Pro par Google, la startup réplique avec la version 4.5 de son plus gros modèle, Opus.
Dans son billet d’annonce, Anthropic est très satisfaite de présenter des scores supérieurs à ceux de Google dans pratiquement tous les tests, y compris dans ARC-AGI-2, réputé difficile : 37,6 % pour Opus 4.5, contre 31,1 % pour Gemini 3 Pro et 17,6 % pour GPT-5.1. Anthropic met surtout en avant ses performances dans le développement, où son modèle reprend la couronne, en étant notamment le premier à dépasser la barre des 80 % sur le test SWE-Bench Verified.
Anthropic en profite pour s’intégrer davantage dans certaines applications. Ses extensions pour Chrome et Excel sortent ainsi de leur phase de test, avec un Claude pour Chrome prochainement disponible pour les abonnés Claude Max, et un Claude pour Excel bientôt disponible pour les abonnés Max, Team et Enterprise.
Les abonnés Max reçoivent d’ailleurs d’autres capacités, dont un travail de fond sur la mémoire censé permettre une utilisation prolongée des requêtes dans un même contexte, même quand ce dernier atteint la limite de jetons. À TechCrunch, Anthropic explique que la mémoire de contexte sera compressée de manière transparente, ce qui devrait être particulièrement visible dans le cas où un gros modèle est utilisé pour en piloter plusieurs petits (avec Claude Haiku), dans un cadre de développement agentique.
Signalons tout de même que même si Anthropic récupère la couronne dans presque tous les tests, c’est à travers un modèle accessible uniquement par les comptes payants. Les utilisateurs gratuits ne peuvent utiliser que Haiku et Sonnet, là où Gemini 3 Pro a été diffusé dans tous les produits et pour l’ensemble des utilisateurs (avec des limites bien sûr).
