Google sort Gemini 3.5 Flash et pousse ses agents managés
C'était la conférence I/O cette semaine, et Google n'a pas fait dans la demi-mesure. Le nouveau Gemini 3.5 arrive avec sa déclinaison Gemini 3.5 Flash en disponibilité générale, présentée comme leur modèle le plus solide pour le code et les tâches agentiques. Pour ceux qui suivent la cadence, on est passés de 2.5 à 3.5 en un cycle, et clairement Google veut reprendre l'initiative face à GPT-5.5 sorti il y a deux semaines.
Le modèle est déjà dispo dans l'API. Les SDK python-genai et js-genai sont passés en version 2.5.0 dès le lendemain pour intégrer le nouveau modèle. Si vous étiez sur gemini-2.5-flash, le swap se fait en changeant la string de modèle, rien de plus.
Plus intéressant pour nous : les agents managés arrivent en preview dans l'API Gemini. L'idée, c'est de pouvoir lancer un agent qui planifie, raisonne, écrit et exécute du code, le tout dans un environnement isolé géré par Google. L'agent Antigravity est l'exemple mis en avant. Concrètement, vous décrivez la tâche, l'agent décompose, itère sur le code, et vous récupérez le résultat sans avoir à orchestrer la boucle vous-même.
C'est le même mouvement de fond qu'on voit partout : déplacer la complexité agentique côté serveur du provider. Pratique pour démarrer vite, moins pratique le jour où on veut auditer ce qui se passe vraiment. À voir si Google ouvre les traces d'exécution proprement.
Côté grand public, Google a aussi lancé un plan AI Ultra à 100 dollars par mois, avec des fonctionnalités enrichies pour les abonnés AI Plus, Pro et Ultra. C'est l'alignement attendu sur le tarif premium de la concurrence. Pas grand-chose à en dire côté dev, c'est une offre conso.
Anthropic ouvre MCP aux réseaux privés et lâche les sandboxes auto-hébergées
Pendant que Google fait son show, Anthropic avance sur un terrain plus technique mais franchement utile pour les équipes en entreprise. La grosse annonce, ce sont les tunnels MCP en preview de recherche, qui permettent à Claude de se connecter à des serveurs MCP hébergés dans un réseau privé.
Jusqu'ici, si vous vouliez brancher Claude sur un serveur MCP interne, il fallait soit l'exposer publiquement, soit jouer avec des reverse proxies bricolés. Avec les tunnels, vous établissez une connexion sortante depuis votre infra vers Anthropic, et Claude peut taper sur vos outils internes sans que vous ouvriez le moindre port en entrée. Pour les boîtes avec un SecOps un peu sérieux, ça change tout.
Dans la même release, les sandboxes auto-hébergées arrivent pour les Claude Managed Agents. Vous pouvez maintenant faire tourner les outils des agents sur votre propre infrastructure, au lieu de l'infra d'Anthropic. Ça veut dire que vos données sensibles n'ont pas besoin de transiter par leurs serveurs pour les opérations de tooling. Bonus pratique : les configurations serveur MCP et outils peuvent être mises à jour pendant une session active, sans la redémarrer.
Petit détail qui va éviter quelques surprises : les sorties qui dépassent 100K tokens sont automatiquement écrites dans un fichier au lieu d'être renvoyées inline. Si vous avez déjà vu un agent essayer de cracher un gros JSON dans une réponse et faire exploser votre client, vous savez pourquoi c'est une bonne idée. Tout ça est documenté dans les release notes de l'API.
Outil web search d'Anthropic : les données SEC mieux structurées
Plus discret mais pertinent pour ceux qui font du RAG financier, l'outil de recherche web d'Anthropic retourne désormais des données SEC enrichies. Ce sont les filings officiels américains (10-K, 10-Q, 8-K et compagnie), avec sources primaires et citations propres.
Si vous bricolez un agent qui analyse les résultats trimestriels d'une boîte cotée, ou qui prépare des notes de diligence raisonnable, vous gagnez un cran de fiabilité. Plus besoin de parser EDGAR à la main ou de prier pour que le LLM ne s'invente pas un chiffre. La sortie inclut les citations vers les documents originaux, ce qui aide pour l'audit et la conformité.
C'est typiquement le genre d'amélioration qui ne fait pas la une mais qui économise des jours de dev sur un projet fintech.
Ce qu'on retient
La tendance de fond est claire : tout le monde pousse maintenant sur les agents managés, avec une vraie attention portée aux contraintes entreprise. Anthropic mise sur le contrôle (sandboxes chez vous, tunnels vers vos réseaux), Google mise sur la simplicité (agents tout-en-un côté provider). Les deux approches ont leur public.
Pour les équipes qui hésitent encore à passer en prod sur du agentique, les briques d'isolation réseau et d'exécution privée deviennent enfin sérieuses. Reste à voir qui aura les meilleurs outils d'observabilité, parce que débugger un agent en prod sans traces propres, ça reste l'enfer.