OpenAI sort GPT-5.6 Sol et muscle son offre cyber
Grosse semaine pour OpenAI qui enchaîne deux annonces côté modèles. Lundi 22, c'est le lancement de GPT-5.5-Cyber et de Codex Security, deux briques de la gamme Daybreak dédiée à la cybersécurité. L'idée : identifier, valider et corriger des vulnérabilités à l'échelle, plutôt que de laisser un LLM généraliste deviner ce qu'il faut patcher.
On reste sur du vocabulaire marketing pour l'instant, mais le découpage est clair. GPT-5.5-Cyber joue le rôle d'analyste, Codex Security celui de patcher. Si vous bossez dans une équipe sécurité avec un volume de CVE qui dépasse la capacité humaine, ça vaut le coup de regarder le papier de présentation.
Et puis vendredi 26, rebelote avec le preview de GPT-5.6 Sol. OpenAI annonce un modèle nouvelle génération avec des gains en codage, sciences et cyber. C'est cohérent avec la trajectoire des derniers mois, où chaque release pousse plus loin le raisonnement scientifique. Le détail intéressant : Sol embarque la pile de sécurité la plus avancée d'OpenAI, ce qui laisse penser que GPT-5.5-Cyber sera la première itération à en profiter en production.
Pas encore d'API publique sur Sol, c'est un preview. Mais l'enchaînement Cyber lundi, Sol vendredi, n'est sans doute pas un hasard : OpenAI verrouille son discours sécurité avant de pousser le nouveau modèle. À surveiller la semaine prochaine, le post officiel reste avare en benchmarks.
Anthropic : Claude Tag arrive dans Slack
C'est probablement l'annonce la plus concrète de la semaine. Anthropic lance Claude Tag, qui permet de mentionner @Claude directement dans un canal Slack pour lui déléguer une tâche. Pas un bot bête qui répond à la requête en cours, un agent qui apprend du contexte du canal et bosse en asynchrone sur plusieurs tâches en parallèle.
Concrètement : vous taguez Claude dans le canal de votre équipe back, vous lui demandez d'analyser les logs d'erreur de la semaine, et il bosse pendant que vous discutez d'autre chose. Il garde en mémoire les conventions du canal, les noms de services, les habitudes de l'équipe. C'est ce travail asynchrone qui fait la différence avec un simple plugin chatbot.
La fonctionnalité est réservée aux plans Team et Enterprise, ce qui est logique vu le ciblage entreprise. Détails dans le post d'annonce et la note de release. Si vous êtes déjà sur un de ces plans, l'activation se fait côté admin Slack.
On rappellera quand même qu'Anthropic sort de quelques semaines mouvementées, entre la suspension de Fable 5 par Washington et le ménage sur les anciens modèles. Claude Tag est leur retour à du produit utile et calme, et ça fait du bien.
Gemini 3.5 Flash pilote enfin votre machine
Côté Google, l'annonce de la semaine c'est l'arrivée de Computer Use en preview publique dans Gemini 3.5 Flash. Pour ceux qui ont raté l'épisode précédent, Computer Use c'est la capacité d'un modèle à interagir avec une interface graphique : cliquer, taper, scroller, comme un humain.
La nouveauté ici, c'est que ça tourne sur Gemini 3.5 Flash, donc rapide et pas cher. Google annonce trois environnements supportés en natif : navigateur, mobile et bureau. Plus besoin de bricoler un wrapper différent pour chaque cible, l'API gère la spécificité de chaque environnement.
Deux points méritent l'attention. D'abord les actions par intention : au lieu d'envoyer des coordonnées de clic, vous décrivez l'intention ("clique sur le bouton de validation") et le modèle se débrouille. Ça simplifie sérieusement le code agent. Ensuite, la détection d'injection de prompt, qui devient critique dès qu'on lâche un agent sur un navigateur ouvert sur Internet.
Vous trouverez les détails et exemples dans le changelog officiel. À tester en sandbox avant de viser de la prod, surtout sur les workflows qui touchent à des données sensibles.
Côté API : Anthropic relève les rate limits et déprécie Opus 4.7 fast
Deux annonces plus discrètes mais utiles pour ceux qui consomment l'API Anthropic. D'abord, relèvement des rate limits sur tous les modèles. Les limites de claude-sonnet et claude-haiku sont désormais alignées sur celles de claude-opus à tous les tiers. Et les tiers eux-mêmes sont consolidés en trois catégories : Start, Build et Scale.
Anthropic précise qu'aucune organisation ne reçoit de limite inférieure à ce qu'elle avait avant. Donc c'est uniquement de la marge en plus. Pour ceux qui jonglaient entre Haiku pour le volume et Opus pour la qualité, ça simplifie la planification capacitaire.
Autre point : dépréciation du mode rapide pour Claude Opus 4.7, retrait prévu le 24 juillet 2026. Après cette date, les requêtes à claude-opus-4-7 avec speed: "fast" retourneront une erreur. Migration vers le mode rapide de claude-opus-4-8. Si vous avez un endpoint en prod qui pointe encore sur 4.7 fast, c'est le moment de planifier la migration. Les notes complètes sont sur la page des release notes API.
Ce qu'on retient
La cyber devient le terrain de bataille à la mode. OpenAI sort Daybreak et un GPT-5.6 orienté sécurité, Anthropic et Google renforcent leurs garde-fous côté agents. Logique, vu le nombre de POC qui glissent vers la prod avec des LLM qui touchent à du code et à des outils.
L'autre signal, c'est l'industrialisation des agents : Claude Tag dans Slack, Computer Use dans Gemini Flash. On est loin du démo flashy, ce sont des briques qu'on commence à pouvoir poser dans un workflow quotidien. La vraie question, c'est combien de temps avant qu'un de vos juniors demande pourquoi il devrait encore ouvrir Jira lui-même.