OpenAI débarque sur AWS, GPT-Rosalind muscle la bio, Opus 4.1 prend sa retraite

OpenAI et AWS, le mariage qu'on n'attendait plus

C'est probablement l'annonce la plus politique de la semaine. OpenAI a officialisé le 1er juin la disponibilité de ses modèles Frontier et de Codex sur AWS. Oui, AWS. Le cloud du concurrent historique d'Azure, qui héberge la plupart de vos workloads Anthropic via Bedrock.

Concrètement, si votre infra tourne déjà sur AWS, vous n'avez plus besoin de jongler avec un compte Azure ou un appel sortant vers l'API publique d'OpenAI pour faire tourner gpt-frontier ou codex. Vous restez dans votre VPC, vos logs CloudWatch, votre IAM. Pour les boîtes qui passaient leur temps à expliquer au RSSI pourquoi un appel sortait vers api.openai.com, c'est une vraie simplification.

Le détail intéressant, c'est ce que ça dit du marché. Il y a deux ans, personne n'aurait parié là-dessus. Aujourd'hui, OpenAI a besoin d'être partout où vivent les workloads d'entreprise, et AWS a besoin de ne pas laisser Anthropic seul sur Bedrock. Tout le monde y trouve son compte, sauf peut-être Microsoft. Les détails côté disponibilité régionale et tarifs sont dans l'annonce officielle.

GPT-Rosalind se prend pour un chercheur en sciences de la vie

OpenAI a aussi mis à jour GPT-Rosalind, son modèle spécialisé pour la recherche biomédicale. Le pitch : un raisonnement biologique plus fin, de l'expertise en chimie médicinale, de l'analyse génomique, et la capacité de gérer des flux de travail expérimentaux.

Traduit pour ceux qui ne sortent pas d'un labo : le modèle sait raisonner sur des cascades de réactions biochimiques, proposer des modifications de molécules candidates, lire des données de séquençage et orchestrer les étapes d'un protocole. Ce n'est pas un chatbot qui résume PubMed, c'est plus proche d'un copilote pour des équipes R&D pharma.

On reste sur un cas d'usage très spécialisé, donc pour la plupart d'entre nous c'est anecdotique. Mais c'est un signal : OpenAI continue de fragmenter son offre verticalement plutôt que de tout pousser sur un modèle généraliste géant. Les détails sur le blog OpenAI.

ChatGPT et la mémoire qui rêve

Plus grand public mais pas inintéressant : ChatGPT déploie un nouveau système de mémoire. L'idée, c'est que le modèle retient mieux vos préférences au fil des conversations, et garde un contexte pertinent entre les sessions.

OpenAI parle de "memory dreaming" dans son URL, ce qui laisse entendre une consolidation type sommeil paradoxal : le modèle trie ce qu'il garde, ce qu'il oublie, ce qu'il fusionne. On verra à l'usage si ça change vraiment quelque chose ou si c'est un upgrade cosmétique du système actuel. Pour les devs qui construisent sur l'API, la vraie question c'est de savoir si ces mécanismes finiront exposés côté Assistants API. Annonce ici.

Anthropic enterre Opus 4.1 sur tous les fronts

Côté Anthropic, c'est le grand nettoyage. Claude Opus 4.1 (claude-opus-4-1-20250805) est officiellement déprécié, avec un retrait de l'API prévu pour le 5 août 2026. La migration recommandée se fait vers Claude Opus 4.8, le modèle sorti la semaine dernière avec son million de tokens par défaut.

L'annonce a été synchronisée sur tous les SDK la même journée :

vertex-sdk v0.17.0 pour Google Cloud Vertex AI
bedrock-sdk v0.30.0 pour AWS Bedrock
aws-sdk v0.4.0 pour le client AWS dédié
anthropic-sdk-python v0.106.0

Bonus dans ces versions : un support des middlewares côté client. Vous pouvez maintenant intercepter les requêtes et réponses dans le pipeline, ce qui est pratique pour logger, ajouter des headers d'auth custom, ou faire du rate limiting applicatif sans wrapper toute la lib.

Si vous tournez encore en prod sur Opus 4.1, vous avez deux mois pour migrer. Ce n'est pas énorme, surtout si vous avez des prompts longuement optimisés pour cette version. Pensez à benchmarker Opus 4.8 sur vos cas d'usage avant la deadline, on a vu plus d'une fois des régressions sur des tâches très spécifiques en passant d'une version majeure à l'autre. Le détail dans les release notes de l'API.

Google ferme Gemini 2.0

Dans la même veine ménage de printemps, Google retire les modèles Gemini 2.0 : gemini-2.0-flash, gemini-2.0-flash-001, gemini-2.0-flash-lite et gemini-2.0-flash-lite-001. La migration pousse vers gemini-3.5-flash ou gemini-3.1-flash-lite.

Rien de surprenant ici, on était sur la lignée 2.0 depuis fin 2024, c'est devenu un fossile à l'échelle du rythme actuel. Si vous avez encore ces identifiants en dur dans du code, c'est le moment de faire un grep. Le changelog officiel liste les dates précises.

Ce qu'il faut retenir

Cette semaine, c'est surtout du nettoyage de plateforme. OpenAI consolide sa présence multi-cloud, Anthropic et Google enterrent des modèles devenus obsolètes en moins d'un an. Le rythme de dépréciation s'accélère, et il devient indispensable de traiter les noms de modèles comme des variables d'environnement, pas comme des constantes en dur.

On note aussi que l'écosystème SDK mûrit : les middlewares chez Anthropic, c'est exactement le genre de détail qui montre qu'on est passé de "prototype qui marche" à "outil utilisé en prod". Tant mieux.