Claude Fable 5 et Mythos 5 : lancés mardi, débranchés jeudi
Le 9 juin, Anthropic sort Claude Fable 5, présenté comme son modèle le plus performant à date, ainsi que Claude Mythos 5, une variante avec moins de garde-fous réservée aux participants du projet Glasswing. Les deux modèles tournent par défaut avec une fenêtre de contexte d'1 million de tokens et jusqu'à 128 000 tokens en sortie. Sur le papier, c'était la grosse annonce de la semaine.
Côté tarif, Anthropic affiche 10 $ par million de tokens d'entrée et 50 $ par million de tokens de sortie. C'est dans la fourchette haute mais cohérent avec ce qu'on attend d'un modèle de classe Mythos. Anthropic met en avant des perfs solides en ingénierie logicielle, avec des cas clients où des migrations de code entières sont bouclées en une journée. Mythos 5, lui, embarque des capacités cybersécurité avancées, ce qui explique pourquoi il n'est pas en accès public.
Côté API, l'identifiant du modèle est claude-fable-5, et il y a une nouvelle API de comptage de tokens à utiliser pour estimer les coûts avant de lancer une requête. Détail sympa pour le portefeuille : les requêtes refusées avant génération de sortie ne sont pas facturées. Les release notes sont sur docs.anthropic.com.
Et puis le 12 juin, coup de théâtre. Le gouvernement américain ordonne la suspension immédiate de l'accès à Fable 5 et Mythos 5 pour tous les clients, en invoquant des raisons de sécurité nationale liées à des méthodes de contournement des modèles. Anthropic confirme dans un communiqué officiel que les deux modèles sont désactivés et promet un rétablissement dès que possible. Les autres modèles de la gamme restent disponibles.
Donc concrètement, si vous aviez commencé à porter vos pipelines vers claude-fable-5 en début de semaine, vous avez sans doute passé jeudi à rebasculer vers Opus 4.8. C'est la première fois qu'on voit une directive gouvernementale couper un modèle commercial trois jours après son lancement. Aucun calendrier de retour n'est annoncé pour l'instant, et Anthropic reste vague sur ce qui sera changé pour obtenir le feu vert. À surveiller de près, parce que ça crée un précédent assez inédit dans l'industrie.
Notion + Codex : la stack qui transforme dix devs en cinquante
Pendant qu'Anthropic gérait sa crise, OpenAI publiait une étude de cas sur l'utilisation de Codex chez Notion. Le pitch est intéressant pour quiconque bosse dans une petite équipe d'ingé : Notion utilise Codex pour générer des specs complètes en un seul prompt, et pour développer leur nouvelle saisie vocale sur le web.
L'idée n'est pas de remplacer les devs, mais de leur retirer les phases ingrates. Écrire une spec technique qui prend habituellement une demi-journée, Notion le fait passer Codex en premier jet, puis un humain repasse pour valider et ajuster. Sur la fonctionnalité de saisie vocale, ils ont utilisé Codex pour itérer sur les composants front et la pipeline audio, en parallèle de leur équipe produit.
Le retour qu'ils donnent, c'est qu'une équipe de dix ingés produit ce qu'une équipe de cinquante produisait avant. À prendre avec des pincettes, c'est un témoignage client publié par OpenAI, donc forcément orienté. Mais l'usage décrit colle avec ce qu'on entend ailleurs : Codex marche bien sur les tâches bien cadrées, moins sur l'architecture globale. Détails complets sur openai.com/index/notion.
Pour ceux qui veulent reproduire le pattern, l'approche Notion ressemble à ça :
- Décrire l'intention produit en langage naturel, avec contraintes et critères d'acceptation, puis demander à Codex un brouillon de spec technique avec API, modèles de données et flux utilisateur.
- Faire revoir la spec par un humain, modifier, puis la repasser à Codex avec la consigne d'implémenter par modules.
- Garder un dev senior pour la revue de PR et les décisions d'archi, pas pour taper chaque ligne.
Rien de révolutionnaire, mais c'est le premier témoignage public concret sur cette boucle complète. La semaine dernière, on parlait des agents managés de Google qui codent tout seuls. Cette semaine, on a un cas client réel qui montre que le bottleneck n'est plus la génération, c'est la revue.
Ce qu'il faut retenir
L'histoire Fable 5 va marquer les esprits, pas tant pour le modèle lui-même que pour la rapidité de la suspension. Les fournisseurs vont devoir réfléchir à comment communiquer sur la stabilité de leur catalogue quand un État peut tirer la prise en 72 heures. Côté boulot quotidien, le cas Notion confirme une tendance qu'on voit s'installer : les équipes qui industrialisent l'usage des assistants de code en sortent vraiment plus productives, mais à condition d'investir dans le process de revue, pas juste dans le prompt.