Claude Fable 5 : Anthropic ouvre au public son premier modèle de classe Mythos

Le 9 juin 2026, Anthropic lance Claude Fable 5, son modèle le plus puissant à ce jour. 80,3% sur SWE-Bench Pro, contexte 1M tokens, garde-fous intégrés et un jumeau Mythos 5 réservé à la cyberdéfense. Décryptage technique complet.

Le 9 juin 2026, Anthropic a rendu public Claude Fable 5, présenté comme son modèle le plus capable jamais mis à disposition générale. Derrière ce nom inhabituel se cache une rupture : Fable 5 est le premier modèle de classe Mythos accessible au grand public, une famille de modèles si performante en cybersécurité et en sciences du vivant qu'Anthropic avait délibérément retardé son déploiement en avril. Quelques jours seulement après avoir alerté sur le fait que « l'IA devient trop dangereuse », l'entreprise franchit le pas — mais avec des garde-fous d'un genre nouveau.

Pour les développeurs, les chercheurs et les équipes sécurité, Fable 5 n'est pas une simple itération de plus. Avec 80,3% sur SWE-Bench Pro (contre 69,2% pour Opus 4.8) et une migration de 50 millions de lignes de Ruby bouclée en une journée chez Stripe, on change de catégorie de capacité. Décortiquons ce que ce modèle apporte concrètement, et pourquoi sa sortie s'accompagne d'un dispositif de sécurité inédit dans l'industrie.

De Mythos Preview à Fable 5 : une montée en puissance assumée

L'histoire commence en avril 2026, quand Anthropic dévoile Mythos, une nouvelle classe de modèles dont les capacités dépassaient tout ce que l'entreprise avait produit. Jugées trop sensibles — notamment en cybersécurité offensive et en biologie moléculaire — ces capacités sont restées en accès restreint, sous le nom de Mythos Preview, réservé à une poignée de partenaires triés sur le volet.

Fable 5 est la réponse d'Anthropic à la question : « comment ouvrir cette puissance sans la rendre dangereuse ? ». Le modèle sous-jacent est identique à celui de la classe Mythos, mais il est livré avec un système de classifieurs de sécurité qui interceptent les requêtes à haut risque. C'est cette combinaison — capacités de pointe + garde-fous automatiques — qui rend le déploiement public possible.

Cette sortie intervient dans un contexte stratégique chargé. Anthropic vient de boucler une levée de fonds à une valorisation de 965 milliards de dollars et a déposé de façon confidentielle son prospectus d'introduction en bourse auprès de la SEC. La trajectoire est claire : comme je l'évoquais dans mon article sur la levée de fonds d'Anthropic, l'entreprise transforme son avance technique en avantage commercial avant l'IPO.

Benchmarks : un fossé qui se creuse

Les chiffres publiés par Anthropic dessinent un écart net avec la génération précédente et avec la concurrence. Voici les résultats les plus parlants.

Ingénierie logicielle : SWE-Bench Pro et FrontierCode

Sur SWE-Bench Pro, le benchmark de référence pour la résolution de tâches d'ingénierie réelles tirées de dépôts GitHub, les écarts sont francs :

  • Claude Fable 5 : 80,3%
  • Claude Opus 4.8 : 69,2%
  • GPT-5.5 : 58,6%
  • Gemini 3.1 Pro : 54,2%

L'écart est encore plus spectaculaire sur FrontierCode, un benchmark de Cognition qui mesure les tâches de code les plus exigeantes en conditions de production. Fable 5 y atteint 29,3%, soit plus du double d'Opus 4.8 (13,4%) et près de cinq fois le score de GPT-5.5 (5,7%). Sur ce type de problème, la plupart des modèles plafonnent encore très bas — ce qui rend le bond de Fable 5 d'autant plus notable.

Le témoignage de Stripe résume l'impact terrain : une migration sur une base de code Ruby de 50 millions de lignes, qui aurait pris plus de deux mois à une équipe entière, a été réalisée en une seule journée. GitHub évoque de son côté « un niveau d'autonomie et de fiabilité qui dépasse les références précédentes », et Cursor parle de « problèmes à horizon long qui étaient hors de portée ».

Vision, finance et analytique

Fable 5 atteint l'état de l'art en vision : il extrait des chiffres précis depuis des captures d'écran et peut reconstruire du code à partir d'une simple image d'interface. Sur le benchmark financier de Hebbia — analyse de tableaux et interprétation de données financières — il obtient le meilleur score tous modèles confondus. Et sur un benchmark d'analytique, c'est le premier modèle à franchir la barre des 90%.

Capacités agentiques et mémoire persistante

Là où Fable 5 brille particulièrement, c'est dans les tâches à horizon long qui exploitent la mémoire persistante. Sur le jeu Slay the Spire, le modèle multiplie ses performances par trois lorsqu'il peut prendre des notes et y revenir. Cette capacité à « apprendre de ses propres traces » sur des millions de tokens est au cœur de ce que je décrivais dans mon panorama des agents IA autonomes en 2026 : la prochaine génération d'IA ne se contente plus de répondre, elle planifie et persévère.

Spécifications techniques et tarification

Fable 5 conserve le contexte de 1 million de tokens à tarif standard, sans surcoût longue distance, et une sortie pouvant atteindre 128K tokens. Côté raisonnement, le modèle s'inscrit dans la lignée d'Opus 4.7/4.8 avec le thinking adaptatif : c'est le modèle qui décide quand et combien réfléchir, sans budget de tokens fixe à régler manuellement.

La tarification, en revanche, marque une rupture : 10 $ par million de tokens en entrée et 50 $ par million en sortie, soit le double d'Opus 4.8 (5 $ / 25 $). C'est le prix de la classe Mythos. À noter pour les développeurs : le modèle est exposé via l'identifiant claude-fable-5, et impose le thinking adaptatif (un thinking explicitement désactivé renvoie une erreur 400 — il faut simplement omettre le paramètre).

CaractéristiqueClaude Fable 5Claude Opus 4.8
Contexte1M tokens1M tokens
Sortie max128K tokens128K tokens
Prix entrée10 $ / M tokens5 $ / M tokens
Prix sortie50 $ / M tokens25 $ / M tokens
SWE-Bench Pro80,3%69,2%
Garde-fous classe MythosOuiNon

Des garde-fous d'un nouveau genre

C'est la véritable singularité de ce lancement. Sans protection, les capacités de Fable 5 en cybersécurité, biologie, chimie et distillation de modèles pourraient être détournées pour causer de réels dégâts. Anthropic a donc construit un dispositif de sécurité qui fonctionne au niveau du modèle, en temps réel.

Comment ça marche concrètement

Le mécanisme repose sur des classifieurs IA qui surveillent trois domaines à haut risque :

  1. Cybersécurité : blocage de l'exploitation de vulnérabilités et du hacking offensif.
  2. Biologie et chimie : interception des requêtes liées à la conception d'agents pathogènes (Mythos 5 dépasse les modèles spécialisés sur la conception de virus AAV, d'où la prudence).
  3. Distillation : prévention de l'extraction des capacités du modèle vers des concurrents.

Quand une requête est jugée à risque, elle n'est pas refusée sèchement : elle est automatiquement reroutée vers le modèle Claude Opus 4.8, moins puissant sur ces domaines sensibles. L'utilisateur obtient une réponse, mais sans les capacités de classe Mythos. Selon Anthropic, ce reroutage ne se déclenche en moyenne que dans moins de 5% des sessions — l'immense majorité des usages légitimes n'est jamais affectée.

Une robustesse mise à l'épreuve

Anthropic a soumis ses classifieurs à un examen sévère avant la sortie. En interne, 400 tentatives de jailbreak réparties sur 10 tâches sensibles ont abouti à 0% de succès. En externe, un programme de bug bounty a mobilisé plus de 1 000 heures de test sans qu'aucun jailbreak universel ne soit trouvé. Sur 30 techniques de contournement testées, aucune demande nuisible n'a été satisfaite.

Cette approche tranche avec les attaques de type prompt injection qui ont fait tomber les garde-fous de modèles concurrents, comme je le détaillais à propos de GRP-Obliteration. Anthropic mise ici sur une défense en profondeur, contrôlée au niveau de l'inférence plutôt que par simple filtrage de prompt.

Claude Mythos 5 : le jumeau réservé aux cyberdéfenseurs

En parallèle de Fable 5, Anthropic lance Claude Mythos 5 — exactement le même modèle, mais avec les garde-fous cybersécurité levés. Il est décrit comme possédant « les capacités de cybersécurité les plus puissantes de tous les modèles au monde ».

Sur ExploitBench, un benchmark de cybersécurité offensive, l'écart est éloquent :

  • Mythos 5 : 78%
  • Mythos Preview : 69%
  • Opus 4.8 : 40%

Mythos 5 n'est pas en libre accès. Il est déployé initialement via Project Glasswing, en collaboration avec le gouvernement américain, et destiné à un petit groupe de cyberdéfenseurs et de fournisseurs d'infrastructures critiques. L'idée : mettre la puissance offensive entre les mains de ceux qui défendent, avant qu'elle ne tombe dans celles des attaquants. Le programme prévoit une extension progressive, notamment vers la biologie.

Sciences du vivant : un saut qualitatif

Au-delà du code, c'est en recherche scientifique que la classe Mythos impressionne le plus. Sur des hypothèses de biologie moléculaire, le modèle est préféré aux modèles Opus dans environ 80% des cas par des évaluateurs experts. En génomique, une plateforme a traité des données single-cell de millions de cellules issues de 138 espèces animales, en autonomie pendant plus d'une semaine, en produisant un modèle de machine learning 100 fois plus petit que celui publié dans la revue Science.

L'Allen Institute qualifie Mythos 5 de modèle « de niveau chercheur senior ». Anthropic évoque une accélération d'environ 10x pour la conception de protéines thérapeutiques. Ce sont précisément ces capacités qui justifient les garde-fous biologie/chimie de Fable 5 : un outil capable de concevoir des thérapies l'est aussi, en théorie, de concevoir des pathogènes.

Disponibilité et politique de rétention

Fable 5 est disponible immédiatement via l'API Claude et sur les principales plateformes cloud (AWS, Google Cloud Vertex AI, Microsoft Foundry). Pour les abonnés, il est inclus dans les plans Pro, Max, Team et Enterprise jusqu'au 22 juin ; au-delà, son utilisation nécessitera des crédits d'usage.

Un point mérite l'attention des entreprises soucieuses de confidentialité : avec la classe Mythos, Anthropic impose une rétention de 30 jours sur tout le trafic, y compris pour les clients qui bénéficiaient auparavant d'une rétention zéro. Ces données ne servent pas à l'entraînement — elles sont conservées exclusivement à des fins de sécurité (détection d'attaques complexes et de jailbreaks), avec accès humain journalisé et suppression après 30 jours. C'est un compromis assumé entre ouverture des capacités et maîtrise des risques.

FAQ

Quelle est la différence entre Claude Fable 5 et Claude Mythos 5 ?

Il s'agit du même modèle sous-jacent, de classe Mythos. Fable 5 est la version publique, livrée avec des classifieurs de sécurité qui reroutent les requêtes à haut risque (cybersécurité, biologie/chimie, distillation) vers Claude Opus 4.8. Mythos 5 est la version sans garde-fous cybersécurité, réservée à un cercle restreint de cyberdéfenseurs via Project Glasswing, en lien avec le gouvernement américain. En clair : Fable 5 pour tous, Mythos 5 pour les experts accrédités.

Fable 5 vaut-il son prix, deux fois plus élevé qu'Opus 4.8 ?

Cela dépend du cas d'usage. À 10 $/50 $ par million de tokens contre 5 $/25 $ pour Opus 4.8, Fable 5 coûte le double. Pour des tâches courantes (résumé, classification, génération simple), Opus 4.8 ou Sonnet 4.6 restent plus rentables. Mais sur les problèmes à horizon long — migrations massives, refactoring de gros codebases, recherche scientifique — l'écart de capacité (80,3% vs 69,2% sur SWE-Bench Pro) peut justifier le surcoût, surtout quand une journée de Fable 5 remplace deux mois de travail humain comme chez Stripe.

Les garde-fous de Fable 5 gênent-ils les usages légitimes en cybersécurité ?

Marginalement. Le rerouting vers Opus 4.8 ne s'active en moyenne que dans moins de 5% des sessions. Un pentester travaillant sur un audit autorisé, un chercheur en sécurité défensive ou un développeur corrigeant des vulnérabilités ne devraient pas être bloqués dans la majorité des cas. Le système cible l'exploitation offensive et la création d'outils d'attaque, pas la sécurité défensive. Pour des besoins offensifs légitimes à grande échelle, c'est Mythos 5 (via Project Glasswing) qui est la voie prévue.

Comment utiliser Claude Fable 5 dans mes propres applications ?

Via l'API Claude, en spécifiant l'identifiant de modèle claude-fable-5. Le modèle impose le thinking adaptatif (thinking: {type: "adaptive"}) ; les paramètres d'échantillonnage comme temperature ou top_p et l'ancien budget_tokens renvoient une erreur 400. Pensez à activer le streaming pour les sorties volumineuses afin d'éviter les timeouts. Pour démarrer, l'approche la plus simple reste le SDK officiel Anthropic, comme je le montre dans mon article sur Claude Code.

Pourquoi Anthropic a-t-il attendu pour publier ce modèle ?

Parce que les capacités de classe Mythos sont à double usage. En cybersécurité comme en biologie, le même modèle qui aide à défendre peut aider à attaquer. Anthropic avait d'abord limité l'accès (Mythos Preview) le temps de développer et de tester des garde-fous robustes. La publication de Fable 5 n'a été rendue possible qu'après validation des classifieurs : 0% de succès sur 400 tentatives internes de jailbreak, et plus de 1 000 heures de bug bounty externe sans contournement universel.

Conclusion : la puissance sous condition

Claude Fable 5 illustre une bascule dans la manière dont l'industrie de l'IA aborde ses modèles les plus puissants. Ce n'est plus seulement une question de performance brute — même si, avec 80,3% sur SWE-Bench Pro et des résultats de pointe en finance, vision et sciences, la performance est bien là. C'est désormais une question d'équilibre entre capacité et responsabilité.

En séparant un modèle public sous garde-fous (Fable 5) d'un modèle expert sans bride (Mythos 5), Anthropic propose un modèle de gouvernance qui pourrait faire école : ouvrir largement ce qui est sûr, réserver strictement ce qui ne l'est pas, et instrumenter le tout avec des défenses vérifiables. Reste à voir si ce compromis — y compris la rétention obligatoire de 30 jours — sera accepté par les entreprises les plus exigeantes sur la confidentialité.

Pour les développeurs et les équipes techniques, le message est limpide : la barre vient de monter d'un cran. Les tâches que l'on confiait hier à plusieurs ingénieurs sur plusieurs semaines deviennent, pour certaines, l'affaire d'une session bien cadrée. À nous de cadrer ces sessions intelligemment — et de garder la main sur ce que ces modèles produisent.

Cet article vous a plu ?

Commentaires

Morgann Riu

Expert en cybersécurité et administration Linux. J'aide les entreprises à sécuriser et optimiser leurs infrastructures critiques.

Retour au blog

Checklist Sécurité Linux

30 points essentiels pour sécuriser un serveur Linux. Recevez aussi les nouveaux tutoriels par email.

Pas de spam. Désabonnement en 1 clic.