🧠 Claude Opus 4.8 : l'IA agentique franchit un nouveau palier

Claude Opus 4.8 : 69,2 % en codage agentique, 83,4 % en computer use. Anthropic lance son meilleur modèle et atteint 965 milliards de valorisation.

![Claude Opus 4.8 — Anthropic lance son nouveau modèle frontier](https://www-cdn.anthropic.com/images/4zrzovbb/website/0eaa0ed2dce9810169112e1c77de2585fcf1f5c2-2880x1620.jpg) Anthropic a lancé Claude Opus 4.8 le 28 mai 2026, et les chiffres qui accompagnent cette sortie sont difficiles à ignorer : 69,2 % en codage agentique, 83,4 % en utilisation autonome d'ordinateur, un score de knowledge work qui écrase GPT-5.5 de 121 points. Pour les professionnels qui misent sur l'IA pour automatiser leur quotidien, ce n'est pas une simple mise à jour de version. ## Qu'est-ce que Claude Opus 4.8 et pourquoi Anthropic le lance maintenant ? Claude Opus 4.8 est le nouveau modèle frontier d'Anthropic, c'est-à-dire la référence absolue de la gamme en termes de capacités brutes. Contrairement aux modèles Sonnet ou Haiku, taillés pour les usages légers ou les interfaces conversationnelles, l'Opus cible les tâches complexes et longues : raisonnement en plusieurs étapes, génération de code critique, orchestration d'agents autonomes et analyse approfondie de données. Le modèle est disponible immédiatement sur Claude.ai, l'API Anthropic avec l'identifiant claude-opus-4-8, et les trois grandes plateformes cloud, Amazon Bedrock, Google Cloud Vertex AI et Microsoft Foundry. Côté tarification, Anthropic maintient les prix d'Opus 4.7 : 5 dollars par million de tokens en entrée et 25 dollars par million en sortie, mais rend le mode rapide (fast mode, c'est-à-dire 2,5 fois la vitesse nominale) trois fois moins cher qu'auparavant. Ce lancement intervient aussi dans un contexte financier inédit pour Anthropic : la société vient de boucler une levée de 65 milliards de dollars qui la valorise à 965 milliards, avec un chiffre d'affaires annualisé de 47 milliards, confirmant que l'IA générative de qualité professionnelle est désormais un marché de masse. ## Claude Opus 4.8 est-il vraiment meilleur que GPT-5.5 et Gemini 3.1 Pro sur les benchmarks ? Anthropic a publié quatre indicateurs comparatifs clés au moment du lancement, tous issus de benchmarks standardisés et reproductibles. Sur SWE-Bench Pro, qui mesure la capacité à résoudre des tickets de code réels tirés de projets open-source, Opus 4.8 atteint 69,2 %, contre 64,3 % pour son prédécesseur direct et seulement 58,6 % pour GPT-5.5. L'écart est encore plus marqué sur OSWorld-Verified, le test de référence pour l'utilisation autonome d'un système d'exploitation, où le modèle atteint 83,4 %. Le GDPval-AA, qui évalue le travail de connaissance et de traitement de l'information en contexte professionnel, donne 1 890 points à Opus 4.8 contre 1 769 à GPT-5.5 et 1 314 à Gemini 3.1 Pro. Enfin, Anthropic précise qu'Opus 4.8 est quatre fois moins susceptible de manquer des erreurs dans le code qu'il produit lui-même, une amélioration qui réduit mécaniquement le temps de relecture et de débogage des équipes techniques. | Benchmark | Claude Opus 4.8 | GPT-5.5 | Gemini 3.1 Pro | Claude Opus 4.7 | |---|---|---|---|---| | SWE-Bench Pro (codage agentique) | **69,2 %** | 58,6 % | 54,2 % | 64,3 % | | OSWorld-Verified (computer use) | **83,4 %** | n.c. | n.c. | n.c. | | GDPval-AA (knowledge work) | **1 890** | 1 769 | 1 314 | n.c. | | Fast mode (vitesse × 2,5) | **3× moins cher** | n.c. | n.c. | référence | Ces chiffres placent Opus 4.8 au sommet du classement sur la majorité des axes mesurés, avec une avance particulièrement nette sur les tâches qui impliquent des boucles agentiques longues, là où la précision et l'autonomie comptent le plus. ![Tableau comparatif des benchmarks Claude Opus 4.8 vs GPT-5.5 et Gemini 3.1 Pro](https://computingforgeeks.com/wp-content/uploads/2026/05/claude-opus-4-8-released-features-benchmarks-benchmark-chart.png) ## Comment les dynamic workflows révolutionnent-ils l'autonomie des agents IA ? La nouveauté architecturale la plus importante d'Opus 4.8 n'est pas un score de benchmark, mais une capacité appelée dynamic workflows. Concrètement, lorsqu'on confie une tâche de grande envergure à Claude Code ou à un agent basé sur Opus 4.8, le modèle peut désormais créer automatiquement des sous-agents parallèles : chacun prend en charge un segment distinct du problème, planifie sa partie, l'exécute, la vérifie, et un orchestrateur central fusionne l'ensemble des résultats. Cette approche permet de traiter des projets qui dépassaient jusqu'ici les limites d'un seul agent séquentiel, qu'il s'agisse de remanier une base de code de plusieurs milliers de lignes, de générer un rapport financier multi-sources ou de construire un pipeline d'automatisation métier complet. Anthropic le résume avec sobriété : > "Sharper judgement, more honesty about its progress, and the ability to work independently for longer than its predecessors." > — Anthropic, annonce officielle de Claude Opus 4.8, 28 mai 2026 Pour les indépendants, les PME et les professionnels qui n'ont pas d'équipe technique dédiée, cette évolution représente un saut qualitatif dans ce qu'on peut déléguer à un agent IA. Comprendre comment concevoir ces orchestrations parallèles, les connecter à des API externes et les superviser sans coder, c'est exactement l'objet de la formation [Automatiser ses workflows et créer des agents IA](https://www.travelearn.fr/formation/automatiser-ses-workflows-et-crer-des-agents-ia), qui couvre le passage de l'automatisation ponctuelle à la mise en place de systèmes agentiques durables. --- **Sources** - [Claude Opus 4.8 launches today with agentic improvements, new features — 9to5Google](https://9to5google.com/2026/05/28/claude-opus-4-8-launches-today-with-agentic-improvements-new-features/) - [Claude Opus 4.8: Features, Benchmarks, Claude Code — ComputingForGeeks](https://computingforgeeks.com/claude-opus-4-8-released-features-benchmarks/) - [Anthropic vaults to a $965 billion valuation with new funding — US News](https://www.usnews.com/news/technology/articles/2026-05-28/anthropic-vaults-to-a-965-billion-valuation-with-new-funding-as-claude-demand-surges) - [Claude Opus 4.8 Review 2026: Pricing, Benchmarks, vs 4.7 — TokenMix Blog](https://tokenmix.ai/blog/claude-opus-4-8-review-pricing-benchmark)