🦁 Mistral Medium 3.5 : 128B open-weight face aux géants fermés

Mistral lance Medium 3.5, 128B dense open-weight : 77,6 % sur SWE-Bench, moitié moins cher que Claude Sonnet, auto-hébergeable sur 4 GPU.

![Mistral Medium 3.5 rivalise avec Kimi K2.5, GLM 5.1 et Qwen3.5 sur 6 benchmarks agentiques](https://cms.mistral.ai/assets/9d0ff7f3-55ad-4ea9-83c0-b16e53bc4ea5.png) Mistral AI vient de lancer son nouveau modèle phare le 29 avril 2026 : Medium 3.5, un modèle dense de 128 milliards de paramètres publié en open weights sous licence MIT. Pour la première fois, une startup européenne propose un modèle capable de rivaliser avec Claude Sonnet ou DeepSeek sur des benchmarks de code réel, tout en étant auto-hébergeable sur seulement quatre GPU. ## Qu'est-ce que Mistral Medium 3.5, et pourquoi cette annonce change la donne ? Mistral AI, la startup parisienne fondée en 2023, a pris le pari risqué de tout consolider dans un seul modèle dense de 128 milliards de paramètres, là où la tendance industrielle favorisait les architectures MoE (Mixture-of-Experts, c'est-à-dire des architectures qui n'activent qu'une fraction des paramètres à chaque requête). Avec Medium 3.5, tous les 128 milliards de paramètres sont actifs à chaque inférence, ce qui le rend plus prévisible et plus simple à optimiser pour les équipes qui souhaitent le déployer en interne. La fenêtre de contexte atteint 256 000 tokens, soit l'équivalent de plusieurs centaines de pages traitées en une seule fois, ce qui ouvre la voie à l'analyse de bases de code complètes, de transcriptions longues ou de dossiers réglementaires. Ce modèle remplace deux anciens spécialistes de Mistral en une version unifiée : Devstral 2, dédié au code, et Magistral, conçu pour le raisonnement avancé. Cette fusion signifie qu'il n'est plus nécessaire de choisir quel modèle appeler selon la tâche, ce qui simplifie considérablement les architectures d'agents IA en production. La licence MIT modifiée autorise un usage commercial et une redistribution des poids, différenciant Mistral des modèles fermés américains tout en maintenant quelques restrictions sur les usages les plus sensibles. ## Que valent ses performances face aux modèles de référence ? Le benchmark SWE-bench Verified est aujourd'hui la référence la plus surveillée pour évaluer la capacité d'un modèle à corriger de vraies erreurs dans du code open source, un proxy direct de son utilité en entreprise. Mistral Medium 3.5 y atteint 77,6 %, un score qui dépasse son prédécesseur Devstral 2 (72,2 %) et se place à seulement 2 points de Claude Sonnet 4.6 (79,6 %), pourtant un modèle fermé vendu deux fois plus cher à l'API. Face aux mastodontes en paramètres (DeepSeek V4-Pro à 1 600B, Kimi K2.5 à 1 000B, Qwen3.5 à 397B), Medium 3.5 tire parti de son architecture dense pour proposer une latence et une consommation mémoire bien inférieures, ce qui pèse autant que le score brut dans un contexte de déploiement réel. Sur les benchmarks agentiques spécialisés développés par Mistral (τ¹), le modèle atteint 91,4 % en télécom et 76,1 % en retail, des secteurs où l'orchestration de multiples outils en temps réel est critique. Le modèle supporte également la décompression spéculative EAGLE, un mécanisme qui prédit plusieurs tokens en avance pour réduire la latence d'environ 29 % et augmenter le débit de 1,4× dans des conditions de faible concurrence. | Modèle | Éditeur | Paramètres | Licence | SWE-Bench Verified | Prix input/M tokens | |---|---|---|---|---|---| | **Mistral Medium 3.5** | Mistral AI 🇫🇷 | 128B dense | MIT modifiée | **77,6 %** | **1,50 $** | | Claude Sonnet 4.6 | Anthropic 🇺🇸 | Non divulgué | Fermé | 79,6 % | 3,00 $ | | DeepSeek V4-Pro | DeepSeek 🇨🇳 | 1 600B MoE (49B actifs) | MIT | 80,6 % | ~0,27 $ | | Kimi K2.5 | Moonshot AI 🇨🇳 | 1 000B MoE | Apache 2.0 | ~78 % | ~0,80 $ | | Qwen3.5 397B | Alibaba 🇨🇳 | 397B MoE | Apache 2.0 | ~78,6 % | ~0,60 $ | ## Agents distants, Work Mode et GitHub : quels usages concrets en entreprise ? ![Architecture du runtime agentique Vibe : de GitHub et Vibe CLI aux livrables Pull Request et documentation, avec supervision humaine en boucle](https://cms.mistral.ai/assets/fa1b8643-d907-49f7-b21e-59b452db2706.jpg?width=1200&height=551) Avec Medium 3.5, Mistral fait évoluer son outil Vibe d'une interface en ligne de commande locale vers un service d'agents cloud entièrement asynchrones, capables de s'exécuter dans des environnements isolés pendant votre absence. Ces agents peuvent se connecter à GitHub pour ouvrir des pull requests, à Slack ou Microsoft Teams pour rapporter leur progression, et à des outils de suivi comme Linear ou Jira pour clôturer automatiquement des tickets résolus. Le nouveau Work Mode intégré dans Le Chat permet de lancer des tâches complexes en plusieurs étapes depuis une interface web, avec des connecteurs pour l'agenda et la messagerie d'entreprise. La vision sous-jacente est celle d'un modèle long-horizon : contrairement aux chatbots traditionnels qui répondent à une question à la fois, Medium 3.5 est conçu pour maintenir une chaîne d'actions cohérente sur plusieurs heures, ce qui correspond exactement aux besoins d'automatisation des équipes opérationnelles. Pour les professionnels qui souhaitent concevoir leurs propres agents IA avec des modèles open source comme celui-ci, sans dépendre d'un fournisseur propriétaire, la formation [Automatiser ses workflows et créer des agents IA](https://www.travelearn.fr/formation/automatiser-ses-workflows-et-crer-des-agents-ia) de TraveLearn offre un parcours complet de la cartographie des flux métier jusqu'au déploiement en production. La fonctionnalité de raisonnement configurable (`reasoning_effort`) permet en outre d'ajuster la profondeur d'analyse par requête sans changer de modèle, un type de flexibilité jusqu'ici réservé aux API propriétaires. > « Les sessions de coding peuvent travailler sur de longues tâches pendant votre absence. Plusieurs peuvent tourner en parallèle, et vous cessez d'être le goulot d'étranglement. » > — Mistral AI, annonce officielle du 29 avril 2026 --- **Sources** - [Annonce officielle Mistral Medium 3.5 — mistral.ai](https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5) - [Mistral's new flagship Medium 3.5 — The Decoder](https://the-decoder.com/mistrals-new-flagship-medium-3-5-folds-chat-reasoning-and-code-into-one-model/) - [Mistral Medium 3.5 128B open-weight — Let's Data Science](https://letsdatascience.com/blog/mistral-medium-3-5-128b-open-weight-merged-model) - [Mistral Medium 3.5 benchmarks — llm-stats.com](https://llm-stats.com/models/mistral-medium-3-5)