🎨 GPT Image 2 : OpenAI enterre Sora pour conquérir l'image

GPT Image 2 (gpt-image-2) est sorti le 21 avril 2026 : texte parfait, 4K, 8 images en un prompt. Voici pourquoi OpenAI a sacrifié Sora pour y arriver.

![Logo OpenAI spirale couleurs, crédits Bryce Durbin TechCrunch](https://techcrunch.com/wp-content/uploads/2024/05/openAI-spiral-color-v2.jpg) Le 21 avril 2026, OpenAI a officiellement lancé **ChatGPT Images 2.0** et son modèle sous-jacent, baptisé `gpt-image-2` dans l'API. En moins de 12 heures, le modèle s'est hissé à la première place de l'Image Arena sur toutes les catégories, avec un score de 1512 en text-to-image et une avance de +242 points Elo sur le modèle suivant au classement. C'est la plus grande marge jamais enregistrée sur ce leaderboard. Ce lancement ne tombe pas par hasard. Il arrive quelques semaines après ce que nous avions analysé ici même : [l'arrêt brutal de Sora](https://www.travelearn.fr/blog/sora-openai-arret-service), le générateur vidéo d'OpenAI, dont l'équipe a été dissoute dans le cadre d'un sprint interne qualifié de "focus". Le message stratégique est limpide : OpenAI a choisi de concentrer ses ressources sur la génération d'images, et le résultat est là. ## GPT Image 2 change-t-il vraiment la donne pour la génération d'images ? La réponse courte est oui, et sur plusieurs fronts simultanément. Le premier est le texte. Depuis deux ans, demander à un modèle d'image de produire un menu de restaurant revenait à lire une parodie culinaire : "enchuita", "churiros", "burrto". Comme l'a testé TechCrunch le jour du lancement, ChatGPT Images 2.0 génère désormais un menu mexicain directement imprimable, avec orthographe correcte, mise en page soignée et prix cohérents. OpenAI parle d'une précision au niveau du caractère d'environ 99 % sur les scripts latins, CJK, hindi et bengali. Ce n'est pas une amélioration marginale : c'est la résolution d'un problème structurel qui bloquait les cas d'usage professionnels depuis le lancement de DALL-E. ![Comparaison entre le rendu d'un menu mexicain par DALL-E 3 (2024) et ChatGPT Images 2.0 (2026), crédits TechCrunch](https://techcrunch.com/wp-content/uploads/2026/04/Screenshot-2024-03-19-at-11.05.24-AM.webp) Le deuxième changement structurel est l'introduction de capacités de raisonnement dans la génération d'images. Quand un utilisateur sélectionne le mode "Thinking" dans ChatGPT, le système ne dessine plus : il planifie, recherche sur le web si nécessaire, génère plusieurs variantes et vérifie ses propres sorties avant de livrer. Adele Li, Product Lead chez OpenAI, a démontré cette capacité en live en chargeant un fichier PowerPoint de stratégie produit, laissant le modèle en extraire la structure et générer des visuels cohérents. Le troisième axe, souvent sous-estimé dans les annonces du jour, est l'intégration native dans Codex. Trois millions de développeurs utilisent Codex chaque semaine. Leur donner accès à la génération d'images dans le même environnement de travail, sans clé API séparée, sans bascule de contexte, est un changement de friction considérable pour le prototypage rapide d'assets visuels. | Capacité | GPT Image 1 (avril 2025) | GPT Image 1.5 (déc. 2025) | GPT Image 2 (avr. 2026) | |---|---|---|---| | Résolution max | 1024x1024 | 1024x1024 | 4096x4096 (4K) | | Texte dans l'image | Médiocre | Amélioré | ~99 % précision caractère | | Raisonnement (Thinking) | Non | Non | Oui (mode opt-in) | | Génération multi-images | Non | Non | Jusqu'à 8 par prompt | | Score Image Arena | n/a | n/a | 1512 (+242 Elo lead) | | Langues non-latines | Limitées | Partielles | JP, KR, ZH, HI, BN | | Intégration Codex | Non | Non | Oui, native | ## Sora, Figma, Canva : qui gagne et qui perd dans ce nouveau paysage ? Le lancement de gpt-image-2 s'inscrit dans une recomposition plus large du marché de la création visuelle par IA. Du côté des gagnants immédiats, on trouve les développeurs qui utilisent Figma, Canva ou Hermes Agent : toutes ces plateformes ont annoncé une intégration le jour même du lancement. Du côté des signaux plus inquiétants, il y a la question des designers indépendants. La capacité à générer des storyboards en huit panels cohérents depuis un seul prompt, à partir d'un brief stratégique PowerPoint, comprime un workflow qui mobilisait jusqu'ici plusieurs heures de travail humain. Ce n'est pas une menace abstraite. > "Les images sont un langage, pas une décoration. Une bonne image fait ce que fait une bonne phrase : elle sélectionne, agence et révèle." > *— OpenAI, blog de lancement ChatGPT Images 2.0, 21 avril 2026* Quant à Sora, dont nous avions [documenté l'arrêt ici](https://www.travelearn.fr/blog/sora-openai-arret-service), son destin éclaire la décision en creux : OpenAI a fait le choix de ne pas disperser ses ressources sur la vidéo alors qu'un concurrent comme Google montait en puissance avec Nano Banana 2 (Gemini 3.1 Pro Image) sorti en février 2026. La priorité a été mise sur l'image fixe, qui concentrait les usages professionnels les plus rentables à court terme. C'est précisément dans ce contexte que comprendre comment intégrer ces outils dans ses workflows devient une compétence différenciante pour les professionnels. La formation [Automatiser ses workflows et créer des agents IA](https://www.travelearn.fr/formation/automatiser-ses-workflows-et-crer-des-agents-ia) couvre notamment comment enchaîner ces briques de génération visuelle avec des automatisations concrètes en entreprise. ## Quelles questions reste-t-il sans réponse sur GPT Image 2 ? Plusieurs zones d'ombre demeurent. D'abord, l'architecture réelle du modèle : OpenAI a refusé de confirmer s'il s'agissait d'un modèle de diffusion ou autorégressif, se contentant du label "généraliste". Pour un écosystème habitué à la transparence technique minimale, c'est une opacité notable. Ensuite, la question de l'impact politique et de la désinformation. Lors de la conférence de presse fermée, VentureBeat a directement interrogé OpenAI sur l'utilisation potentielle de gpt-image-2 dans des campagnes d'influence, en référence à un récent rapport du New York Times sur des personnages fictifs générés par IA utilisés comme "vrais Américains" sur les réseaux sociaux. La réponse d'Adele Li a été générique : "Nous prenons la sécurité très au sérieux." Cette zone reste entièrement ouverte. Enfin, le pricing. L'API est disponible, avec des tarifs dépendant de la qualité et de la résolution. Sur Microsoft Foundry, le modèle est facturé à 30 dollars par million de tokens en sortie image, et 8 dollars par million de tokens en entrée. Pour les équipes de contenu, cela rend les workflows de génération massive économiquement viables. Mais le seuil de rentabilité par rapport à une production humaine n'a pas encore été calculé sérieusement dans des études indépendantes. --- **Sources :** - [Introducing ChatGPT Images 2.0 — OpenAI](https://openai.com/index/introducing-chatgpt-images-2-0/) - [ChatGPT's new Images 2.0 model is surprisingly good at generating text — TechCrunch](https://techcrunch.com/2026/04/21/chatgpts-new-images-2-0-model-is-surprisingly-good-at-generating-text/) - [Introducing OpenAI's GPT-image-2 in Microsoft Foundry — Microsoft Community Hub](https://techcommunity.microsoft.com/blog/azure-ai-foundry-blog/introducing-openais-gpt-image-2-in-microsoft-foundry/4500571) - [ChatGPT Images 2.0 is here — VentureBeat](https://venturebeat.com/technology/openais-chatgpt-images-2-0-is-here-and-it-does-multilingual-text-full-infographics-slides-maps-even-manga-seemingly-flawlessly) - [AINews: OpenAI launches GPT-Image-2 — Latent.Space](https://www.latent.space/p/ainews-openai-launches-gpt-image)