Classement OpenRouter juin 2026 : modèles chinois à 61% du trafic — guide décisionnel de routage multi-modèles
En juin 2026, Claude Fable 5 disparaît sous l'effet du contrôle des exportations, OpenAI et Anthropic murmurent une IPO — et les modèles chinois franchissent 60% du trafic développeur sur OpenRouter. Ce guide transforme les chiffres de juin en narration décisionnelle pour les studios créatifs et les équipes produit qui orchestrent des agents OpenClaw sur Mac Apple Silicon.
1. Juin en chiffres : entreprises et modèles selon le trafic réel
OpenRouter agrège des millions d'appels API en production — le marché vote en code, pas en communiqués. Données arrêtées à juin 2026 ; classement hebdomadaire sur openrouter.ai/rankings.
Classement par éditeur (volume hebdomadaire)
| Rang | Éditeur | Origine | Tokens/semaine | Part de marché |
|---|---|---|---|---|
| 1 | DeepSeek | Chine | 5,13T | 17,6% |
| 2 | Anthropic | États-Unis | 4,34T | 14,8% |
| 3 | États-Unis | 3,66T | 12,5% | |
| 4 | OpenAI | États-Unis | 2,46T | 8,4% |
| 5 | Xiaomi | Chine | 2,42T | 8,3% |
| 6 | MiniMax | Chine | 2,37T | 8,1% |
| 7 | Tencent | Chine | 2,36T | 8,1% |
| 8 | Alibaba Qwen | Chine | 1,26T | 4,3% |
Les éditeurs chinois du top 8 totalisent environ 46% ; en incluant la longue traîne des poids ouverts routés depuis la Chine, le trafic développeur dépasse 61%.
Top 10 des modèles (volume quotidien)
| Rang | Modèle | Éditeur | Tokens/jour |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Ce tableau reflète la confiance en production — bien plus éloquent qu'un benchmark de laboratoire isolé.
2. La bascule américaine : de 70% à 30% en douze mois
Bloomberg et Exponential View citent OpenRouter pour raconter l'inversion :
- Juin 2025 : modèles américains (Google + OpenAI + Anthropic) environ 70% des tokens
- Juin 2026 : environ 30% — quarante points perdus
Le flux se dirige vers la Chine, mais l'électorat reste mondial — développeurs californiens, parisiens, bengalais. Un ingénieur de San Diego résume l'économie du geste :
« Avec Claude, le code coûte une dizaine de dollars l'heure. Avec DeepSeek, moins de cinquante cents. »
Pour la charge quotidienne, l'histoire est d'abord financière — la qualité absolue vient ensuite.
3. Volume et qualité : Claude garde le sommet, Fable 5 s'éteint
Indice Artificial Analysis Intelligence (fin mai 2026) :
| Modèle | Indice qualité | SWE-bench Pro | Note |
|---|---|---|---|
| Claude Opus 4.8 | 61,4 (#1) | 69,2% | Contexte long et agents en tête |
| GPT-5.5 | 59–60 | 63,1% | Écosystème et latence outils |
| Gemini 3.1 Pro | 57 | — | Raisonnement difficile |
| Qwen 3.7 Max | 57 | — | Flagship chinois fermé |
| Claude Sonnet 4.6 | — | 80,8% (Verified) | Écriture et suivi d'instructions |
Sur vingt tâches identiques, Opus 4.8 en remporte 16, GPT-5.5 5, Gemini 3.1 Pro 4 — sur contexte long, l'écart devient presque théâtral.
Claude Fable 5 avait atteint 100/100 avant sa disparition mondiale mi-juin 2026, victime du contrôle des exportations américain. Statut incertain : les pipelines créatifs doivent prévoir Opus 4.8 ou Sonnet 4.6 comme relais élégant.
4. La logique chinoise : prix, suffisance, poids ouverts
- Prix : MiniMax M3 à 0,60 $/M en entrée — environ un huitième de Claude Opus 4.8 (5,00 $/M)
- Suffisance : assistance code, traduction, synthèse atteignent 80–90% du niveau frontier
- Poids ouverts : DeepSeek V4, MiniMax M3 — déploiement on-premise, souveraineté des données pour les studios exigeants
Un stack représentatif : « tâches complexes 500 $/mois Claude + ChatGPT ; 90% du codage quotidien MiniMax + Kimi + MiMo ~200 $ » — le routage par complexité comme signature de 2026.
5. Matrice décisionnelle en huit scénarios (juin 2026)
| Scénario | Modèle recommandé | Raison |
|---|---|---|
| Code complexe / agent | Claude Opus 4.8 | Indice global premier, contexte long |
| Programmation quotidienne | DeepSeek V4 Flash / MiMo-V2.5 | Rapport coût-vitesse excellent |
| API la plus économique | MiniMax M3 | 0,60 $/M, poids ouverts, auto-hébergement |
| Contexte très long | Kimi K2.6 (1M tokens) | Fenêtre immense, tarif raisonnable |
| Écosystème Google | Gemini 3.5 Flash | Intégration Workspace native |
| Web en temps réel | Grok 4.3 | Flux X/Twitter live |
| Déploiement local | GLM 5.2 / Kimi K2.6 | Poids ouverts de premier plan |
| Génération d'images | ChatGPT Images 2.0 | Rendu de texte dans l'image |
6. Trois frictions de choix que rencontrent les équipes
- Parier sur un seul champion hebdomadaire : 619B/jour pour DeepSeek V4 Flash n'autorise pas automatiquement un flux réglementé ; les grands comptes restent contraints par résidence des données et audits transatlantiques.
- Choisir au benchmark, payer au token : Opus 4.8 à 61,4 peut multiplier la facture agent par rapport à un mix DeepSeek + MiniMax.
- Modèle choisi, passerelle fragile : un Mac portable endormi coupe les canaux OpenClaw — la stratégie de classement ne se matérialise qu'avec
channels status --probeet un hôte toujours éveillé.
7. Horizon Q3 2026 : la saison des lancements frontier
| Modèle | Éditeur | Fenêtre | Promesse |
|---|---|---|---|
| GPT-6 | OpenAI | août–sept. 2026 | 1,5M de contexte (rumeur), agents renforcés |
| Claude Opus 5 | Anthropic | ~sept. 2026 | Successeur d'Opus 4.8, agents longue durée |
| Gemini 4 | Q3 2026 | Multimodal, vidéo et audio | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Poids ouverts, ~1T paramètres |
| GLM 5.2 | Z.ai | publié | Poids ouverts top, code |
| Grok 4.3+ | xAI | Q3 2026 | 1M contexte, web live |
Plusieurs frontières pourraient atterrir dans une fenêtre de six semaines mi-août à fin septembre — le trône des benchmarks changera plus vite que le cycle médiatique.
8. Cinq tendances macro pour le second semestre 2026
- Du « qui est le plus fort » au « qui convient à ce scénario » : cinq laboratoires en quatre-vingt-dix jours — frontier pour les 5% les plus durs, poids ouverts chinois pour le volume.
- Part chinoise en hausse, plafond entreprise : adoption individuelle sans frein ; achats régulés probablement sous 30% de part chinoise.
- Les agents comme champ de bataille : rapport Anthropic 2026 — 44% des appels Claude API liés aux maths et à l'informatique.
- Double IPO OpenAI et Anthropic : signaux de juin 2026 reprice le secteur ; transparence tarifaire et guerre des prix avec la Chine s'accélèrent.
- Local sur GPU grand public au-delà de 80% SWE-bench : d'ici 2027, modèles 32 Go GPU dépasseront vraisemblablement 80% Verified — le marché du « code quotidien » via API s'érode.
9. Cinq étapes vers une architecture de modèles interchangeable
- Archiver la baseline de juin : top 10, virage 70%→30% — voir notre article sur le classement hebdomadaire.
- Stratifier par complexité : batch agent → DeepSeek V4 Flash ; raisonnement entreprise → Opus 4.8 ; document long → Kimi K2.6 ; multimodal → Gemini 3.5 Flash.
- Chaîne primaire/fallback : IDs OpenRouter préfixés, SecretRef, repli 429 — triage canal 429.
- Mac distant toujours en ligne :
openclaw gateway install+ launchd ; workspace SFTP/rsync. - Revue hebdomadaire, Q3 accéléré : après
channels status --probe, griser les nouveautés ; GPT-6 / Opus 5 évalués sous 48 h.
10. Questions fréquentes
Champion token en juin — DeepSeek ou Claude ? Par volume DeepSeek V4 Flash ; par indice qualité Opus 4.8. La production exige les deux tableaux.
Fable 5 est-il encore accessible ? Retiré mondialement mi-juin 2026 pour export control — préparer migration Opus 4.8 / Sonnet 4.6.
Releases Q3 à surveiller ? GPT-6 et Opus 5 probablement en collision août–septembre — construire d'abord une couche de routage agnostique.
11. Épilogue : l'architecture interchangeable comme luxe nécessaire
Le récit de juin n'est pas « la Chine gagne » — c'est la compression des marges sur la couche modèle. DeepSeek a montré en 2025 qu'on pouvait atteindre le sommet sans sommet de capex ; Xiaomi, Tencent, MiniMax et Moonshot ont abaissé le plancher tarifaire. Les Américains répondent chacun à leur manière : écosystème, qualité, multimodalité.
La compétence précieuse n'est plus de deviner le modèle éternel, mais de changer de modèle sans refondre l'orchestre. Le Q3 rendra cette vérité encore plus visible.
Quand le routage OpenClaw fonctionne, le goulot revient à la passerelle et au workspace : un Mac portable qui s'endort, un VPS étriqué, une machine Windows en veille — autant de ruptures qui annulent la beauté du classement. SFTPMAC propose des nœuds Mac Apple Silicon dédiés aux agents : launchd en veille vigilante, latence OpenRouter maîtrisée, synchronisation SFTP/rsync — une passerelle digne des chiffres de juin, pour les équipes qui transforment la data en production créative.