Classements OpenRouter juin : entreprises et modèles décryptés
OpenRouter agrège les appels API réels de millions de développeurs — pas la presse des éditeurs, le vote du code. Le classement de juin reflète ce que les équipes en production aux États-Unis, en Europe et en Inde utilisent vraiment.
| Rang | Entreprise | Origine | Tokens/semaine | Part |
|---|---|---|---|---|
| 1 | DeepSeek | 🇨🇳 Chine | 5.13T | 17.6% |
| 2 | Anthropic | 🇺🇸 États-Unis | 4.34T | 14.8% |
| 3 | 🇺🇸 États-Unis | 3.66T | 12.5% | |
| 4 | OpenAI | 🇺🇸 États-Unis | 2.46T | 8.4% |
| 5 | Xiaomi | 🇨🇳 Chine | 2.42T | 8.3% |
| 6 | MiniMax | 🇨🇳 Chine | 2.37T | 8.1% |
| 7 | Tencent | 🇨🇳 Chine | 2.36T | 8.1% |
| 8 | Alibaba Qwen | 🇨🇳 Chine | 1.26T | 4.3% |
Les fournisseurs chinois listés dans le top 10 totalisent ~46% ; en incluant tous les modèles chinois, le trafic développeur atteint ~61%.
| Rang | Modèle | Éditeur | Tokens/jour |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Bascule géopolitique : Bloomberg cite OpenRouter : modèles US de 70% (juin 2025) à 30% (juin 2026) — 40 points perdus au profit de la Chine.
Pas un biais national : la base OpenRouter est mondiale ; DeepSeek, Xiaomi et MiniMax gagnent car moins cher, rapide, suffisant.
Preuve économique : un dev de San Diego : « Avec Claude, ~10 $/h de code. Avec DeepSeek, moins de 50 cents. »
Juin : Claude Fable 5 retiré (export) ; OpenAI et Anthropic signalent des intentions d'IPO.
Enjeu : ce n'est pas « qui a le plus d'utilisateurs » — c'est ce que la production fait confiance.
Ce n'est pas une histoire de qualité — pour la plupart des workloads quotidiens, c'est de l'économie.
Premier en volume ≠ premier en qualité : Claude Opus 4.8 reste #1
Volume de tokens et score benchmark sont deux choses distinctes en 2026.
| Modèle | Indice qualité | SWE-bench Pro | Note |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | Long contexte & agents |
| GPT-5.5 | 59–60 | 63.1% | Écosystème, tool calls rapides |
| Gemini 3.1 Pro | 57 | — | Raisonnement le plus dur |
| Qwen 3.7 Max | 57 | — | Sommet closed-source Chine |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | Rédaction & instructions |
Source : Artificial Analysis Intelligence Index (fin mai 2026). Test 20 tâches : Opus 4.8 gagne 16, GPT-5.5 5, Gemini 3.1 Pro 4 ; en long contexte, Opus domine.
Claude Fable 5 : note qualité parfaite (100/100), retiré mondialement mi-juin 2026 (contrôles export) — statut incertain. Preuve que le frontier US reste en tête en capacité pure.
Trois raisons du volume chinois élevé :
Prix : MiniMax M3 à $0.60/M input — environ 1/8 de Claude Opus 4.8 ($5.00/M).
Suffisant : aide code, complétion, traduction, résumés atteignent 80–90% du top.
Poids ouverts : DeepSeek V4, MiniMax M3 etc. — auto-hébergement, moins de transferts transfrontaliers sensibles.
Meilleur modèle par scénario — matrice juin 2026
| Scénario | Modèle | Raison |
|---|---|---|
| Code complexe / agent | Claude Opus 4.8 | #1 global, long contexte |
| Coding quotidien | DeepSeek V4 Flash / MiMo-V2.5 | Rapport qualité-prix |
| API ultra rentable | MiniMax M3 | $0.60/M, poids ouverts |
| Long contexte | Kimi K2.6 (1M context) | Fenêtre longue, prix raisonnable |
| Écosystème Google | Gemini 3.5 Flash | Workspace natif |
| Web temps réel | Grok 4.3 | Contenu X/Twitter live |
| Auto-hébergement | GLM 5.2 / Kimi K2.6 | Top poids ouverts |
| Génération d'images | ChatGPT Images 2.0 | Meilleur rendu texte |
Stratégie rationnelle : frontier fermé pour les 5% les plus durs, poids ouverts chinois pour 95% du volume. La zone « qualité OK mais cher » disparaît vite.
Architecture IA multi-modèles — runbook en six étapes
Route unique : OpenRouter ou LiteLLM — un endpoint API, pas de provider codé en dur.
Niveaux de tâche : complétion/résumé simple → DeepSeek V4 Flash ou MiMo-V2.5 ; agents multi-étapes/long contexte → Claude Opus 4.8.
Coûts : tokens et USD par modèle, alertes budget ; MiniMax M3 ($0.60/M) comme baseline quotidienne.
Chaîne fallback : timeout/limitation → Opus → Sonnet → DeepSeek V4 Pro — workflows agent intacts.
Fallback poids ouverts : données sensibles → GLM 5.2 ou Kimi K2.6 auto-hébergés, moins de transferts transfrontaliers.
Hôte stable : passerelle agent et routing sur Mac Mini cloud 7×24 — pas de veille laptop qui casse les agents longs.
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-d '{
"model": "deepseek/deepseek-v4-flash",
"messages": [{"role": "user", "content": "Refactor this function..."}]
}'
Prévisions S2 2026 : fenêtre Q3 et cinq tendances macro
Q3 2026 pourrait être le trimestre le plus dense en releases de l'histoire IA :
| Modèle | Éditeur | Date | Focus |
|---|---|---|---|
| GPT-6 | OpenAI | août–sept. 2026 | Contexte plus long (rumeur 1.5M), agents |
| Claude Opus 5 | Anthropic | ~sept. 2026 | Agents longue durée |
| Gemini 4 | Q3 2026 | Multimodal vidéo/audio | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Poids ouverts, >1T params, niveau frontier |
| GLM 5.2 | Z.ai | Déjà publié | Top poids ouverts, coding fort |
Concurrence par scénario : cinq labs en 90 jours — plus de modèle unique « meilleur » ; frontier 5%, poids ouverts 95%.
Part Chine monte, compliance plafonne l'entreprise : sécurité des données et Congrès US ; devs indie peut-être 70%+, Fortune 500 <30%.
Les agents sont le champ de bataille : rapport Anthropic 2026 : 44% des appels Claude API = maths et informatique.
IPO et tarifs : OpenAI et Anthropic ont signalé IPO en juin — pression listing, pricing tiered, guerre des prix avec la Chine.
Modèles locaux : d'ici 2027, SWE-bench 80% sur GPU grand public (32 Go RAM).
DeepSeek tokens/semaine : 5.13T, 17.6%, #1 entreprise.
Renversement US : 70% → 30% en 12 mois (Bloomberg / OpenRouter).
Écart prix : MiniMax M3 vs Opus 4.8 input ~8× ($0.60/M vs $5.00/M).
Fondamentalement, les marges du layer modèle se compriment. DeepSeek a montré début 2025 : frontier sans compute frontier. Les US divergent — OpenAI écosystème, Anthropic qualité, Google vitesse/multimodal. Pour les devs, la compétence clé n'est pas « choisir le plus fort », mais architecturer le changement de modèle — le #1 d'aujourd'hui peut ne plus l'être dans trois mois.
Router plusieurs modèles sur un laptop = veille, RAM, réseau. Pour des passerelles agent, OpenClaw ou CI multi-modèles 7×24, MESHLAUNCH Mac Mini cloud bare-metal : Apple Silicon dédié, location jour/semaine/mois — voir centre d'aide pour région et setup.
DeepSeek V4 Flash (619B/jour), puis Tencent Hy3 Preview (451B), MiniMax M3 (447B), Xiaomi MiMo-V2.5 (327B). Tableaux complets ci-dessus.
Selon le cas. DeepSeek mène en volume ; Opus 4.8 reste #1 qualité (61.4). Coding : DeepSeek <50 cents/h vs Claude ~10 $. Agents/long contexte : Claude. Voir tarifs location.
Probablement GPT-6 (août–sept.), Claude Opus 5 (~sept.), Gemini 4, DeepSeek V5 open weights. Trois labs US + DeepSeek en fenêtre ~6 semaines — route agnostique dès maintenant.
Prix ($0.60/M MiniMax M3 vs $5.00/M Opus 4.8), vitesse, 80–90% qualité quotidienne. Poids ouverts pour auto-hébergement sans prompts US cloud.
Déployer OpenRouter/LiteLLM sur Mac cloud 7×24. Config et région : centre d'aide ; location jour/mois selon projet.