Рейтинг OpenRouter июнь 2026: китайские модели 61% трафика — руководство по маршрутизации мультимоделей
Июнь 2026: Claude Fable 5 снят export control, OpenAI и Anthropic сигналят IPO — китайские модели на OpenRouter пробивают 60% developer traffic. Разбираем raw token metrics, benchmark divergence, Fable-5 outage и даём hardcore матрицу маршрутизации для OpenClaw-шлюзов на удалённых Mac-нодах.
1. Июньский рейтинг: вендоры и модели по реальному token throughput
OpenRouter агрегирует production API calls глобально — не marketing deck, а голосование кодом. Срез июнь 2026, live weekly data: openrouter.ai/rankings.
Vendor ranking (weekly token volume)
| # | Вендор | Origin | Tokens/week | Share |
|---|---|---|---|---|
| 1 | DeepSeek | CN | 5.13T | 17.6% |
| 2 | Anthropic | US | 4.34T | 14.8% |
| 3 | US | 3.66T | 12.5% | |
| 4 | OpenAI | US | 2.46T | 8.4% |
| 5 | Xiaomi | CN | 2.42T | 8.3% |
| 6 | MiniMax | CN | 2.37T | 8.1% |
| 7 | Tencent | CN | 2.36T | 8.1% |
| 8 | Alibaba Qwen | CN | 1.26T | 4.3% |
CN vendors в top-8 ≈ 46%; с long-tail open-weight routing — developer traffic >61% на китайских моделях.
Model top-10 (daily token volume)
| # | Model | Vendor | Tokens/day |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Это trust metric production workload — не one-shot lab benchmark.
2. США: 70% → 30% token share за 12 месяцев
Bloomberg + Exponential View на данных OpenRouter:
- Июнь 2025: US models (Google + OpenAI + Anthropic) ≈ 70%
- Июнь 2026: ≈ 30% — минус 40 п.п.
Поток идёт в CN stack, но user base глобальная — US/EU/IN devs. Quote из San Diego:
«Claude на код — ~$10/час. DeepSeek — <$0.50.»
Для commodity workload это unit economics, не capability narrative.
3. Throughput ≠ quality ceiling: benchmarks и Fable 5 export ban
Artificial Analysis Intelligence Index (конец мая 2026):
| Model | Quality index | SWE-bench Pro | Note |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | Long context + agent SOTA |
| GPT-5.5 | 59–60 | 63.1% | Ecosystem + tool-call latency |
| Gemini 3.1 Pro | 57 | — | Hard reasoning |
| Qwen 3.7 Max | 57 | — | CN closed flagship |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | Writing + IF |
20 identical engineering tasks: Opus 4.8 wins 16, GPT-5.5 5, Gemini 3.1 Pro 4. Long-context — near wipeout для Opus.
Claude Fable 5: 100/100 quality rating, global takedown mid-June 2026 (US export control). Status TBD — fallback на Opus 4.8 / Sonnet 4.6 обязателен в runbook.
4. Китайский стек: price / quality / open weights
- Price: MiniMax M3 API $0.60/M input — 1/8 от Claude Opus 4.8 ($5.00/M)
- Good enough: coding assist, translate, summarize — 80–90% frontier quality
- Open weights: DeepSeek V4, MiniMax M3 — on-prem deploy, data residency under your control
Reference stack: «hard tasks $500/mo Claude+ChatGPT; 90% daily coding MiniMax+Kimi+MiMo ~$200» — complexity-tier routing как default pattern 2026.
5. Матрица 8 production-сценариев (июнь 2026)
| Сценарий | Model | Rationale |
|---|---|---|
| Complex code / agent | Claude Opus 4.8 | Highest composite, long ctx |
| Daily coding | DeepSeek V4 Flash / MiMo-V2.5 | $/token + latency |
| Cheapest API | MiniMax M3 | $0.60/M, open weights, self-host |
| Long context | Kimi K2.6 (1M ctx) | Massive window, fair price |
| Google stack | Gemini 3.5 Flash | Workspace native |
| Realtime web | Grok 4.3 | X/Twitter live feed |
| On-prem | GLM 5.2 / Kimi K2.6 | Top open-weight tier |
| Image gen | ChatGPT Images 2.0 | Text-in-image rendering |
6. Три failure mode при выборе модели
- Single-model bet по weekly chart: 619B/day DeepSeek V4 Flash ≠ compliance-approved route; enterprise procurement ограничен data residency и congressional audit.
- Benchmark без TCO: Opus 4.8 index 61.4 — при million-token/day agent loop bill взлетает vs DeepSeek+MiniMax mix.
- Model OK, gateway flaky: laptop sleep убивает OpenClaw channels — ROI ranking strategy = 0 без
channels status --probeи 24/7 host.
7. Q3 2026 release window
| Model | Vendor | Window | Key spec |
|---|---|---|---|
| GPT-6 | OpenAI | Aug–Sep 2026 | 1.5M ctx (rumor), stronger agents |
| Claude Opus 5 | Anthropic | ~Sep 2026 | Opus 4.8 successor, long-horizon agent |
| Gemini 4 | Q3 2026 | Multimodal, video/audio | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Open weights, ~1T params |
| GLM 5.2 | Z.ai | shipped | Top open weights, coding |
| Grok 4.3+ | xAI | Q3 2026 | 1M ctx, live web |
Несколько frontier releases в 6-week window mid-Aug – late Sep — benchmark leadership rotation быстрее media cycle.
8. Пять макротрендов H2 2026
- От «кто сильнейший» к «кто под задачу»: 5 labs за 90 дней — frontier на hardest 5%, CN open weights на 95% volume.
- CN share растёт, enterprise ceiling: indie adoption без тормозов; regulated procurement likely <30% CN share.
- Agents — main battlefield: Anthropic State of AI Agents 2026 — 44% Claude API calls из math/CS tasks.
- Dual IPO OpenAI + Anthropic: June 2026 signals reprice sector; pricing transparency + price war с CN ускоряются.
- Local on 32GB consumer GPU >80% SWE-bench: к 2027 local models likely break 80% Verified — commodity coding API market erodes.
9. Пять шагов: hot-swappable model architecture
- Baseline июня: vendor/model top10, 70%→30% inflection — weekly ranking guide.
- Complexity tiers: batch agent → DeepSeek V4 Flash; enterprise reasoning → Opus 4.8; long doc → Kimi K2.6; multimodal → Gemini 3.5 Flash.
- openclaw.json primary/fallback: OpenRouter IDs с vendor prefix, SecretRef, 429 fallback — 429 triage.
- 24/7 remote Mac:
openclaw gateway install+ launchd; workspace SFTP/rsync с audit trail. - Weekly review, Q3 canary: post-
channels status --probecanary new models; GPT-6/Opus 5 evaluate within 48h.
10. FAQ
Q: Token champion июня — DeepSeek или Claude? По volume — DeepSeek V4 Flash; по quality index — Opus 4.8. Production нужны обе таблицы.
Q: Fable 5 ещё доступен? Global takedown mid-June 2026 — миграция на Opus 4.8/Sonnet 4.6.
Q: Главные Q3 releases? GPT-6 и Opus 5 collide Aug–Sep — строй vendor-agnostic routing layer заранее.
11. Итог: margin compression + infra как bottleneck
Июньская story — не «CN wins», а сжатие маржи model layer. DeepSeek 2025 показал: frontier без frontier capex; Xiaomi/Tencent/MiniMax/Moonshot выдавили commodity pricing. US vendors diverge — ecosystem / quality / multimodal.
Ценный skill — hot-swap моделей без rewrite pipeline. Q3 amplifies этот risk.
Когда OpenClaw routing работает, bottleneck — gateway uptime и auditable workspace. Laptop sleep, Windows hibernate, OOM на VPS — ROI ranking strategy обнуляется. SFTPMAC — Apple Silicon remote Mac nodes под OpenClaw: launchd guard, low-latency OpenRouter callback, SFTP/rsync baseline. Стабильнее «домашний ПК как AI gateway» для команд, которые хотят июньские метрики в production, а не в slide deck.