Рейтинг OpenRouter июнь 2026: доля китайских моделей и сдвиг США с 70 до 30 процентов

Рейтинг OpenRouter июнь 2026: китайские модели 61% трафика — руководство по маршрутизации мультимоделей

Июнь 2026: Claude Fable 5 снят export control, OpenAI и Anthropic сигналят IPO — китайские модели на OpenRouter пробивают 60% developer traffic. Разбираем raw token metrics, benchmark divergence, Fable-5 outage и даём hardcore матрицу маршрутизации для OpenClaw-шлюзов на удалённых Mac-нодах.

1. Июньский рейтинг: вендоры и модели по реальному token throughput

OpenRouter агрегирует production API calls глобально — не marketing deck, а голосование кодом. Срез июнь 2026, live weekly data: openrouter.ai/rankings.

Vendor ranking (weekly token volume)

# Вендор Origin Tokens/week Share
1DeepSeekCN5.13T17.6%
2AnthropicUS4.34T14.8%
3GoogleUS3.66T12.5%
4OpenAIUS2.46T8.4%
5XiaomiCN2.42T8.3%
6MiniMaxCN2.37T8.1%
7TencentCN2.36T8.1%
8Alibaba QwenCN1.26T4.3%

CN vendors в top-8 ≈ 46%; с long-tail open-weight routing — developer traffic >61% на китайских моделях.

Model top-10 (daily token volume)

# Model Vendor Tokens/day
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Это trust metric production workload — не one-shot lab benchmark.

2. США: 70% → 30% token share за 12 месяцев

Bloomberg + Exponential View на данных OpenRouter:

  • Июнь 2025: US models (Google + OpenAI + Anthropic) ≈ 70%
  • Июнь 2026: ≈ 30% — минус 40 п.п.

Поток идёт в CN stack, но user base глобальная — US/EU/IN devs. Quote из San Diego:

«Claude на код — ~$10/час. DeepSeek — <$0.50.»

Для commodity workload это unit economics, не capability narrative.

3. Throughput ≠ quality ceiling: benchmarks и Fable 5 export ban

Artificial Analysis Intelligence Index (конец мая 2026):

Model Quality index SWE-bench Pro Note
Claude Opus 4.861.4 (#1)69.2%Long context + agent SOTA
GPT-5.559–6063.1%Ecosystem + tool-call latency
Gemini 3.1 Pro57Hard reasoning
Qwen 3.7 Max57CN closed flagship
Claude Sonnet 4.680.8% (Verified)Writing + IF

20 identical engineering tasks: Opus 4.8 wins 16, GPT-5.5 5, Gemini 3.1 Pro 4. Long-context — near wipeout для Opus.

Claude Fable 5: 100/100 quality rating, global takedown mid-June 2026 (US export control). Status TBD — fallback на Opus 4.8 / Sonnet 4.6 обязателен в runbook.

4. Китайский стек: price / quality / open weights

  1. Price: MiniMax M3 API $0.60/M input — 1/8 от Claude Opus 4.8 ($5.00/M)
  2. Good enough: coding assist, translate, summarize — 80–90% frontier quality
  3. Open weights: DeepSeek V4, MiniMax M3 — on-prem deploy, data residency under your control

Reference stack: «hard tasks $500/mo Claude+ChatGPT; 90% daily coding MiniMax+Kimi+MiMo ~$200» — complexity-tier routing как default pattern 2026.

5. Матрица 8 production-сценариев (июнь 2026)

Сценарий Model Rationale
Complex code / agentClaude Opus 4.8Highest composite, long ctx
Daily codingDeepSeek V4 Flash / MiMo-V2.5$/token + latency
Cheapest APIMiniMax M3$0.60/M, open weights, self-host
Long contextKimi K2.6 (1M ctx)Massive window, fair price
Google stackGemini 3.5 FlashWorkspace native
Realtime webGrok 4.3X/Twitter live feed
On-premGLM 5.2 / Kimi K2.6Top open-weight tier
Image genChatGPT Images 2.0Text-in-image rendering

6. Три failure mode при выборе модели

  1. Single-model bet по weekly chart: 619B/day DeepSeek V4 Flash ≠ compliance-approved route; enterprise procurement ограничен data residency и congressional audit.
  2. Benchmark без TCO: Opus 4.8 index 61.4 — при million-token/day agent loop bill взлетает vs DeepSeek+MiniMax mix.
  3. Model OK, gateway flaky: laptop sleep убивает OpenClaw channels — ROI ranking strategy = 0 без channels status --probe и 24/7 host.

7. Q3 2026 release window

Model Vendor Window Key spec
GPT-6OpenAIAug–Sep 20261.5M ctx (rumor), stronger agents
Claude Opus 5Anthropic~Sep 2026Opus 4.8 successor, long-horizon agent
Gemini 4GoogleQ3 2026Multimodal, video/audio
DeepSeek V5DeepSeekQ3 2026Open weights, ~1T params
GLM 5.2Z.aishippedTop open weights, coding
Grok 4.3+xAIQ3 20261M ctx, live web

Несколько frontier releases в 6-week window mid-Aug – late Sep — benchmark leadership rotation быстрее media cycle.

8. Пять макротрендов H2 2026

  1. От «кто сильнейший» к «кто под задачу»: 5 labs за 90 дней — frontier на hardest 5%, CN open weights на 95% volume.
  2. CN share растёт, enterprise ceiling: indie adoption без тормозов; regulated procurement likely <30% CN share.
  3. Agents — main battlefield: Anthropic State of AI Agents 2026 — 44% Claude API calls из math/CS tasks.
  4. Dual IPO OpenAI + Anthropic: June 2026 signals reprice sector; pricing transparency + price war с CN ускоряются.
  5. Local on 32GB consumer GPU >80% SWE-bench: к 2027 local models likely break 80% Verified — commodity coding API market erodes.

9. Пять шагов: hot-swappable model architecture

  1. Baseline июня: vendor/model top10, 70%→30% inflection — weekly ranking guide.
  2. Complexity tiers: batch agent → DeepSeek V4 Flash; enterprise reasoning → Opus 4.8; long doc → Kimi K2.6; multimodal → Gemini 3.5 Flash.
  3. openclaw.json primary/fallback: OpenRouter IDs с vendor prefix, SecretRef, 429 fallback — 429 triage.
  4. 24/7 remote Mac: openclaw gateway install + launchd; workspace SFTP/rsync с audit trail.
  5. Weekly review, Q3 canary: post-channels status --probe canary new models; GPT-6/Opus 5 evaluate within 48h.

10. FAQ

Q: Token champion июня — DeepSeek или Claude? По volume — DeepSeek V4 Flash; по quality index — Opus 4.8. Production нужны обе таблицы.

Q: Fable 5 ещё доступен? Global takedown mid-June 2026 — миграция на Opus 4.8/Sonnet 4.6.

Q: Главные Q3 releases? GPT-6 и Opus 5 collide Aug–Sep — строй vendor-agnostic routing layer заранее.

11. Итог: margin compression + infra как bottleneck

Июньская story — не «CN wins», а сжатие маржи model layer. DeepSeek 2025 показал: frontier без frontier capex; Xiaomi/Tencent/MiniMax/Moonshot выдавили commodity pricing. US vendors diverge — ecosystem / quality / multimodal.

Ценный skill — hot-swap моделей без rewrite pipeline. Q3 amplifies этот risk.

Когда OpenClaw routing работает, bottleneck — gateway uptime и auditable workspace. Laptop sleep, Windows hibernate, OOM на VPS — ROI ranking strategy обнуляется. SFTPMAC — Apple Silicon remote Mac nodes под OpenClaw: launchd guard, low-latency OpenRouter callback, SFTP/rsync baseline. Стабильнее «домашний ПК как AI gateway» для команд, которые хотят июньские метрики в production, а не в slide deck.