Какая модель лидирует OpenRouter в июне 2026 по объёму токенов?

DeepSeek V4 Flash — ~619B токенов/день, далее Tencent Hy3 Preview (451B) и MiniMax M3 (447B).

DeepSeek качественно лучше Claude?

Объём ≠ качество. Claude Opus 4.8 лидирует Artificial Analysis Index с 61,4; DeepSeek выигрывает по цене/throughput для batch-агентов.

Какие frontier-модели выходят в Q3 2026?

GPT-6 (авг–сен), Claude Opus 5 (~сен), Gemini 4, DeepSeek V5 (open weights ~1T params), уже вышедший GLM 5.2.

Рейтинг OpenRouter июнь 2026: китайские модели 61% трафика — руководство по маршрутизации мультимоделей

Июнь 2026: Claude Fable 5 снят export control, OpenAI и Anthropic сигналят IPO — китайские модели на OpenRouter пробивают 60% developer traffic. Разбираем raw token metrics, benchmark divergence, Fable-5 outage и даём hardcore матрицу маршрутизации для OpenClaw-шлюзов на удалённых Mac-нодах.

1. Июньский рейтинг: вендоры и модели по реальному token throughput

OpenRouter агрегирует production API calls глобально — не marketing deck, а голосование кодом. Срез июнь 2026, live weekly data: openrouter.ai/rankings.

Vendor ranking (weekly token volume)

#	Вендор	Origin	Tokens/week	Share
1	DeepSeek	CN	5.13T	17.6%
2	Anthropic	US	4.34T	14.8%
3	Google	US	3.66T	12.5%
4	OpenAI	US	2.46T	8.4%
5	Xiaomi	CN	2.42T	8.3%
6	MiniMax	CN	2.37T	8.1%
7	Tencent	CN	2.36T	8.1%
8	Alibaba Qwen	CN	1.26T	4.3%

CN vendors в top-8 ≈ 46%; с long-tail open-weight routing — developer traffic >61% на китайских моделях.

Model top-10 (daily token volume)

#	Model	Vendor	Tokens/day
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Это trust metric production workload — не one-shot lab benchmark.

2. США: 70% → 30% token share за 12 месяцев

Bloomberg + Exponential View на данных OpenRouter:

Июнь 2025: US models (Google + OpenAI + Anthropic) ≈ 70%
Июнь 2026: ≈ 30% — минус 40 п.п.

Поток идёт в CN stack, но user base глобальная — US/EU/IN devs. Quote из San Diego:

«Claude на код — ~$10/час. DeepSeek — <$0.50.»

Для commodity workload это unit economics, не capability narrative.

3. Throughput ≠ quality ceiling: benchmarks и Fable 5 export ban

Artificial Analysis Intelligence Index (конец мая 2026):

Model	Quality index	SWE-bench Pro	Note
Claude Opus 4.8	61.4 (#1)	69.2%	Long context + agent SOTA
GPT-5.5	59–60	63.1%	Ecosystem + tool-call latency
Gemini 3.1 Pro	57	—	Hard reasoning
Qwen 3.7 Max	57	—	CN closed flagship
Claude Sonnet 4.6	—	80.8% (Verified)	Writing + IF

20 identical engineering tasks: Opus 4.8 wins 16, GPT-5.5 5, Gemini 3.1 Pro 4. Long-context — near wipeout для Opus.

Claude Fable 5: 100/100 quality rating, global takedown mid-June 2026 (US export control). Status TBD — fallback на Opus 4.8 / Sonnet 4.6 обязателен в runbook.

4. Китайский стек: price / quality / open weights

Price: MiniMax M3 API $0.60/M input — 1/8 от Claude Opus 4.8 ($5.00/M)
Good enough: coding assist, translate, summarize — 80–90% frontier quality
Open weights: DeepSeek V4, MiniMax M3 — on-prem deploy, data residency under your control

Reference stack: «hard tasks $500/mo Claude+ChatGPT; 90% daily coding MiniMax+Kimi+MiMo ~$200» — complexity-tier routing как default pattern 2026.

5. Матрица 8 production-сценариев (июнь 2026)

Сценарий	Model	Rationale
Complex code / agent	Claude Opus 4.8	Highest composite, long ctx
Daily coding	DeepSeek V4 Flash / MiMo-V2.5	$/token + latency
Cheapest API	MiniMax M3	$0.60/M, open weights, self-host
Long context	Kimi K2.6 (1M ctx)	Massive window, fair price
Google stack	Gemini 3.5 Flash	Workspace native
Realtime web	Grok 4.3	X/Twitter live feed
On-prem	GLM 5.2 / Kimi K2.6	Top open-weight tier
Image gen	ChatGPT Images 2.0	Text-in-image rendering

6. Три failure mode при выборе модели

Single-model bet по weekly chart: 619B/day DeepSeek V4 Flash ≠ compliance-approved route; enterprise procurement ограничен data residency и congressional audit.
Benchmark без TCO: Opus 4.8 index 61.4 — при million-token/day agent loop bill взлетает vs DeepSeek+MiniMax mix.
Model OK, gateway flaky: laptop sleep убивает OpenClaw channels — ROI ranking strategy = 0 без channels status --probe и 24/7 host.

7. Q3 2026 release window

Model	Vendor	Window	Key spec
GPT-6	OpenAI	Aug–Sep 2026	1.5M ctx (rumor), stronger agents
Claude Opus 5	Anthropic	~Sep 2026	Opus 4.8 successor, long-horizon agent
Gemini 4	Google	Q3 2026	Multimodal, video/audio
DeepSeek V5	DeepSeek	Q3 2026	Open weights, ~1T params
GLM 5.2	Z.ai	shipped	Top open weights, coding
Grok 4.3+	xAI	Q3 2026	1M ctx, live web

Несколько frontier releases в 6-week window mid-Aug – late Sep — benchmark leadership rotation быстрее media cycle.

8. Пять макротрендов H2 2026

От «кто сильнейший» к «кто под задачу»: 5 labs за 90 дней — frontier на hardest 5%, CN open weights на 95% volume.
CN share растёт, enterprise ceiling: indie adoption без тормозов; regulated procurement likely <30% CN share.
Agents — main battlefield: Anthropic State of AI Agents 2026 — 44% Claude API calls из math/CS tasks.
Dual IPO OpenAI + Anthropic: June 2026 signals reprice sector; pricing transparency + price war с CN ускоряются.
Local on 32GB consumer GPU >80% SWE-bench: к 2027 local models likely break 80% Verified — commodity coding API market erodes.

9. Пять шагов: hot-swappable model architecture

Baseline июня: vendor/model top10, 70%→30% inflection — weekly ranking guide.
Complexity tiers: batch agent → DeepSeek V4 Flash; enterprise reasoning → Opus 4.8; long doc → Kimi K2.6; multimodal → Gemini 3.5 Flash.
openclaw.json primary/fallback: OpenRouter IDs с vendor prefix, SecretRef, 429 fallback — 429 triage.
24/7 remote Mac: openclaw gateway install + launchd; workspace SFTP/rsync с audit trail.
Weekly review, Q3 canary: post-channels status --probe canary new models; GPT-6/Opus 5 evaluate within 48h.

10. FAQ

Q: Token champion июня — DeepSeek или Claude? По volume — DeepSeek V4 Flash; по quality index — Opus 4.8. Production нужны обе таблицы.

Q: Fable 5 ещё доступен? Global takedown mid-June 2026 — миграция на Opus 4.8/Sonnet 4.6.

Q: Главные Q3 releases? GPT-6 и Opus 5 collide Aug–Sep — строй vendor-agnostic routing layer заранее.

11. Итог: margin compression + infra как bottleneck

Июньская story — не «CN wins», а сжатие маржи model layer. DeepSeek 2025 показал: frontier без frontier capex; Xiaomi/Tencent/MiniMax/Moonshot выдавили commodity pricing. US vendors diverge — ecosystem / quality / multimodal.

Ценный skill — hot-swap моделей без rewrite pipeline. Q3 amplifies этот risk.

Когда OpenClaw routing работает, bottleneck — gateway uptime и auditable workspace. Laptop sleep, Windows hibernate, OOM на VPS — ROI ranking strategy обнуляется. SFTPMAC — Apple Silicon remote Mac nodes под OpenClaw: launchd guard, low-latency OpenRouter callback, SFTP/rsync baseline. Стабильнее «домашний ПК как AI gateway» для команд, которые хотят июньские метрики в production, а не в slide deck.