2026 年 5 月 OpenRouter 排行實證:中國陣營 52% Token vs Anthropic 46% 金額——大模型分層競爭與 OpenClaw 多模型路由決策矩陣
OpenRouter 2026.05 給出矛盾的數字:中國陣營拿 52% Token,Anthropic 僅 12% Token 卻收走 46% 美元。本文給出 OpenClaw 多模型路由與遠端 Mac 7×24 閘道的決策矩陣。
1. OpenRouter 2026.05 三組關鍵數字
三張榜單結論截然不同:
- 量榜:小米 MiMo-V2-Pro #1,週吞吐 4.65T+;Sonnet 4.6 #2、Qwen 3.6 Plus #3。
- 錢榜:Anthropic 46.3%、OpenAI 24.2%、中國陣營合計僅 ~13%。
- 編程榜(SWE-bench):GPT-5.5 88.7%、Opus 4.7 87.6%、Gemini 3.1 Pro / DeepSeek V4 Pro 80.6%、Kimi K2.6 80.2%。
2. 量與錢的剪刀差:12% Token 撐 46% 金額
Anthropic 一年間 Token 份額由 25% 跌到 12%,金額卻升到 46.3%;Google Token 由 37% 跌到 13%。秘密在單價:Opus 4.6 $5/$25 月入 $22.58M、Sonnet 4.6 月入 $19.65M;MiMo-V2-Pro 綜合 ~$1.50/M,5.5T tokens 僅換 $7.68M。結論:市場在分層(精品高價 + 量大廉價),並非選邊。
3. 中國陣營的勝利方程式:免費 + 開源權重 + 接近前沿
一年前中國模型佔 15%(幾乎全是 DeepSeek),今天合計 52%。五家差異化:
- 小米 MiMo-V2-Pro:免費促銷 + 海量吞吐,$1/$3,適合 RAG / 資料清洗。
- 阿里 Qwen 3.6 Plus:混合 MoE 架構,出現在 30 個 OpenRouter Top App 中的 27 個。
- DeepSeek V4 Pro:SWE-bench 80.6% / $0.435 / $0.87,前沿效能約 1/30 價。
- Kimi K2.6:128K 上下文,長流程 Agent / 編碼迴圈友善。
- MiniMax M2.5:多模態創意強,$0.30 / $1.20。
4. 編程能力榜:效能 ÷ 價格決定真實帳單
只看 SWE-bench 排名會誤判。能力 / 輸出單價 才是性價比:GPT-5.5 ≈ 2.96;Opus 4.7 ≈ 3.50;Gemini 3.1 Pro ≈ 6.72;Kimi K2.6 ≈ 22.9;DeepSeek V4 Pro ≈ 92.6。對輸出 Token 為主的 Agent,後兩者把帳單壓一個數量級。
5. 三類典型場景 × 三種佈署路徑決策矩陣
| 場景 | 主選模型 | 容錯備援 | 建議佈署路徑 |
|---|---|---|---|
| 成本極致(批次) | DeepSeek V4 Flash $0.14/$0.28 | MiniMax M2.5 / MiMo-V2-Pro | OpenRouter 直連,失敗自動 fallback |
| 編程極致(Agent) | Claude Opus 4.7 或 GPT-5.5 | Gemini 3.1 Pro / DeepSeek V4 Pro | 官方直連 + OpenRouter 兜底 |
| 長上下文 + 多模態 | Gemini 3.1 Pro(1M ctx) | Sonnet 4.6 / Kimi K2.6 | 直連 Google + 本機 Ollama 兜底 |
| 資料敏感 / 離線 | 本機 Ollama(Qwen / DeepSeek) | 合規邊界內官方 API | 遠端 Mac 7×24 + 閘道白名單 |
6. OpenClaw 多模型路由實戰:主備 + 429 回退
把上表落到設定:agents.defaults 寫主模型,fallbacks 按價位升序,cliBackends 拆短/長任務,避免單一 provider 限速拖垮整隊。
openclaw config set agents.defaults.model "anthropic/claude-opus-4.7"
openclaw config set agents.defaults.fallbacks \
"openrouter/gemini-3.1-pro,openrouter/deepseek-v4-pro,openrouter/kimi-k2.6"
openclaw gateway restart
openclaw channels status --probe
openclaw doctor
遇 429 / context overflow,OpenClaw 依序回退;詳見《通道 429 排障》、《v2026.5.19 接 xAI Grok》。
7. 風險與展望:免費退潮、合規、單一綁定
三個要先埋樁的變數:
- 免費窗口會關:小米 / Qwen 促銷不會永遠 0 元,fallback 鏈應保留次優中國模型 + 歐美兜底。
- 資料合規:用戶原文送出前,先在 OpenClaw 劃
workspaceAccess白名單。 - 避免綁定:API Key 改用 SecretRef,模型 ID 抽變數,30 秒可切換。
8. 常見問題
Q:OpenRouter 與官方同價? 多數模型同價或略高 5%,可省去多帳戶管理與重試成本。
Q:本機 Ollama 可取代雲端? 32B 量化模型 SWE-bench 落後旗艦 15-20%,但隱私與單位成本無敵,適合內部與離線。
Q:OpenClaw 原生支援 failover? 是,2026.4+ 在 fallbacks 鏈原生 retry,閘道日誌可見 provider 跳轉。
9. 總結:由「選模型」走到「治模型」,穩定性回到 7×24 節點
OpenRouter 2026.05 的訊號不是「中國贏了」或「Anthropic 輸了」,而是市場已分層:精品付費道與量大廉價道並行,團隊應用一張主備矩陣管理,而非押注單家。OpenClaw 的多 provider 路由把這件事從架構層落到設定檔層。
但路由矩陣只解決「軟體層彈性」,解決不了閘道是否 7×24 在線。筆電合蓋、Windows 休眠、低配 VPS OOM,都會讓 fallback 鏈在最關鍵的一次重試失敗。把閘道、credentials、工作目錄與 SFTP 同步基線穩定落在常電常網的 macOS 節點,才是「分層路由」變「分層在線」的最後一步。SFTPMAC 遠端 Mac 租賃提供面向 OpenClaw 的 Apple Silicon 節點:原生 launchd 守護、低延遲 OpenRouter 通道、與站內排障專文銜接,比家用電腦兼閘道更適合生產多 provider 路由。