OpenRouter 2026.05 大模型分層競爭與 OpenClaw 多模型路由示意

2026 年 5 月 OpenRouter 排行實證:中國陣營 52% Token vs Anthropic 46% 金額——大模型分層競爭與 OpenClaw 多模型路由決策矩陣

OpenRouter 2026.05 給出矛盾的數字:中國陣營拿 52% Token,Anthropic 僅 12% Token 卻收走 46% 美元。本文給出 OpenClaw 多模型路由與遠端 Mac 7×24 閘道的決策矩陣。

1. OpenRouter 2026.05 三組關鍵數字

三張榜單結論截然不同:

  1. 量榜:小米 MiMo-V2-Pro #1,週吞吐 4.65T+;Sonnet 4.6 #2、Qwen 3.6 Plus #3。
  2. 錢榜:Anthropic 46.3%、OpenAI 24.2%、中國陣營合計僅 ~13%
  3. 編程榜(SWE-bench):GPT-5.5 88.7%、Opus 4.7 87.6%、Gemini 3.1 Pro / DeepSeek V4 Pro 80.6%、Kimi K2.6 80.2%

2. 量與錢的剪刀差:12% Token 撐 46% 金額

Anthropic 一年間 Token 份額由 25% 跌到 12%,金額卻升到 46.3%;Google Token 由 37% 跌到 13%。秘密在單價:Opus 4.6 $5/$25 月入 $22.58M、Sonnet 4.6 月入 $19.65M;MiMo-V2-Pro 綜合 ~$1.50/M,5.5T tokens 僅換 $7.68M。結論:市場在分層(精品高價 + 量大廉價),並非選邊。

3. 中國陣營的勝利方程式:免費 + 開源權重 + 接近前沿

一年前中國模型佔 15%(幾乎全是 DeepSeek),今天合計 52%。五家差異化:

  • 小米 MiMo-V2-Pro:免費促銷 + 海量吞吐,$1/$3,適合 RAG / 資料清洗。
  • 阿里 Qwen 3.6 Plus:混合 MoE 架構,出現在 30 個 OpenRouter Top App 中的 27 個。
  • DeepSeek V4 Pro:SWE-bench 80.6% / $0.435 / $0.87,前沿效能約 1/30 價。
  • Kimi K2.6:128K 上下文,長流程 Agent / 編碼迴圈友善。
  • MiniMax M2.5:多模態創意強,$0.30 / $1.20。

4. 編程能力榜:效能 ÷ 價格決定真實帳單

只看 SWE-bench 排名會誤判。能力 / 輸出單價 才是性價比:GPT-5.5 ≈ 2.96;Opus 4.7 ≈ 3.50;Gemini 3.1 Pro ≈ 6.72;Kimi K2.6 ≈ 22.9;DeepSeek V4 Pro ≈ 92.6。對輸出 Token 為主的 Agent,後兩者把帳單壓一個數量級。

5. 三類典型場景 × 三種佈署路徑決策矩陣

場景 主選模型 容錯備援 建議佈署路徑
成本極致(批次) DeepSeek V4 Flash $0.14/$0.28 MiniMax M2.5 / MiMo-V2-Pro OpenRouter 直連,失敗自動 fallback
編程極致(Agent) Claude Opus 4.7 或 GPT-5.5 Gemini 3.1 Pro / DeepSeek V4 Pro 官方直連 + OpenRouter 兜底
長上下文 + 多模態 Gemini 3.1 Pro(1M ctx) Sonnet 4.6 / Kimi K2.6 直連 Google + 本機 Ollama 兜底
資料敏感 / 離線 本機 Ollama(Qwen / DeepSeek) 合規邊界內官方 API 遠端 Mac 7×24 + 閘道白名單

6. OpenClaw 多模型路由實戰:主備 + 429 回退

把上表落到設定:agents.defaults 寫主模型,fallbacks 按價位升序,cliBackends 拆短/長任務,避免單一 provider 限速拖垮整隊。

openclaw config set agents.defaults.model "anthropic/claude-opus-4.7"
openclaw config set agents.defaults.fallbacks \
  "openrouter/gemini-3.1-pro,openrouter/deepseek-v4-pro,openrouter/kimi-k2.6"
openclaw gateway restart
openclaw channels status --probe
openclaw doctor

429 / context overflow,OpenClaw 依序回退;詳見《通道 429 排障》、《v2026.5.19 接 xAI Grok》。

7. 風險與展望:免費退潮、合規、單一綁定

三個要先埋樁的變數:

  1. 免費窗口會關:小米 / Qwen 促銷不會永遠 0 元,fallback 鏈應保留次優中國模型 + 歐美兜底。
  2. 資料合規:用戶原文送出前,先在 OpenClaw 劃 workspaceAccess 白名單。
  3. 避免綁定:API Key 改用 SecretRef,模型 ID 抽變數,30 秒可切換。

8. 常見問題

Q:OpenRouter 與官方同價? 多數模型同價或略高 5%,可省去多帳戶管理與重試成本。

Q:本機 Ollama 可取代雲端? 32B 量化模型 SWE-bench 落後旗艦 15-20%,但隱私與單位成本無敵,適合內部與離線。

Q:OpenClaw 原生支援 failover? 是,2026.4+ 在 fallbacks 鏈原生 retry,閘道日誌可見 provider 跳轉。

9. 總結:由「選模型」走到「治模型」,穩定性回到 7×24 節點

OpenRouter 2026.05 的訊號不是「中國贏了」或「Anthropic 輸了」,而是市場已分層:精品付費道與量大廉價道並行,團隊應用一張主備矩陣管理,而非押注單家。OpenClaw 的多 provider 路由把這件事從架構層落到設定檔層。

但路由矩陣只解決「軟體層彈性」,解決不了閘道是否 7×24 在線。筆電合蓋、Windows 休眠、低配 VPS OOM,都會讓 fallback 鏈在最關鍵的一次重試失敗。把閘道、credentials、工作目錄與 SFTP 同步基線穩定落在常電常網的 macOS 節點,才是「分層路由」變「分層在線」的最後一步。SFTPMAC 遠端 Mac 租賃提供面向 OpenClaw 的 Apple Silicon 節點:原生 launchd 守護、低延遲 OpenRouter 通道、與站內排障專文銜接,比家用電腦兼閘道更適合生產多 provider 路由。