三类痛点:像随机模型故障的误判,常与路由与标识有关
1)模型标识漂移。云侧长名、Ollama 标签与 latest 指向不一致时,进程仍在线、doctor 仍可能通过,但回答截断。用版本化清单写全名,生产固定 Ollama 标签。
2)配额信号滞后。429 前常先变慢;需控制台阈值与分路由预算,并写明用尽时是否回落本地与提示语。
3)误用 doctor 代替实时探针。doctor 偏静态;须 openclaw status→curl 127.0.0.1:18789→doctor→openclaw health --json→日志。否则同版本不同人结果迥异,根因在标识、配额、顺序未统一。
决策矩阵:云 API、Ollama 与混合推理路由怎么选
下表用于方案评审与事故复盘,数字是 2026 年小型网关常见的规划量级,需按你的套餐与芯片代次调整。
| 策略 | 适用 | 主要风险 | 最低控制 |
|---|---|---|---|
| 仅云 API | 追求前沿能力、无本地算力 | 限额、区域迁移、政策变更 | 密钥轮换、预算告警、模型白名单 |
| 仅 Ollama 本地 | 强隐私、离线演示、内网环境 | 内存压力、磁盘占用、标签漂移 | 为七 B 级模型预留充足内存与 SSD 空间,固定标签 |
| 混合:云主、本地备 | 生产要抗配额尖峰 | 双栈观测复杂、回退质量不一致 | 健康检查自动化、回退提示文案、延迟预算 |
| 混合:本地主、云突发 | 成本敏感、偶尔要顶级推理 | 误触发导致云费用飙升 | 突发路由硬上限、独立低限额密钥、月度对账 |
把路由表、模型清单、health JSON入库;混合要季度演练密钥失效与本地回退时延。容器与 npm 路径见安装与回滚。Apple 硅片能效佳,但需不睡眠不断网,笔记本合盖易让健康检查漂移。
前置条件:Node、Ollama、内存、磁盘与版本化模型清单
Node:记主版本、which openclaw、锁文件,勿混大版本。Ollama:渠道、ollama serve常驻、监听;ollama pull写死标签。内存:七 B 级常需8–12GiB 级余量并压测 RAG。磁盘:多标签占 SSD,建议≥200GB可用。
注意 DNS/TLS/代理超时;反代同时写公网 URL与127.0.0.1探测;白名单记出口。冷启动演练首请求。多平台见云部署 FAQ。
路由切换、提供方切换与配置陷阱:混合最容易静默失败的地方
按交互/摘要/重工具分路由与延迟;忌根配置含糊默认致子系统解析不一。容器常见密钥未注入侧车;反代对 SSE 流式处理不一致。预发用同一批提示词对照温度与 max token。
切换时一次一改:模型、密钥或网络;前后各存 openclaw health --json。回滚用仓库旧文件。桥接问题见网关运维。
混合路由健康检查示例命令
openclaw status
curl -sS -m 5 http://127.0.0.1:18789/health || echo "gateway health probe failed"
openclaw doctor
openclaw health --json > /tmp/openclaw-health-hybrid-$(date +%Y%m%d%H%M).json
ollama serve
ollama pull llama3.1:8b
ollama serve只在承担本地推理的主机执行;模型标签请替换为团队批准列表。顺序强调:先进程与端口,再 HTTP,再静态 doctor,再结构化 health,最后管理本地模型生命周期。
故障转移:doctor、日志与云控制台如何分工
转移后要证明成功:openclaw status→curl 18789→openclaw doctor→归档 openclaw health --json→再按子系统看日志。云侧对照控制台/账单;本地分辨换出、并发与上下文。反代读超时可能卡重工具;季度预发演练密钥失效回落。与 SFTP 同机时错开维护窗口。通道细节见网关运维。
FAQ、总结与 SFTPMAC 托管远程 Mac 何时更划算
问答:生产应固定 Ollama 标签。health JSON建议每日且每次改配后存档。合规:混合可能部分出境、部分留本机,需数据分级。
- doctor 通过但空回复:查模型全名、密钥与 Ollama 常驻。
- 间歇 429:退避+可延后任务改本地(政策允许时)。
- 网关健康通道无声:查桥接令牌。
总结:清单+配额+阶梯+演练回退。
局限:纯云撞限额;纯本地封顶算力与模型新鲜度。
SFTPMAC:要7×24且与 SFTP/rsync 同机、减少睡眠漂移时,托管远程 Mac让网关与文件交付同叙事,更适合生产级 OpenClaw。
新站默认混合?
有回退模型、提示与监控再开。
日志保留?
热存≥14 天;合规加长冷存。
Linux 替代 Mac?
推理可;强依赖 macOS 工具链则 Mac。
需要与托管文件交付同机的稳定 Mac 网关?了解 SFTPMAC 方案并把混合路由落在可审计基础设施上。
