何時必須自訂 web_search 提供方
預設整合適合驗證流程;一旦涉及資料出境、發票封頂或安全部白名單,就需要把搜索遷到已審查的企業 API 或自建检索代理。自訂不是「换个 URL」,而是把身份、配额、观测与回滾寫進執行手冊,和 CI 金鑰同級管理。
內網知识库优先复用带 ACL 的检索服务,保证模型片段与人工控制台一致;需有人維護索引与降級。模型重試会放大 QPS,常在 token 上限前撞 429:拆 key、限流并把搜索 QPS 与 CPU/内存同表。
可用性要覆蓋公司正向代理、分屏 DNS、证书巡檢。筆電上 curl 成功不代表 systemd 服务账户同路徑可用;必須在同一用户、同一環境文件、同一 cgroup重現。
運維上,Telegram 通道与搜索整合都应服從同一套分層排障,避免 wiki 各写一套。读完 閘道運維 再改 JSON,可显著减少「doctor 绿但业务红」的玄學时间。
變更流程建议走程式碼審查:懂 SSRF 的 reviewer、CI 校驗 JSON schema、發布視窗内冷重啟並留快照,参考 升級与快照 的紀律。
痛點拆解
痛點 1:金鑰散落。把 Bearer 明文寫進同步盘里的 JSON,比 SSH 洩露更快。用環境变量間接引用,并设轮换节奏。
痛點 2:查詢串 SSRF。若後端对命中结果無腦二次抓取,模型可控字符串即可变成內網探測。伺服器端必須再校驗协议与主机。
痛點 3:doctor 盲區。doctor 解决本地一致性,不保证供應商 SLA;需金絲雀查詢与外撥監控。
痛點 4:熱重載≠子行程回收。与 MCP 文類似,改整合后倾向冷重啟并观察子行程与控點。
痛點 5:搜索当爬蟲。批量网页抓取应走專用抓取通道(限速、快取、robots),不要濫用 search 接口刷流量。
提供方选型決策矩陣
| 形態 | 優勢 | 成本 | 安全要点 | 適用 |
|---|---|---|---|---|
| 商业 JSON API | 合規叙事快 | 按量計費与突发加价 | 金鑰季度轮换、401 監控 | 已采购企業搜索的客戶 |
| 內網检索代理 | ACL 一致 | 索引与工程债 | 禁 file:// 与元資料 SSRF | 强隔離文件庫库 |
| 自建聚合 | 单价可控 | 運維与硬件 | 管理面单独加固 | 實驗室与專網 |
| 插件 shim | 可接老协议 | 多一个二進位补丁面 | 升級策略比照 MCP | 遺留 SOAP 等橋接 |
每環境一条主路徑;大版本后複審欄位,CI schema 校驗提前攔截。
openclaw.json 設定骨架(範例)
{
"tools": {
"web": {
"search": {
"provider": "customHttp",
"baseUrl": "https://search.corp.example/api/v1/query",
"auth": {
"type": "bearer",
"tokenEnv": "CORP_SEARCH_TOKEN"
},
"timeoutMs": 12000,
"maxResults": 8,
"allowedHosts": ["search.corp.example"]
}
}
}
}
欄位名以你所用版本為準;範例只描述結構。生產勿把權杖寫進 argv 或截图可見处。
步驟 1 備份 JSON 并記錄閘道執行用户。步驟 2 部署 HTTP 服务并接好 mTLS/网络策略。步驟 3 套用設定、冷重啟、執行 openclaw doctor。步驟 4 金絲雀查詢,日志層級 info 且脫敏。步驟 5 打开延遲与 HTTP 码面板再全量放開自動化。
可量化指標:别让帳單偷袭
按自動化与 key 统计 QPS,日限额 70% 軟告警;重試曲线与搜索疊圖防 backoff 風暴。p95 延遲单独看,DNS/TLS 问题常在尾部。摘要过大抬 token,可在代理截斷。保留脫敏 curl 重現;季度与財務對帳抓影子 key。
出站安全与 SSRF 同源思维
搜索是出站,但若後端跟链任意 URL,就与入站 Webhook 的 SSRF 面同源思考。對齊 生產加固文 的威脅模型,在設定层与防火墙雙層限制目标主机,日志带自動化識別便於溯源。
生產与預發權杖物理隔離,baseUrl 也分离,减少複製貼上事故。TLS 巡檢代理根证书要装进服务账户信任庫,不僅是管理員工作階段。
哪些自動化可無監督呼叫搜索、哪些必須走人機確認,应写成策略條款,与 HITL 文章同級的審批链。
与 MCP、网页抓取的分工
MCP 適合需要本地二進位或复杂工具鏈的场景,生命週期見 MCP 排障。web_search 应保持「薄 HTTP + 明确配额」。若把任意 URL 抓取叠进 search,会失去限速与合規邊界。
變更后冷重啟,再跑 doctor 与通道探針;TLS 邊緣見 反向代理;安裝漂移見 安裝對照。建议閱讀順序:閘道 → MCP → TLS → 本文 → SSRF。
術語表
tools.web.search:宣告搜索 HTTP 整合的 JSON 子树(具体键名随發行版)。
自訂提供方:非預設演示後端的自管或合約 API。
金絲雀查詢:固定语句用于發布后驗證时延与鉴权。
冷重啟:完整退出再拉起閘道进程以清快取状态。
doctor:本地設定/環境体检,不等于供應商監控。
出站策略:寫明自動化可访问的主机、端口与代理要求。
429:速率限制,应配合退避与告警。
分屏 DNS:内外解析同名不同地址。
託管遠端 Mac:SFTPMAC 提供的穩定 macOS 閘道与建置入口組合。
FAQ 与为什么考慮 SFTPMAC 託管遠端 Mac
搜索金鑰能跟大模型供應商共用吗?
不建议。拆分便於轮换、計費歸因与爆炸半徑控制。
只在公司內網有索引怎麼辦?
与 SSH 同等信任路徑接入 mesh/VPN,MTU 与 DNS 寫進同一 runbook。
总结:自訂 web_search = 設定 + 出站安全 + 观测;把它当生產整合而非隱藏瀏覽器。
侷限:自建閘道要同時維護代理、金鑰、磁碟与 Apple 側建置環境;若希望在線性与目录隔離外包、团队專注交付,SFTPMAC 託管遠端 Mac能把閘道穩定与 SFTP/rsync 面打包成可运营服务。
需要穩定 macOS 閘道与合規文件通道时,評估託管遠端 Mac 資源池与套餐說明。
