カスタム web_search プロバイダーが「大人の選択」になるとき
既定検索は試行までの時間を短くする設計であり、データ所在地・請求・外向き IP の許可リストといった本番要件は含まれません。カスタムプロバイダーは、HTTP 契約と金庫側の認証と可観測性を明示して選ぶ意思決定です。
規制領域は ACL 付き社内検索へ向け、429 はトークンより先に来るためキー分散とスロットリングを CPU と同列に書く。本番と同一ユーザーから検証し、プロキシとスプリット DNS を前提にする。運用は ゲートウェイ診断 を再利用し、外向きは SSRF 硬化 と同水準で扱う。変更は スナップショット で戻せる形にする。
痛みの分解
痛みその1:秘密の拡散。 JSON 直書きは同期ツール経由で先に漏えいしがちです。環境変数の間接参照と短期トークンを優先します。
痛みその2:検索パラメータ経由の SSRF。 任意クエリで先頭 URL を無検証取得するなら SSRF の再実装です。サーバ側許可リストと内部 URL 剥ぎ取りが必要です。
痛みその3:doctor の偽陰性。 ローカル整合性のみなので、カナリアクエリと外部プローブを併用します。
痛みその4:ホットリロード対クリーン再起動。 MCP のライフサイクル と同様、JSON が部分適用ならプロセス再生成が要ります。
痛みその5:検索とスクレイピングの混同。 大量取得はキャッシュと robots 意識のある取得ツールへ分離します。
プロバイダー選定マトリクス
| 形態 | 強み | コスト | 注意 | 向く先 |
|---|---|---|---|---|
| ベンダー API | 既承認なら説明が短い | 従量+バースト | キー更新、401 監視 | 契約検索あり |
| 社内プロキシ | ACL スニペット | 実装と鮮度 | file:///メタ SSRF | ゼロトラスト文書 |
| 自前メタ検索 | コスト・エアギャップ | 運用と機材 | 管理 UI 硬化 | ラボ/規制枠 |
| シムプロセス | コア非フォーク | 追加バイナリ | MCP 級の更新 | レガシー橋渡し |
環境ごとに主系を一つにし、メジャーアップ後にスキーマキーの移りを再確認します。
tools.web.search の設定スケルトン
{
"tools": {
"web": {
"search": {
"provider": "customHttp",
"baseUrl": "https://search.corp.example/api/v1/query",
"auth": {
"type": "bearer",
"tokenEnv": "CORP_SEARCH_TOKEN"
},
"timeoutMs": 12000,
"maxResults": 8,
"allowedHosts": ["search.corp.example"]
}
}
}
}
キー名はリリース準拠。トークンは環境変数。JSON→再起動→doctor→カナリア→監視の順。
請求サプライズを防ぐ定量ガードレール
時間帯・自動化・キー別にクエリを計測し、日次上限の七割で警告し、非クリティカルから停止します。p50/p95 を分け、リトライとクエリを並べて隠れ増幅を見ます。スニペット長はプロキシで切り詰め、伏せた curl 再現と請求突合を四半期で回します。
外向きセキュリティと SSRF 境界
スニペット URL の追従取得はスキームとホスト検証が前提です。SSRF 硬化 と思考を揃え、許可リストに加え外向き FW で二重化します。トークンと baseUrl は本番とステージを分離し、TLS インスペクション環境ではサービスユーザーのトラストストアへ CA を載せます。
MCP、web_fetch、web_search の実務差
MCP は stdio/再起動 参照。web_search は薄い HTTP に限定し、任意 URL は取得専用ツールへ。web_fetch 併用時はサイズ上限を明記。変更後 ゲートウェイ と TLS を点検。
検索運用の用語集
tools.web.search:HTTP 検索宣言。カスタムプロバイダー:自前/契約 API。カナリア:固定文試験。クリーン再起動:統合状態リセット。doctor:ローカル検査のみ。SSRF:文字列 URL 化の偽造。許可リスト:外向きホスト。429:レート制限。ホスト型リモート Mac:SFTPMAC 管理 Mac。
FAQ とホスト型 Mac の橋渡し
検索は LLM プロバイダーとキーを共有すべきですか?
いいえ。分離するとローテーション、課金帰属、爆発半径の切り分けが簡単です。
IPv6 外向きの計画は必要ですか?
ベンダーが IPv6 を好む、またはホストが既定で有効なら、ファイアウォールの対称性を確認しないと検索が不安定に見えます。
検索 API がオンプレのみの場合は?
SSH と同じメッシュや VPN 経路を信頼し、MTU と DNS 依存を OpenClaw の導入メモである インストール手順 の横に書き添えます。
まとめ: カスタム web_search は設定と外向きセキュリティと可観測性のセットです。隠しブラウザタブ扱いにしないでください。
限界: 自己管理はプロキシ・トークン・ディスク・ビルドホストの積み上げです。SFTPMAC ホスト型リモート Mac は成果物配布で培ったアップタイムと入口を束ね、検索方針が変わる長時間稼働の OpenClaw と相性が良いです。
読む順はゲートウェイ→MCP→TLS→本稿→SSRF で揃え、新奇さより一貫性を優先します。
準拠したファイル配布と安定した macOS ゲートウェイが両方要る場合は、SFTPMAC のプランを確認してください。
