2026 年 OpenClaw v2026.4.26:ゲートウェイ CPU 100%、再起動 3〜4 分、chat.history 起動ブロック — 段階的ロールバック行列
v2026.4.26 で CPU 100% でも probe が緑に見える理由
OpenClaw v2026.4.26 へ上げた直後、本番ゲートウェイで CPU 100%、openclaw gateway restart が 3〜4 分応答しない、RPC とチャネルがコールドスタート完了まで使えない——そんな報告が続いています。ログの chat.history 再索引・compaction・migration は、履歴データが起動経路でゲートウェイの準備完了を塞いでいるサインです。本稿は監査可能な L0〜L4 段階的ロールバック行列 を示し、公式トラブルシュート・macOS 再起動・ログ運用・split brain・更新ロールバック と併読してください。
論点1:プロセス生存=ゲートウェイ準備完了ではない。 chat.history スキャン中は probe が一瞬緑でも RPC は遅延します。gateway status の Runtime、ログ時刻、チャネル挙動を揃えて見てください。
論点2:3〜4 分を launchd 故障と誤認。 多くは単一スレッド索引+ディスク I/O です。daemon 再インストールの前に 公式手順 の bootout/bootstrap を。
論点3:history の rm は最終手段。 タイムスタンプ付きアーカイブと件数・sha256 リストの後に限り truncate。
論点4:CLI とサービスの split brain。 L3 の前に split brain でパスを一致させる。
論点5:CPU 飽和時の再試行嵐。 429 や無応答チャネルと同時に provider を変えない。先に並列度とプラグインを絞る。
論点6:リモート Mac でビルド rsync と history が同一 NVMe。 コールドスタートが 90 秒から 240 秒へ漂う。ボリューム分離とプロセス別 CPU・読み取り IOPS を。
v2026.4.26 は設定未変更でも アップグレード後初回コールドスタートで history 全スキャン が走る事例が多いです。1 コア 100%、他コアアイドル——ホスト平均 CPU では見逃します。
3〜4 分のハングは、launchd が旧プロセス終了待ちの間に新プロセスが索引開始している重なりが典型です。bootout なしの強制終了はロックファイルを残します。
小規模 dev Mac は L2 で足りることも、数年分 JSONL の本番 Bot は L4 計画が必要です。層を飛ばすと監査不能なデータ緊急事態になります。
段階的ロールバック決定行列(L0〜L4)
| 層 | 信号 | アクション | リスク |
|---|---|---|---|
| L0 | CPU100%+chat.history | sample・doctor | 低 |
| L1 | 180–240秒 | プラグイン最小 | 中 |
| L2 | 索引再実行 | lazyLoad上限 | 中 |
| L3 | L2無効 | 2026.4.25固定 | 高 |
| L4 | history>5GB | 退避 | 高 |
七ステップ:再現・ロールバック・検証
# v2026.4.26 — gateway CPU / chat.history stall
openclaw --version
openclaw gateway --version
which -a openclaw
openclaw status
openclaw gateway status
openclaw doctor
openclaw logs --since 20m | rg -i 'chat\.history|index|migrate|compact|startup'
- 変更凍結:時刻、du -sh、PID。
- 再現:probe が 2 回緑まで計測。
- L0:history/index を特定。
- L1–L2:CPU 40% 未満目標。
- L3:回帰時のみ pin。
- L4:退避後 60 秒未満。
- 検証:channels probe と E2E。
参照数値(自環境で再計測)
| 指標 | 観測 | 閾値 | 次 |
|---|---|---|---|
| コールドスタート | 185–240s | >120秒 | L2 |
| アーカイブ後 | 35–55s | <60秒 | compaction |
| history | 2–8 GB | >5GB | L4 |
| ゲートウェイCPU | 1核100% | 90秒 | L0 |
| CLI待ち | 180–240s | launchd整合 | 二重kick禁止 |
リモート Mac 常駐運用
L3/L4 の前に スナップショット と マスキング済みログ。なければ前後比較できません。
リモート Mac では history を ビルド成果物と別ボリューム に。launchd の ExitTimeOut は実測 P95 以上。
FAQ
launchd 稼働中に ad hoc CLI? 個人 user で起動すると二重索引になりやすい。daemon アカウントの手順に従う。
中央値は自環境で再計測。L4 なしで 120 秒超→L2。history >5GB→計画 L4。
L2 を飛ばして L4? 緊急復旧かつスナップショット時のみ。
probe 緑だがチャットが重い? コールドスタート 120 秒超なら 公式階段 でモデル層へ。
まとめと SFTPMAC
v2026.4.5 の巨大 JSONL 記事との分担? 4.5 セッション runbook はファイルサイズ。本稿は起動時索引ブロック。両方必要なことも。
4.25 と 4.23 の pin? doctor が 4.26 のみならまず 4.25。 tarball を残す。
「もう一度 restart」では直りません。CPU 張り付き・再起動デッドタイム・chat.history ブロックを計測し、L0〜L4 を選ぶことが本体です。
自前運用では history 肥大とディスク・変更窓が恒常コスト。ゲートウェイと CI/SFTP が同居するとコールドスタートは出荷 SLA 事故になります。
SFTPMAC リモート Mac は history と rsync の IO 争いを前もって分離し、常駐とアップグレード窓をパッケージ化できます。プランをご確認ください。
L4 部分復元後はチャネルごとに 1 本テスト会話。probe が 2 間隔安定するまで provider レートは保守的に。