OpenClaw v2026.4.26 ゲートウェイ CPU と chat.history 起動ブロック

2026 年 OpenClaw v2026.4.26:ゲートウェイ CPU 100%、再起動 3〜4 分、chat.history 起動ブロック — 段階的ロールバック行列

v2026.4.26 で CPU 100% でも probe が緑に見える理由

OpenClaw v2026.4.26 へ上げた直後、本番ゲートウェイで CPU 100%openclaw gateway restart3〜4 分応答しない、RPC とチャネルがコールドスタート完了まで使えない——そんな報告が続いています。ログの chat.history 再索引・compaction・migration は、履歴データが起動経路でゲートウェイの準備完了を塞いでいるサインです。本稿は監査可能な L0〜L4 段階的ロールバック行列 を示し、公式トラブルシュートmacOS 再起動ログ運用split brain更新ロールバック と併読してください。

論点1:プロセス生存=ゲートウェイ準備完了ではない。 chat.history スキャン中は probe が一瞬緑でも RPC は遅延します。gateway status の Runtime、ログ時刻、チャネル挙動を揃えて見てください。

論点2:3〜4 分を launchd 故障と誤認。 多くは単一スレッド索引+ディスク I/O です。daemon 再インストールの前に 公式手順 の bootout/bootstrap を。

論点3:history の rm は最終手段。 タイムスタンプ付きアーカイブと件数・sha256 リストの後に限り truncate。

論点4:CLI とサービスの split brain。 L3 の前に split brain でパスを一致させる。

論点5:CPU 飽和時の再試行嵐。 429 や無応答チャネルと同時に provider を変えない。先に並列度とプラグインを絞る。

論点6:リモート Mac でビルド rsync と history が同一 NVMe。 コールドスタートが 90 秒から 240 秒へ漂う。ボリューム分離とプロセス別 CPU・読み取り IOPS を。

v2026.4.26 は設定未変更でも アップグレード後初回コールドスタートで history 全スキャン が走る事例が多いです。1 コア 100%、他コアアイドル——ホスト平均 CPU では見逃します。

3〜4 分のハングは、launchd が旧プロセス終了待ちの間に新プロセスが索引開始している重なりが典型です。bootout なしの強制終了はロックファイルを残します。

小規模 dev Mac は L2 で足りることも、数年分 JSONL の本番 Bot は L4 計画が必要です。層を飛ばすと監査不能なデータ緊急事態になります。

段階的ロールバック決定行列(L0〜L4)

信号アクションリスク
L0CPU100%+chat.historysample・doctor
L1180–240秒プラグイン最小
L2索引再実行lazyLoad上限
L3L2無効2026.4.25固定
L4history>5GB退避

七ステップ:再現・ロールバック・検証

# v2026.4.26 — gateway CPU / chat.history stall
openclaw --version
openclaw gateway --version
which -a openclaw
openclaw status
openclaw gateway status
openclaw doctor
openclaw logs --since 20m | rg -i 'chat\.history|index|migrate|compact|startup'
  1. 変更凍結:時刻、du -sh、PID。
  2. 再現:probe が 2 回緑まで計測。
  3. L0:history/index を特定。
  4. L1–L2:CPU 40% 未満目標。
  5. L3:回帰時のみ pin。
  6. L4:退避後 60 秒未満。
  7. 検証:channels probe と E2E。

参照数値(自環境で再計測)

指標観測閾値
コールドスタート185–240s>120秒L2
アーカイブ後35–55s<60秒compaction
history2–8 GB>5GBL4
ゲートウェイCPU1核100%90秒L0
CLI待ち180–240slaunchd整合二重kick禁止

リモート Mac 常駐運用

L3/L4 の前に スナップショットマスキング済みログ。なければ前後比較できません。

リモート Mac では history を ビルド成果物と別ボリューム に。launchd の ExitTimeOut は実測 P95 以上。

FAQ

launchd 稼働中に ad hoc CLI? 個人 user で起動すると二重索引になりやすい。daemon アカウントの手順に従う。

中央値は自環境で再計測。L4 なしで 120 秒超→L2。history >5GB→計画 L4。

L2 を飛ばして L4? 緊急復旧かつスナップショット時のみ。

probe 緑だがチャットが重い? コールドスタート 120 秒超なら 公式階段 でモデル層へ。

まとめと SFTPMAC

v2026.4.5 の巨大 JSONL 記事との分担? 4.5 セッション runbook はファイルサイズ。本稿は起動時索引ブロック。両方必要なことも。

4.25 と 4.23 の pin? doctor が 4.26 のみならまず 4.25。 tarball を残す。

「もう一度 restart」では直りません。CPU 張り付き・再起動デッドタイム・chat.history ブロックを計測し、L0〜L4 を選ぶことが本体です。

自前運用では history 肥大とディスク・変更窓が恒常コスト。ゲートウェイと CI/SFTP が同居するとコールドスタートは出荷 SLA 事故になります。

SFTPMAC リモート Mac は history と rsync の IO 争いを前もって分離し、常駐とアップグレード窓をパッケージ化できます。プランをご確認ください。

L4 部分復元後はチャネルごとに 1 本テスト会話。probe が 2 間隔安定するまで provider レートは保守的に。