Mac mini M4 — компактный хост для Hermes Agent и персистентной памяти 7×24

2026 Hermes Agent на Mac mini M4: память 7×24 и матрица аренды удалённого Mac

В феврале 2026 Nous Research открыла Hermes Agent под MIT: агентный стек, где ценность — в накапливающейся памяти, а не в одноразовом чате. Состояние лежит в ~/.hermes/MEMORY.md, USER.md, skills/ — поверх трёх слоёв вместе с контекстом сессии. На Apple Silicon это естественно ложится на Mac mini M4 с 16 или 32 ГБ UMA: низкая мощность, native macOS, общая память CPU/GPU через Metal без дискретной VRAM. Но память «сгорает» при сне ноутбука; для команд нужен удалённый Mac в аренду с launchd и SFTP. Ниже — матрица хостов, цифры для RFC, семь жёстких ops-шагов и вывод, когда аренда SFTPMAC обгоняет железо в квартире.

1. Три боли, обнуляющие прирост памяти

В продакшене Hermes ломается не на «слабом LLM», а на инфраструктуре. Пройдите три гейта по порядку. Тикет «агент забыл» часто означает закрытую крышку ноутбука или другой HOME после пересоздания контейнера.

На каждый инцидент фиксируйте слой: процесс жив?, здоровье демона, согласованность файлов в ~/.hermes/, затем логика диалога. Без мониторинга ФС слой памяти невидим, хотя там месяцы предпочтений и runbook'ов.

  1. Сон и обрыв процесса. Контекст сессии исчезает с suspend; частичная запись в MEMORY.md даёт противоречивый recall skills. В 03:00 cron не отработал — не «забыл», а хост спал.
  2. Неверный tier UMA. 16 ГБ на M4 хватает одному оператору с API-моделями. Браузер, embeddings и шлюз OpenClaw на одном чипе часто держат RSS 12–14 ГБ — swap убивает latency tool-вызовов и тормозит обновление USER.md.
  3. Split-brain между dev-ноутбуком и «продом». Ручное копирование ~/.hermes/ без git даёт два USER-профиля; агент смешивает несовместимые предпочтения.

Если уже крутите OpenClaw, те же правила: probes шлюза и накопление Hermes требуют пользователя macOS 7×24. См. официальную лестницу restart gateway через launchd.

2. Три слоя памяти на диске

Nous Research описывает три кооперирующих слоя под ~/.hermes/ на машине, где реально крутится процесс. Релиз февраля 2026 под MIT — ставка на накопление, а не на один идеальный prompt; конкурентное преимущество измеряется неделями, не минутами.

Контекст сессии — эфемерная рабочая область: результаты tools, черновики, история одного прогона. Без flush в файлы теряется нюанс между вызовами tools.

Skill Documents — процедурная память в skills/: runbook'и, чеклисты релиза, доменные пайплайны. Версионируйте как Terraform: PR, diff, rollback.

Межсессионная модель пользователя в USER.md и долгие заметки в MEMORY.md. Отличие Hermes от stateless API — если завтра онлайн тот же диск.

Накопление буквальное: каждая удачная сессия обогащает дерево. Прервите цикл сном ноутбука — платите за повторный onboarding. Отсюда capex/opex аргумент за 7×24, а не за «идеальный prompt».

На Metal/UMA это особенно заметно: тяжёлые tool-вызовы и фоновые процессы конкурируют за тот же pool, что и ОС — поэтому 32 ГБ на M4 — не роскошь, а буфер для стабильных записей в MEMORY.md под нагрузкой, а не метрика для бенчмарков.

3. Матрица хостов

Перед закупкой mini или строкой аренды согласуйте таблицу с platform-командой. Она объясняет, почему дешёвый Linux VPS — плохая замена macOS-путей для markdown-памяти.

Измерение Ноутбук разработчика Linux VPS Свой Mac mini M4 Арендованный удалённый Mac
Uptime Плохой — sleep, поездки Хороший в ЦОД Хороший при стабильном питании/LAN Контрактный 7×24
Native macOS Да, риск личного custody Нет — контейнерное трение Да Да, изолированный tenant
UMA / Metal Зависит от MacBook Нет UMA на типичном VPS 16/32 ГБ, общая память с GPU Настраиваемые tier Apple Silicon
Потребление PUE ЦОД ~20–30 В idle-класс M4 mini В opex аренды
Доступ команды Screen sharing Только SSH VPN домой SFTP/VNC с ролями
Когда выбирать Эксперименты Боты без ~/.hermes Solo со статическим IP Прод Hermes + OpenClaw

Для каналов OpenClaw берите Mac, где уже зелёный openclaw doctorгайд по установке и troubleshooting. Hermes — второй supervised-сервис, не замена.

Правило из прод-раскаток: «плохую» ячейку матрицы не лечат RAM. Спящий ноутбук остаётся плохим с 64 ГБ; Linux без нативных путей ~/.hermes — плохим с Docker. Сначала модель эксплуатации (7×24, tenant, доступ), потом размер Silicon.

4. Mac mini M4: что важно для агентов

Mac mini M4 — тихий edge-узел: native macOS, UMA Apple Silicon, шасси под полку. Для Hermes решают пропускная способность памяти и устойчивая нагрузка, а не разовый Geekbench. На Apple Silicon CPU и GPU делят один pool — для tool-heavy агентов это плюс (меньше копий), минус (нет «выгрузить KV в VRAM»).

16 ГБ — один оператор, облачные LLM. 32 ГБ — браузерные драйверы, локальные векторы, multi-channel gateway. GPU делит pool с CPU через Metal; дискретной VRAM нет — закладывайте запас явно. Снимайте memory_pressure во время типичного skill-run, не в idle.

Термика mini на 7×24 лучше MacBook на ковре. UPS, вентиляция, APFS-снапшоты до экспериментов со skills — как для OpenClaw workspace в проде. Владелец ~/.hermes/ должен быть один сервисный UNIX-пользователь — иначе split-brain и путаница в правах.

Домашний NAT ломает webhook'и OpenClaw; Hermes в основном ест исходящий HTTPS к API моделей, но «рот» каналов требует стабильной фасады. Арендованный Mac с фиксированным окном обслуживания бьёт mini за роутером, когда клиент пишет в 03:00.

5. Семь шагов развёртывания и приёмки

Установка — одна curl-команда; зрелость — в supervision и приёмке. Ниже шаги с критериями для runbook: как у OpenClaw gateway, но с фокусом на файловое дерево памяти.

  1. Выделенный пользователь macOS. Сервисный аккаунт, не личный логин с почтой и cookies.
  2. Официальный installer. curl-пайплайн Nous Research от этого пользователя.
  3. Проверка ~/.hermes. Права, бэкап в scope сразу.
  4. Первый Skill Document. Один повторяемый workflow с критериями успеха.
  5. launchd. KeepAlive, логи, bootout/bootstrap — по аналогии с лестницей gateway restart.
  6. SFTP из CI. Skills с checksum, как артефакты сборки.
  7. Приёмка за три дня. Предпочтение в USER.md, recall на следующий день, смена skill на третий — без ручного копирования файлов.
# Шаг 2 — установка Hermes (февр. 2026, MIT)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# Шаг 3
ls -la ~/.hermes/
test -f ~/.hermes/MEMORY.md && test -f ~/.hermes/USER.md && test -d ~/.hermes/skills/

# Шаг 5
launchctl bootstrap gui/$(id -u) ~/Library/LaunchAgents/com.hermes.agent.plist

Если USER.md не обновляется — место на диске, Full Disk Access, вторая копия из iCloud с другого Mac: топ «ложной амнезии» после sleep. Снимите хеши MEMORY.md до/после сессии в runbook — так platform-команда отличает «модель не ответила» от «файл не записался».

Для команд из РФ/СНГ с импортозамещением: Hermes не привязан к одному облаку — API-ключи остаются вашими; критичен именно macOS-хост с предсказуемым диском и сетью, а не география дата-центра Linux-VPS без UMA.

6. Цифры для бюджета и архитектуры

Блок для RFC и security-анкет. Электричество округляйте под локальный тариф; порядок величин важнее точности до копейки на этапе Go/No-Go.

  • Лицензия: Hermes Agent, MIT, open source февраль 2026 (Nous Research).
  • Установка: install.sh с GitHub main (SHA в change ticket).
  • Каталог: ~/.hermes/ — MEMORY.md, USER.md, skills/.
  • Память M4: 16 ГБ вход, 32 ГБ при colocation с gateway.
  • Мощность: планируйте ~20–30 В idle mini M4 (масштабируйте по CPU).
  • SLA: 99,5%/мес (~3,6 ч простоя) — supervision + remote hands, не ноутбук.
  • Приёмка: три дня с доказуемыми обновлениями USER.md и skills.
  • RPO бэкапа: в проде целевой максимум 24 ч для USER.md/MEMORY.md; skills в Git — source of truth, runtime — производное.
  • Параллельность: M4 32 ГБ обычно тянет Hermes + OpenClaw gateway с 2–4 каналами средней нагрузки — выше только по метрикам.

Сравните capex своего mini + домашний IP с opex аренды (питание, канал, снапшоты, SFTP для трёх инженеров). При горизонте <12 мес аренда часто выигрывает в FinOps.

USER.md может содержать косвенные ПДн — определите удаление/экспорт до подключения клиентских данных, независимо от покупки или аренды хоста.

7. Соседство с OpenClaw на одном железе

OpenClaw — каналы (Telegram, Slack, WeChat ClawBot); Hermes — markdown-память на диске. На одном Mac: разные пользователи/логи/бэкапы, чтобы лог gateway не забил диск с MEMORY.md. Связка сильная: gateway отвечает в реальном времени, Hermes держит долгие предпочтения и процедуры.

Порядок: стабилизировать gateway (restart, probe, doctor), поставить Hermes, связать webhook'ами без общих /tmp. Апгрейды по одному breaking change на NVMe — не два во время инцидента. Если уже используете матрицу после openclaw update, рестарты Hermes кладите в то же change-окно.

Least privilege: shell-tools workspace OpenClaw не должны писать в USER.md без ревью. Prompt-injection в группе не должен стать вечной «настройкой». Зафиксируйте, какие каналы могут менять skills/, и кто мержит Git — как для инфраструктурного модуля.

8. Когда аренда удалённого Mac выигрывает

Три вывода. Свой Mac mini M4 — нормальный solo-setup: низкая мощность, native пути, 16–32 ГБ UMA. Узкое место — не install.sh, а uptime, custody и командный доступ к одному ~/.hermes/. Ноутбуки и домашний NAT врут тихо; Linux VPS экономит только если отказаться от macOS-workflow.

Типовые кейсы аренды: platform-команда ведёт Hermes-runbook'и, продуктовые команды вешают каналы OpenClaw; агентство держит tenant на клиента, чтобы не смешать USER.md; compliance требует снапшоты и журнал доступа, которые домашний lab не докажет. Общий знаменатель — дерево ~/.hermes/ онлайн 168 часов в неделю.

FinOps без маркетинга: цена mini + электричество за три года против месячной аренды без логистики железа. Если ценность видна с третьего месяца (зреют skills), аренда откладывает риск. Если два года гарантированного 7×24 — покупка может выиграть; тогда всё равно launchd и offsite-backup как у аренды.

Аренда удалённого Mac SFTPMAC — для тех, кто уже принял ограничения: UMA Apple Silicon под параллельные tools, backbone, launchd-playbook как у OpenClaw-прода, SFTP/rsync для skills. Аренда ускоряет кривую памяти, когда железо едет неделями или compliance требует tenant вместо личного iCloud.

Перед заказом ответьте: кто читает USER.md? где offsite-бэкап? кто получает alert, если daemon не поднялся после macOS-update? Если в команде нет ясности — аренда с документированным ops часто быстрее покупки «на кухне».

Hermes — память, OpenClaw — рот. Хостите оба там, где doctor в 03:00 зелёный, а не на машине, которую закрываете вечером. SFTPMAC — 7×24 Mac mini-класс: UMA Apple Silicon, SFTP-sync skills, launchd как в статьях этой серии про OpenClaw.

9. FAQ

Краткие ответы из архитектурных воркшопов. Не заменяют политику pin версий, но ускоряют первый Go/No-Go. При сомнениях сначала измерьте uptime хоста и целостность ~/.hermes, затем меняйте модель.

Отдельно: не смешивайте «память Hermes» с контекстом LLM в облаке — провайдер может хранить логи по своим правилам, тогда как USER.md остаётся вашей ответственностью на диске арендованного или собственного Mac.

Прод в мае 2026? MIT, активная разработка — pin версий, snapshot ~/.hermes, acceptance до корпоративных данных в USER.md.

Только Linux? Лабораторно да; многие runbook'и требуют Mac для браузера и Keychain.

Отличие от памяти OpenClaw? Дополняют: gateway-workspace vs ~/.hermes.

Главный убийца 7×24? Sleep ноутбука и skills без версий — сначала supervision, потом закупка RAM, не наоборот.

Официальная установка? curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash — в проде фиксируйте commit SHA репозитория Nous Research и храните вывод hermes --version в change-log каждого релиза.

Три слоя памяти кратко? Контекст сессии; Skill Documents в skills/; USER.md + MEMORY.md как межсессионная модель — всё под ~/.hermes/ на одном хосте 7×24.

Нужен ли OpenClaw обязательно? Нет — Hermes автономен; каналы добавляют позже, когда разделяют долгую память и ответы в мессенджерах.

Mac mini M4 против Studio? Для Hermes + gateway средней нагрузки mini M4 32 ГБ обычно достаточно; Studio имеет смысл при локальных моделях и очень длинном контексте на одном хосте — см. также матрицу ds4 для 128/512 ГБ.

Дальше: установка OpenClaw, restart gateway.