2026 Hermes Agent: 90 дней на Raspberry Pi, VPS и Mac mini M4 — какая платформа держит ~/.hermes
Hermes Agent (Nous Research, MIT, февраль 2026) накапливает состояние в ~/.hermes/, а не в облачной сессии. Мы прогнали один и тот же набор MEMORY.md, USER.md и skills/ через три хоста за 90 календарных дней: Raspberry Pi 5 8 ГБ, ARM VPS 8 ГБ (EU), Mac mini M4 32 ГБ UMA. На Pi и VPS память «рвалась» из‑за swap и путей; на M4 — единый пул CPU/GPU через Metal без дискретной VRAM, стабильный RSS и предсказуемый flush на NVMe. Ниже — хроника, матрица Pi/VPS/M4/аренда, TCO 24 месяца и связка с архитектурой 7×24. Когда capex на mini не окупается к третьему месяцу, аренда удалённого Mac SFTPMAC остаётся той же silicon-класс без домашнего NAT.
1. Хроника 90 дней по неделям
Недели 1–4, Pi 5: install.sh OK, Node 22 aarch64. Параллельные tool-вызовы + фоновый gateway probe съели RAM; memory_pressure ушёл в warn, swap на USB-SSD — медиана записи skill ~45 с. OOM killer снял daemon в 02:14 — тикет «агент забыл» был инфраструктурой, не моделью.
Недели 5–8, VPS: RTT к API <40 ms, snapshots OK. Docker с альтернативным HOME дал split-brain: два USER.md после ручного rsync. Runbook'и с Safari/Keychain на Linux не поднялись без костылей — две недели инженерного времени.
Недели 9–12, Mac mini M4: тот же skill tree, launchctl KeepAlive. RSS 18–22 ГБ под Hermes + лёгкий embedding + OpenClaw gateway — запас в UMA, swap не трогал latency tool-вызовов. Медиана генерации SKILL.md ~8 с. Приёмка памяти за три дня без ручного копирования — зелёная.
2. Нагрузочный профиль Hermes на железе
Hermes — это постоянные мелкие записи markdown, конкуренция за RAM с Node и опционально браузерными драйверами, чувствительность к IO latency. Это ближе к «always-on build agent», чем к cron раз в час.
- 7×24 — suspend ноутбука обнуляет session layer.
- Локальный NVMe — microSD и перегруженные VPS-диски удлиняют flush в
MEMORY.md. - UMA headroom — на Apple Silicon GPU и CPU делят один pool; отдельной VRAM нет, планируйте 32 ГБ при colocation с gateway.
- macOS paths — часть community skills предполагает реальный Mac, не эмуляцию в контейнере.
3. Raspberry Pi: ARM без UMA
Pi 5 8 ГБ дешёв в capex (~$120 класс), ~5 W. Для OpenClaw на ARM64 см. матрицу gateway probe — Hermes добавляет второй тяжёлый Node и hot path на диск. На aarch64 нет unified memory pool уровня Apple Silicon: каждый spike tool-вызовов бьёт в общий RAM без «видеопамяти сбоку», и ядро быстрее уходит в swap на медленном носителе.
Мы намеренно вынесли root FS на USB-SSD, не microSD — без этого p95 skill write был ещё хуже. Даже так, при параллельном cron и gateway probe RSS упирался в потолок. free -h показывал «доступно» обманчиво, пока vm_stat не раскрыл swapins — типичная ловушка для тех, кто смотрит только на load average.
Работало: API-only, один skill, без browser automation.
Не выдержало: еженедельная регенерация skills с параллельными tools; swap; отсутствие Metal/UMA для будущего Hermes-3 on-device. Bandwidth RAM→storage на Pi не сравним с внутренним NVMe M4 при пиках записи.
Вердикт: лаборатория не дольше 14 дней с датой миграции на Mac.
4. VPS: uptime без macOS и Metal
VPS 8 ГБ EU ~€28/мес: отличный ping, но нет unified memory и нет Metal. Hermes на Linux экспериментален; пути и GUI-tools ломают runbook'и. Мы оставили VPS для stateless cron без богатого USER.md.
Технически VPS выигрывает по uptime в DC, но проигрывает по семантике путей: /home/deploy vs /Users/agent, Keychain, Safari-driven skills. Docker с bind-mount ~/.hermes создал третий вариант HOME — после rsync агент «помнил» противоречивые тоны. Для platform-команды это дороже, чем +€20/мес к тарифу Mac-класса.
Сетевой профиль: исходящий HTTPS к API стабилен; входящие webhooks для OpenClaw требуют отдельной фасады. Hermes сам по себе терпимее к NAT, но если рот — каналы на том же хосте, VPS без публичного IP и без reverse tunnel снова даёт тишину в 03:00.
Сравните с headless OpenClaw на VPS — probes проходят, markdown-память macOS — нет.
5. Mac mini M4: UMA, bandwidth, NVMe
M4 32 ГБ: один memory pool для OS, Node, лёгких embeddings и GPU-участка через Metal. Под типичной нагрузкой RSS 18–22 ГБ — на 16 ГБ видели intermittent swap, что бьёт по latency обновления USER.md сильнее, чем median token latency API. Bandwidth между CPU и «GPU-частью» — это DRAM bandwidth чипа, не PCIe к дискретной карте; при планировании colocation Hermes + OpenClaw закладывайте 6–8 ГБ запаса под пики tool-вызовов, а не только под модель API.
NVMe внутри корпуса сглаживает хвосты записи markdown: на Pi p99 fsync заметно выше, на VPS зависит от соседей по гипервизору. Для персистентного агента хвост IO важнее среднего ping до OpenRouter.
NVMe внутри корпуса снижает tail latency записи skill относительно Pi/VPS с медленным томом. Термика mini терпит 7×24 лучше MacBook на ткани — важно для launchd без thermal throttle в ночных cron.
Минус покупки: ~$900–1000 конфигурация, домашний NAT для webhooks, вы сами делаете backup и мониторинг ~/.hermes/.
6. Матрица Pi / VPS / M4 / аренда
| Измерение | Pi 5 8 ГБ | VPS ARM 8 ГБ | Свой Mac mini M4 | Аренда удалённого Mac |
|---|---|---|---|---|
| Стабильность ~/.hermes | Хрупко (swap) | Пути/Docker | Стабильно (32 ГБ UMA) | Стабильно + SLA |
| Медиана skill write | ~45 с | ~25 с | ~8 с | ~8–10 с |
| Metal / UMA | Нет | Нет | Да | Да (tier) |
| 7×24 | Риск дома | DC | UPS нужен | Контракт |
| Командный SFTP | Сложно | Только SSH | VPN домой | Роли SFTP |
| Hermes-3 local | Нет | Нет | Да | Да |
| Вердикт | Lab <14 d | Без rich USER.md | Solo stable | Prod + team |
Для архитектурного комитета: приложите к RFC эту матрицу и недельные KPI (p95 skill, swap, recall USER.md), а не скриншот цены VPS. Если два столбца помечены «хрупко» или «нет Metal», экономия на хостинге съедается инцидентами в первом квартале — мы это видели на Pi и VPS до миграции на M4.
7. TCO 24 месяца
| Статья | Pi | VPS | Покупка M4 | Аренда |
|---|---|---|---|---|
| 24 мес hosting/capex | ~$120 + диск | ~$670 | ~$950 | ~$1200–1800 opex |
| Электричество | ~$40 | вкл. | ~$130 | вкл. |
| Ops (оценка) | +40 ч | +25 ч | +10 ч | +5 ч |
| Break-even vs аренда | не prod | OK stateless | ~18 мес | с 1-го мес при team≥2 |
Если ROI памяти виден только после третьего месяца, аренда переносит риск capex. Покупка выигрывает при двух годах непрерывного 7×24 и документированном backup ~/.hermes/.
Учитывайте sunk cost инженерных часов: один postmortem после split-brain USER.md на VPS съел ~12 часов — это сопоставимо с кварталом аренды M4-класса. В RFC закладывайте не только €/$ железа, но и p95 incident hours из раздела метрик.
8. Метрики: swap, memory_pressure, p95 skill
Чтобы матрица попала в RFC, мы фиксировали пять KPI еженедельно — без «субъективно быстрее».
- p95 skill write — от триггера регенерации до стабильного
skills/*.md(10 прогонов). - USER.md recall — предпочтение на месте после ночи (да/нет).
- Daemon uptime — доля часов без ручного SSH restart.
- Swap GB/день — на Pi критично; на M4 32 ГБ UMA ≈0.
- Incident hours — OOM, corruption, path drift.
Pi: p95 skill >120 с к неделе 4, swap ~18 ГБ/сутки, memory_pressure в warn часами. VPS: uptime 99,5 %, но +25 ч на Docker/HOME. M4: p95 ~11 с, vm_stat без swap storms, recall 21/21. На Metal/UMA это видно в Activity Monitor как единый resident pool 18–22 ГБ — не «GPU VRAM отдельно».
Для postmortem не вкладывайте USER.md в тикеты — только hash пути, size, mtime. Availability trace без повторной обработки PII.
9. Hermes-3, Atropos RL и локальный inference
Hermes-3 и Atropos RL предполагают on-prem циклы — это Apple Silicon UMA/Metal, не Pi/VPS. Гибрид: память на Mac, тяжёлый inference в API — host памяти всё равно macOS 7×24. См. ds4 локально на Mac для смежной UMA-арифметики.
10. OpenClaw на том же UMA-хосте
Hermes (память) + OpenClaw (каналы) на одном чипе — только если хватает UMA. Pi: два Node-стека — OOM. VPS: gateway probe ок, ~/.hermes — нет. M4/аренда: разные UNIX-пользователи, раздельные логи и backup scope.
Порядок: стабилизировать gateway по launchd-лестнице, затем Hermes, затем каналы. Два breaking upgrade в одну ночь на одном NVMe — риск полузаписанного MEMORY.md.
Tool-вызовы и gateway делят bandwidth RAM↔CPU через UMA; не планируйте «ещё 4 ГБ VRAM докупим» — такого слоя на Apple Silicon нет. Colocation с OpenClaw — аргумент за 32 ГБ, не за разнесение на Pi.
11. Шесть ops-шагов
- Зафиксировать платформу: Pi/VPS — с датой выхода; prod — M4 или аренда.
- Выделенный пользователь macOS, без iCloud на
~/.hermes/. curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash— pin commit.- Запрет sleep; UPS на своём mini.
- launchd — матрица daemon health.
- SFTP: skills из Git, ежедневный snapshot, мониторинг FS для
MEMORY.md.
ls -la ~/.hermes/
vm_stat | head -5 # контроль swap на UMA
launchctl bootstrap gui/$(id -u) ~/Library/LaunchAgents/com.hermes.agent.plist
12. Аренда удалённого Mac
Итог теста: Pi — полка, VPS — cron без памяти, Hermes prod — M4-класс в аренде: тот же UMA/Metal tier, backbone, SFTP на skills, launchd как в лестнице restart gateway. Split-brain между Pi и Mac дороже аренды одного tenant.
Перед заказом: кто читает USER.md? где offsite backup? кто алертит, если daemon не поднялся после macOS update?
Сценарии из продакшена СНГ/EU: platform-команда держит Hermes runbook'и для внутренних ops; продуктовые сквады цепляют OpenClaw-каналы; агентство — отдельный tenant на клиента, чтобы USER.md не смешивал брифы. Общий знаменатель — один NVMe-дерево 168 ч/нед, предсказуемый UMA tier, SFTP с checksum как для build artifacts.
SFTPMAC — 7×24 Mac mini class без домашнего ЦОД: Hermes как память, OpenClaw как каналы, один monitored host. Перед заказом сравните 24-месячный TCO с таблицей выше — аренда часто выигрывает до 18-го месяца при team≥2, даже если capex mini кажется ниже на бумаге.
13. FAQ
Pi 8 ГБ в prod? Только короткий API-PoC.
VPS США? Добавляет latency и вопросы к данным в USER.md — EU или свой Mac.
OpenClaw на Pi, Hermes на Mac? Возможно, но два дерева — один 7×24 Mac проще.
Главная ошибка теста? USER.md на Pi без backup до коррупции тома.
16 ГБ M4 хватит? Для API-only часто да; с browser tools и embedding cache неделю мерьте RSS — стабильно >14 ГБ → 32 ГБ или tier аренды.
Как читать vm_stat? Рост swapins при плоском free RAM на UMA — сигнал миграции с Pi/VPS, не тюнинг prompt.
Когда Pi выключать? p95 skill >60 с две недели подряд или recall USER.md <80 % — порог миграции на Metal-хост.
Аренда vs покупка для команды 3+? Часто аренда с месяца 1: SFTP на skills и SLA дешевле трёх split-brain инцидентов.
Нужен ли Metal для API-only Hermes? Не обязательно с первого дня, но UMA-запас и NVMe IO на M4 стабилизируют запись MEMORY.md; Pi/VPS остаются заметным риском при росте skills.
Читать далее: память 7×24, Pi OpenClaw.