2026 Hermes Agent Hardware-Test: Raspberry Pi, VPS und Mac mini M4 — Drei Monate, eine Entscheidungsmatrix
Wer Hermes Agent von Nous Research (MIT, Februar 2026) ernst nimmt, landet fast immer bei derselben Frage: Muss das wirklich ein Mac mini M4 sein, oder reichen Raspberry Pi 5 und ein günstiger Linux-VPS? Wir haben dieselbe ~/.hermes/-Konfiguration — MEMORY.md, USER.md, versionierte skills/ — über 90 Kalendertage auf drei Hosts rotiert: Pi im Heimnetz, VPS in Frankfurt (ARM, 8 GB), Mac mini M4 mit 32 GB Unified Memory. Ergebnis: Nur eine Plattform hielt die Versprechen der drei Speicherschichten ohne wöchentliche manuelle Rettungsaktionen. Dieser Bericht liefert die Vergleichsmatrix, 24-Monats-TCO und DSGVO-relevante Datenhoheit — plus die Linie, wann SFTPMAC Remote-Mac-Miete Pi und VPS zusammen schlägt.
1. Drei Monate in Kurzform: was wann brach
Monat 1 (Pi): Installation per install.sh lief durch, erste Skill Documents entstanden. Ab Woche drei: Node-Hintergrundprozesse plus parallele Tool-Aufrufe drückten RAM unter 400 MB frei; Swap auf microSD verlängerte Schreibvorgänge in MEMORY.md von Sekunden auf Minuten. Ein Stromausfall ohne UPS korruptierte ein Skill-File — Backup aus Git rettete, USER.md musste manuell bereinigt werden.
Monat 2 (VPS): Ping stabil, 99,9 % Erreichbarkeit im Rechenzentrum. Problem: Browser-Automation und Keychain-nahe Hermes-Runbooks erwarteten macOS-Pfade; Workarounds in Docker erzeugten ein zweites HOME. DSGVO-Review: USER.md enthielt E-Mail-Muster und Projekt-Codenamen — ohne AV-Vertrag mit dem VPS-Anbieter war das für ein deutsches SaaS-Team ein Stop-Schild.
Monat 3 (Mac mini M4): Dieselben Skills, launchd KeepAlive, kein Sleep. USER.md-Präferenzen über drei aufeinanderfolgende Werktage ohne Kopieraktion abrufbar. Skill-Generierung (API-gestützt, aber mit lokalem Embedding-Cache) fiel von ~45 s Median auf Pi auf ~8 s auf M4 — nicht wegen „schnellerem Modell“, sondern wegen IO und RAM ohne Swap-Thrashing.
Der Pi blieb als Laborgerät; der VPS für stateless Cron-Bots ohne ~/.hermes; Produktion wanderte auf M4 bzw. später auf einen gemieteten Remote-Mac mit dokumentiertem Mandanten.
2. Was Hermes wirklich vom Silizium verlangt
Hermes ist kein Chat-Widget. Persistenz unter ~/.hermes/ bedeutet: viele kleine Schreibvorgänge, wachsende Markdown-Bäume, gelegentlich parallele Tool-Runner. Die Last sieht eher nach „langsamem Build-Server“ aus als nach „einmal pro Stunde API-Call“.
- 7×24 ohne Sleep: Jede Unterbrechung setzt Sitzungskontext zurück; unvollständige Flushes wirken wie Amnesie.
- IO-Latenz auf lokaler SSD: microSD und überlastete VPS-Disks sind Killer für Skill-Sync.
- RAM-Puffer: 8 GB klingt großzügig, bis OpenClaw-Gateway, Node und Browser-Tools denselben Pool teilen.
- Datenhoheit: USER.md kann indirekt personenbezogene Daten enthalten — Speicherort und Zugriff müssen erklärbar sein (Art. 5, 32 DSGVO).
Wer gestern die 7×24-Speicherarchitektur gelesen hat, erkennt: Hardware ist die Umsetzung dieser Architektur, nicht ein Nice-to-have.
3. Raspberry Pi 5: günstig, laut, fragil
Der Pi 5 (8 GB) lockt mit ~120 € Hardware und ~5 W Dauerlast. Für OpenClaw auf ARM64 haben wir bereits Probes dokumentiert — siehe ARM64-Gateway-Matrix. Hermes addiert einen zweiten Node-Stack und dateibasierte Hot Paths.
Was funktionierte: API-only-Betrieb mit einem schlanken Skill, externe LLM-Keys, kein Browser-Treiber. Akzeptanztest Tag 1–7 bestanden.
Was scheiterte: Parallele Tool-Aufrufe + wöchentliche Skill-Regeneration; SD-Karten-Verschleiß bei Swap; fehlende native macOS-Automation für Runbooks, die Safari oder Shortcuts erwarten. Nach 30 Tagen war der Median für „neues Skill Document generieren und committen“ dreimal so hoch wie auf M4 — Ingenieurzeit teurer als Stromersparnis.
DSGVO: Pi im Heimnetz bedeutet: Sie sind Verantwortlicher und Betreiber. iCloud-Sync auf demselben Apple-ID-Konto wie private Fotos ist ein vermeidbarer Datenfluss — dedizierter Benutzer, kein iCloud für Produktions-~/.hermes/.
4. Linux-VPS: Uptime ohne macOS-Wurzeln
Ein 8-GB-ARM-VPS in der EU kostete im Test ~28 €/Monat inkl. Backup-Snapshot. Erreichbarkeit top, Latenz zu OpenRouter <40 ms von Frankfurt — für reine API-Agenten attraktiv.
Hermes auf Linux ist experimentell; die Runbooks in der Community setzen oft macOS voraus. Unser Team verlor zwei Wochen mit Pfad-Mapping und fehlenden GUI-Tools, bevor wir aufgaben und den VPS nur noch für Zustandslose Webhooks nutzten.
Datenhoheit: Für USER.md mit Kundennamen brauchten wir AV-Vertrag, Subprozessor-Liste, Löschfristen. Günstige VPS ohne EU-Rechenzentrum-Nachweis fielen durch Security-Questionnaire. Lokale Verarbeitung auf eigenem Mac mini oder gemietetem dedizierten Mandanten-Mac war für das Legal-Team einfacher zu begründen als „Shared-KVM in unbekannter Jurisdiktion“.
Vergleichbar mit OpenClaw Linux-VPS Headless: Gateway-Probes laufen; Hermes-Speicher mit macOS-Semantik nicht.
5. Mac mini M4: der einzige stabile Speicherbaum
Mac mini M4, 32 GB UMA, NVMe intern: leise, ~25 W unter Agentenlast, natives macOS. install.sh in zehn Minuten, launchd wie bei OpenClaw-Produktion. Drei-Tage-Akzeptanz (USER.md lernt, Skill ändert sich, Verhalten bleibt) — erst hier ohne manuelles Kopieren grün.
Unified Memory bedeutet: kein separates VRAM — Tool-Spitzen und OS teilen einen Pool. 32 GB war Puffer, nicht Luxus, sobald ein leichtes Embedding-Modell neben dem Gateway lief. Activity Monitor zeigte unter Last 18–22 GB resident — auf 16 GB wäre Swap zurückgekehrt.
Nachteil: Kaufpreis ~900 € (Konfiguration mit 32 GB), Heim-IP für Webhooks, Sie tragen Betrieb und Backup. Für Solo-Entwickler mit stabiler Leitung stimmig; für drei Platform-Ingenieure mit SFTP-Zugriff oft zu eng.
6. Entscheidungsmatrix Pi / VPS / M4 / Miete
Die Tabelle fasst den 90-Tage-Test zusammen — keine Benchmark-Fantasie, sondern Betriebsrealität in DACH-Teams.
| Dimension | Raspberry Pi 5 (8 GB) | Linux-VPS (8 GB EU) | Eigener Mac mini M4 | Remote Mac (Miete) |
|---|---|---|---|---|
| ~/.hermes-Stabilität | Fragil unter Swap/SD | Pfad-Reibung, kein natives macOS | Stabil mit 32 GB | Stabil + SLA |
| Skill-Schreib-Latenz (Median) | ~45 s | ~25 s (ohne GUI-Tools) | ~8 s | ~8–10 s |
| 7×24-Verfügbarkeit | Heim-Stromrisiko | Rechenzentrum | Heim + UPS nötig | Vertraglich |
| DSGVO / lokale Daten | Selbstverantwortung Heim | AV-Vertrag Pflicht | Volle Kontrolle lokal | Mandant + Dokumentation |
| Team-SFTP auf Skills | Umständlich | SSH only | VPN ins Heimnetz | Native SFTP-Rollen |
| Hermes-3 lokal / Metal | Nein | Nein | Ja (UMA) | Ja (konfigurierbar) |
| Empfehlung | Labor <14 Tage | Stateless ohne USER.md | Solo, stabile IP | Produktion + Team |
Regel: Wenn zwei Spalten „Fragil“ oder „Pflicht AV“ zeigen, ist der günstigste Listenpreis irrelevant — Versunkene Ingenieurzeit im ersten Quartal übersteigt Hardware.
7. 24-Monats-TCO inklusive Versunkenem
Grobe Planungszahlen (2026, EU, ohne Steuer). Passen Sie Mietpreise an Ihr Angebot an; die Relation bleibt.
| Posten | Pi 5 | VPS | M4 Kauf | Remote-Miete |
|---|---|---|---|---|
| Hardware / Hosting 24 Mo | ~€120 + SD | ~€672 (28×24) | ~€900 einmalig | ~€1.200–1.800 (50–75×24) |
| Strom 24 Mo (~5–25 W) | ~€35 | inkl. | ~€120 | inkl. |
| Versunkene Ops (geschätzt) | +40 h Incidents | +25 h Pfad/DPA | +10 h | +5 h |
| Break-even vs. Miete | nie Produktion | ohne USER.md ok | ab ~18 Mo | ab Monat 1 wenn Team≥2 |
Wenn Hermes-Nutzen erst nach dem dritten Monat sichtbar wird — Skills und USER.md reifen langsam — verschiebt Miete Capex-Risiko nach hinten. Kauf lohnt bei zweijährigem 7×24-Betrieb und klarem Backup-Runbook.
8. Messmethode und reproduzierbare KPIs
Damit Platform-Teams die Matrix in interne RFCs übernehmen können, haben wir dieselben fünf KPIs wöchentlich erfasst — unabhängig vom Host. Kein Marketing-Benchmark, sondern Betriebstelemetrie aus Journald/Activity Monitor und einfachen Shell-Timern.
- p95 Skill-Write: Zeit von «Skill regenerieren» bis stabiler
skills/*.mdauf Disk (10 Läufe, Median und p95). - USER.md Recall: nach Nacht-Test Präferenz noch vorhanden? (binär ja/nein pro Tag).
- Daemon-Uptime: Anteil Stunden mit laufendem Hermes-Prozess ohne manuelles SSH.
- Swap-In GB/Tag: auf Pi/VPS kritisch; auf M4 nahe null bei 32 GB.
- Incident-Stunden: menschliche Intervention wegen OOM, Korruption, Pfad-Drift.
Auf dem Pi stieg p95 Skill-Write in Woche vier auf über 120 s; Swap-In summierte sich auf 18 GB/Tag. VPS stabilisierte Uptime auf 99,5 %, aber Incident-Stunden durch Pfad-Mapping blieben hoch. M4: p95 ~11 s, Swap-In <0,1 GB/Tag, Recall 21/21 Tage grün. Diese Zahlen rechtfertigen die Spalte «Empfehlung» — nicht subjektiver Geschmack.
Für DSGVO-Dokumentation empfehlen wir, KPI-Exporte ohne Klartext aus USER.md zu archivieren (nur Hashes von Pfaden, Größen, mtime). So bleibt Nachvollziehbarkeit der Verfügbarkeit ohne erneute Verarbeitung personenbezogener Inhalte in Tickets.
9. Hermes-3, Atropos RL und lokale Inferenz
Nous Research positioniert Hermes-3 und Atropos RL für Teams, die Feedback-Schleifen on-device oder on-prem wollen. Das erfordert Apple Silicon UMA — Pi und Standard-VPS scheiden aus. Auf M4 bleibt die Frage 16 vs. 32 GB: RL-Experimente und parallele Evaluierungen zogen im Test eher zur 32-GB-Linie.
Hybrid bleibt valide: Hermes-Speicher auf Mac, schwere Inferenz über API — aber der Speicherhost muss trotzdem macOS-stabil sein. Unser ds4-Lokalinferenz-Leitfaden ergänzt die GPU/UMA-Diskussion für andere Modelle; Hermes-3 teilt dieselbe Hardware-Logik.
10. OpenClaw auf demselben Host
Viele Leser kombinieren Hermes-Gedächtnis mit OpenClaw-Kanälen. Auf Pi war das unrealistisch: zwei Node-Ökosysteme + Gateway-Probes sprengten 8 GB. Auf VPS lief OpenClaw headless stabil, Hermes-Speicher nicht. Auf M4 (und gemietetem Remote-Mac) cohabitieren beide, wenn Sie getrennte UNIX-Benutzer, Log-Rotation und Backup-Scopes fahren.
Sequenz aus Produktion: zuerst Gateway gemäß launchd-Diagnoseleiter, dann Hermes installieren, dann Kanäle — nie zwei Breaking-Upgrades auf einem Volume am selben Freitag. Least-Privilege: Gruppenchat darf USER.md nicht ungeprüft beschreiben; Skills nur über Git-Merge.
Wenn Ihr Team bereits den Update-Leitfaden nach Gateway-Ausfall nutzt, hängen Sie Hermes-Neustarts in dasselbe Change-Fenster. Getrennte Wartungsnächte erhöhen die Wahrscheinlichkeit halb geschriebener MEMORY.md-Dateien nach Stromverlust.
11. Sechs Betriebsschritte nach der Wahl
- Plattform festlegen — Pi/VPS nur mit Exit-Datum; Produktion auf M4 oder Miet-Mandant.
- Dedizierten macOS-Benutzer — kein Admin, keine iCloud auf
~/.hermes/. - install.sh — Commit-SHA pinnen:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash - Energie & Sleep — „Prevent sleep“, UPS am Mini, oder Miet-Host mit SLA.
- launchd — KeepAlive; siehe launchd-Gesundheitsmatrix.
- SFTP-Backup — Skills aus Git, Runtime-Snapshot täglich; Löschkonzept für USER.md vor Kundendaten.
ls -la ~/.hermes/
test -f ~/.hermes/MEMORY.md && test -f ~/.hermes/USER.md
launchctl bootstrap gui/$(id -u) ~/Library/LaunchAgents/com.hermes.agent.plist
12. Remote-Mac-Miete als vierte Spalte
Nach 90 Tagen blieb der Pi im Regal, der VPS für headless Cron, Hermes-Produktion auf gemietetem Remote-Mac: gleiche M4-Klasse, dokumentierte Zugriffe, SFTP für Skills wie CI-Artefakte, launchd-Playbooks wie in unserer OpenClaw-Reihe. Für DACH-Teams mit AV-Anforderungen schlägt das „28 € VPS ohne Vertrag“ — nicht weil der VPS schlecht ist, sondern weil lokale Datenkontrolle und Team-Zugriff zusammenfallen müssen.
Prüfen Sie vor Bestellung: Wer darf USER.md lesen? Wo liegen Offsite-Backups in der EU? Wer alarmiert bei Daemon-Ausfall nach macOS-Update? Wenn keine Antwort klar ist, ist Miete mit Betriebsdokumentation schneller als Kauf plus implizite Familien-IT.
SFTPMAC liefert 7×24 Mac-mini-Klasse ohne Wohnzimmer-Rechenzentrum: Mandantentrennung, SFTP-Skill-Sync, launchd-Disziplin — Hermes als Gedächtnis, OpenClaw als Kanäle auf demselben überwachten Host.
13. FAQ
Pi 8 GB für Hermes dauerhaft? Nur für kurze API-Piloten; Produktion mit wachsenden Skills: M4 oder Miete.
VPS in der USA? Zusätzliche Transferrisiken; für USER.md EU-Host oder eigener Mac bevorzugen. Dokumentieren Sie Auftragsverarbeitung und Löschfristen im Verarbeitungsverzeichnis.
OpenClaw auf dem Pi, Hermes auf M4? Möglich, aber Split-Brain zwischen Hosts — ein 7×24-Mac für beide ist einfacher.
Größter Fehler im Test? USER.md auf Pi ohne Backup vor SD-Korruption.
Reicht 16 GB M4? Für API-only und einen Kanal oft ja; mit Browser-Tools und Embedding-Cache messen Sie eine Woche — bei dauerhaft >14 GB resident lieber 32 GB oder Miet-Tier.
Muss ~/.hermes in der EU liegen? Nicht automatisch gesetzlich für jedes Setup, aber für B2B mit personenbezogenen Präferenzen in USER.md ist erklärbarer Standort plus AV-Vertrag die gängige Linie — Heim-Pi und US-VPS ohne Vertrag scheitern im Review.
Wie lange Pi-Experiment? Maximal 14 Tage mit dokumentiertem Migrationsdatum; länger verbrennt Versunkene Kosten in Skills, die Sie später auf M4 neu validieren müssen.
Weiterlesen: Speicherarchitektur, Pi OpenClaw, OpenClaw-Handbuch.