Comparatif matériel Hermes Agent : Raspberry Pi, serveur VPS et Mac mini M4

2026 Hermes Agent : trois mois sur Raspberry Pi, VPS et Mac mini M4 — la matrice que nous aurions voulue au jour 1

Après la publication de l'article sur la mémoire persistante 7j/7, les messages ont tous la même forme : « Je commence sur un Pi ou un VPS à 20 €, je migrerai plus tard. » Nous l'avons fait — quatre-vingt-dix jours, même arbre ~/.hermes/, trois machines. Hermes Agent (Nous Research, MIT, février 2026) récompense la continuité disque, pas l'ingéniosité du prompt. Voici le récit studio, la grille Pi / VPS / Mac mini M4, le TCO sur 24 mois, et le moment où la location Mac distant chez SFTPMAC cesse d'être un luxe pour devenir la ligne budgétaire la plus rationnelle.

1. Journal des 90 jours

Semaines 1–4 — Pi 5 (8 Go) dans un placard technique, alimentation officielle, SSD USB pour éviter la microSD. Installation install.sh OK. Premiers Skill Documents pour pipelines de livraison vidéo. À la quatrième semaine : Node + outils parallèles, moins de 500 Mo libres, swap visible, écritures MEMORY.md qui bloquent l'UI SSH. Un client Telegram a reçu une réponse « sans mémoire » — en réalité le daemon était en OOM killer.

Semaines 5–8 — VPS ARM Paris : ping excellent, snapshots automatiques. Échec silencieux : runbooks qui appellent Safari, Keychain, chemins /Users/…. Docker avec HOME monté ailleurs = deux profils USER.md fusionnés après copie manuelle. Le directeur artistique a perdu une après-midi à « réconcilier » des préférences de ton contradictoires.

Semaines 9–12 — Mac mini M4 32 Go : mêmes skills, launchd KeepAlive. Test d'acceptation : apprendre une préférence le lundi, la retrouver le mercredi sans rsync manuel. Génération d'un nouveau Skill Document : médiane ~8 s contre ~40 s sur Pi. Le VPS reste pour un bot cron sans mémoire ; le Pi pour flasher des images ; Hermes prod vit sur le Mac.

2. Ce que Hermes exige vraiment du matériel

Oubliez la rhétorique « un VPS suffit pour de l'IA ». Hermes accumule du markdown sous ~/.hermes/MEMORY.md, USER.md, skills/ — avec des flush fréquents et des outils concurrents. La charge ressemble à un petit serveur de build permanent, pas à un cron qui ping une API.

  • Machine éveillée : le portable du motion designer qui dort à 3 h du matin tue la couche session.
  • IO prévisible : carte SD et disques VPS surchargés punissent les petits fichiers.
  • RAM avec marge : 8 Go est un plafond, pas un plan de croissance.
  • macOS natif pour une partie des workflows communautaires (navigateur, signatures, chemins utilisateur).

3. Raspberry Pi : le labo qui grince

Le Pi séduit par le prix et l'empreinte carbone. Pour OpenClaw seul, notre matrice ARM64 encadre déjà Node 22 et le swap. Ajouter Hermes, c'est empiler un second univers Node sur le même silicium.

Réussites : pilote API-only, un skill minimal, clés cloud, zéro automate navigateur.

Échecs : régénération hebdomadaire de skills avec outils parallèles ; usure stockage ; indisponibilité pendant coupure électrique du plateau (le Pi partage le même multiprise que les lumières LED). Temps ingénieur > économie de courant.

Pour un studio, le Pi reste un bac à sable limité à quatorze jours avec date de sortie vers Mac — pas une prod créative 7j/7.

4. VPS Linux : disponibilité sans macOS

VPS 8 Go en UE : ~28 €/mois dans notre test. Uptime datacenter impeccable. Hermes y est expérimental ; la doc et les skills supposent souvent macOS. Nous avons brûlé deux semaines de « contournements Docker » avant de réserver le VPS aux tâches sans USER.md riche.

Gouvernance : USER.md a fini par contenir noms de campagnes et contraintes de ton client — données métier sensibles. Sans DPA clair avec l'hébergeur, la prod créative a gelé. Un Mac dédié (acheté ou loué) simplifie l'explication aux clients : un tenant, des logs, des sauvegardes nommées.

Lien utile : OpenClaw sur VPS headless pour les sondes gateway — orthogonale à la mémoire Hermes.

5. Mac mini M4 : l'arbre qui compose

Mac mini M4, 32 Go unifiés, SSD interne : silence de bureau, macOS natif, install.sh en minutes. C'est la seule plateforme où la métaphore « capitalisation » du disque tient sans copie manuelle hebdomadaire.

Mémoire unifiée : pas de VRAM séparée — planifiez 32 Go si gateway OpenClaw + embeddings légers + Hermes cohabitent. Sous charge créative typique nous avons vu 18–22 Go résidents — confortable ; sur 16 Go le swap revenait par intermittence.

Inconvénient achat : ~900 € configuré, IP domestique pour webhooks, vous gérez UPS et sauvegardes. Parfait pour un indépendant stable ; étroit pour trois freelances qui veulent pousser les skills en SFTP sans VPN maison.

6. Matrice décisionnelle

Dimension Raspberry Pi 5 VPS Linux 8 Go Mac mini M4 (achat) Mac distant loué
Stabilité ~/.hermes Fragile (swap/SD) Frottement chemins Solide (32 Go) Solide + SLA
Vitesse création skill Lente (~40 s médiane) Moyenne (~25 s) Rapide (~8 s) Rapide
7j/7 réel Risque domicile Datacenter Dépend UPS/FAO Contractuel
Runbooks macOS Non Contournements Oui Oui
Équipe SFTP skills Galère SSH brut VPN maison Rôles SFTP
Hermes-3 / local Non Non Oui (UMA) Oui
Verdict Labo <14 j Bots sans USER.md Solo stable Prod studio

7. TCO 24 mois (achat vs location)

Ordres de grandeur UE 2026, hors taxes — la relation compte plus que le centime.

Poste Pi VPS Achat M4 Location
24 mois hébergement / matériel ~120 € + SSD ~672 € ~900 € capex ~1 200–1 800 € opex
Électricité ~35 € Inclus ~120 € Inclus
Temps ops (estimé) +40 h incidents +25 h chemins/DPA +10 h +5 h
Seuil vs location Jamais prod OK sans mémoire riche Rentable ~18 mois Dès mois 1 si équipe ≥2

Si le bénéfice Hermes n'apparaît qu'après le troisième mois — skills et USER.md mûrissent lentement — la location repousse le risque capex. L'achat gagne sur 24 mois de run continu avec backup documenté. Ajoutez toujours le coût opportunité des après-midis perdues à fusionner des profils USER.md : dans notre test, une seule session de « réconciliation » a effacé l'économie de douze mois de VPS.

Pour les budgets créatifs, présentez la ligne « Mac distant » comme poste de production partagé — au même titre qu'un NAS ou une licence render farm — plutôt que comme dépense IT opaque.

8. Protocole de mesure et KPI reproductibles

Pour convaincre un product owner, nous avons suivi cinq indicateurs chaque semaine — pas des scores marketing, de la télémétrie d'exploitation.

  • p95 écriture skill : délai jusqu'à fichier stable sous skills/ (10 essais).
  • Rappel USER.md : préférence apprise toujours présente le lendemain matin (oui/non).
  • Uptime daemon : part d'heures sans redémarrage manuel SSH.
  • Swap journalier : critique sur Pi ; quasi nul sur M4 32 Go.
  • Heures incident : OOM, corruption, divergence de chemins.

Résultat synthétique : Pi — p95 skill >120 s en semaine 4, 18 Go swap/jour ; VPS — uptime 99,5 % mais 25 h incidents « chemins » ; M4 — p95 ~11 s, rappel 21/21 jours. Ces chiffres alimentent la colonne « Verdict » du tableau, pas une opinion de blog.

Côté gouvernance créative : archivez les KPI sans coller USER.md dans Slack. Hashez les chemins, gardez tailles et dates — traçabilité disponibilité sans retraitement de données client dans les tickets.

9. Hermes-3 et Atropos RL

Nous Research pousse Hermes-3 et Atropos RL pour boucles de feedback on-prem. Ça demande Apple Silicon — Pi et VPS standards sortent de la course. Hybride réaliste : mémoire Hermes sur Mac, inférence lourde via API ; le host mémoire reste néanmoins macOS stable.

Voir aussi ds4 inférence locale pour une autre facette UMA — la logique hardware se recoupe.

10. Coexistence avec OpenClaw

Le duo Hermes (mémoire) + OpenClaw (canaux) est courant dans les studios. Sur Pi : irréaliste (deux mondes Node). Sur VPS : gateway OK, mémoire Hermes non. Sur Mac acheté ou loué : viable avec utilisateurs séparés, rotation logs, backups distincts.

Ordre recommandé : stabiliser le gateway via le guide launchd, installer Hermes, puis activer les canaux. Un seul change window pour les upgrades macOS — évite les MEMORY.md à moitié écrits après coupure secteur.

Règle créative : un brief client dans Telegram ne doit pas écraser USER.md sans revue humaine ; les skills passent par pull request comme les exports After Effects versionnés.

11. Six étapes de déploiement

  1. Trancher : Pi/VPS avec date de fin ; prod sur M4 ou Mac loué.
  2. Utilisateur macOS dédié — pas d'iCloud sur ~/.hermes/.
  3. curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash — épingler le commit.
  4. Énergie : empêcher le sommeil ; UPS sur mini acheté.
  5. launchdmatrice santé daemon.
  6. SFTP : skills en Git, snapshot quotidien ; politique de suppression USER.md avant données client.

12. Location Mac distant : la quatrième colonne

Notre conclusion terrain : le Pi retourne au tiroir, le VPS sert aux crons sans mémoire, Hermes prod sur Mac distant loué — même classe M4, IP stable, SFTP pour skills comme artefacts CI, playbooks launchd alignés sur OpenClaw. Pour un studio dispersé, c'est moins cher que trois après-midis de fusion USER.md ratée.

Avant de commander : qui lit USER.md ? où sont les backups hors site ? qui alerte si le daemon ne remonte pas après mise à jour macOS ? Si personne ne répond clairement, la location avec runbook bat l'achat dans le placard technique.

SFTPMAC : Mac 7j/7 classe mini sans transformer le salon en datacenter — Hermes comme mémoire, OpenClaw comme bouche, un seul host surveillé.

13. FAQ

Pi 8 Go en prod créative ? Non au-delà de deux semaines de POC API.

VPS + Mac séparés ? Possible mais split-brain — un Mac 7j/7 pour les deux simplifie.

Plus gros Pi RAM ? Le goulot reste macOS absent et IO SD/USB.

16 Go sur M4 suffisent ? Pour API seule souvent oui ; avec automation navigateur et cache d'embeddings, une semaine de mesure Activity Monitor — au-delà de 14 Go résidents, passez à 32 Go.

Données client dans USER.md ? Traitez comme données métier sensibles : DPA hébergeur, backups nommés, droit à l'effacement documenté — le VPS « pas cher » sans contrat bloque souvent la signature.

Quand arrêter le Pi ? Dès que p95 skill dépasse 60 s deux semaines de suite ou que le rappel USER.md tombe sous 80 % — signaux de migration, pas d'optimisation prompt.

Location vs achat pour une équipe de trois ? Souvent location dès le mois 1 : SFTP partagé et SLA valent plus que l'économie capex d'un mini par freelance.

Lecture : mémoire 7j/7, restart gateway launchd.