Welche lokalen Modelle laufen auf 16 GB Mac mini M4?

16 GB Unified Memory eignen sich für quantisierte 7B–13B-Modelle wie Qwen2.5 7B oder Llama 3.1 8B; 70B-Klassen brauchen M4 Pro mit 48–64 GB.

Können OpenClaw und OpenHuman auf derselben Maschine laufen?

Ja, mit getrennten LaunchAgent-Labels und RAM-Monitoring; für parallele lokale Inferenz empfehlen wir 32 GB als Startlinie.

Warum kein Linux-VPS für OpenClaw?

LaunchAgent-Daemon und OpenHumans Tauri-GUI setzen natives macOS voraus; Linux liefert weder Neural Engine noch gleichwertige Desktop-Integration.

Ist lokale Inferenz DSGVO-freundlicher?

Ja, wenn Prompts und Memory Tree auf einem EU-Remote-Mac mit dokumentierter Mandantentrennung bleiben und Cloud-Fallback deaktiviert ist.

2026 OpenClaw & OpenHuman auf gemietetem Mac mini M4: Lokaler KI-Agent mit Ollama — Deployment-Leitfaden

OpenClaw steuert autonome Agenten über Telegram, WhatsApp und Discord; OpenHuman baut mit Memory Tree einen „erinnernden“ Desktop-Assistenten — beide sprechen Ollama für lokale Inferenz. Die Install-Skripte sind in unter einer Stunde erledigt. Der Engpass ist nicht brew install, sondern ein macOS-Host, der 7×24 wach bleibt, DSGVO-tauglich betrieben werden kann und Apple Silicon für quantisierte Modelle bereitstellt. Dieser Leitfaden liefert die Entscheidungsmatrix zwischen beiden Frameworks, konkrete M4-Sizing-Zahlen, LaunchAgent-Betrieb auf gemieteten Remote-Macs und eine Kostenlinie für Teams in Deutschland, Österreich und der Schweiz.

1. Infrastruktur-Schmerz: Wo soll der Agent leben?

Im Frühjahr 2026 verschiebt sich der Wettbewerb bei KI-Agenten von „welches Cloud-API ist am stärksten?“ zu „wer kann dauerhaft, privat und auditierbar produzieren?“. Für DACH-Unternehmen kommt die DSGVO-Schicht hinzu: personenbezogene Präferenzen in Memory Tree, OAuth-Tokens für Gmail oder Slack und Konversationslogs in OpenClaw-Workspaces sind Verarbeitungstätigkeiten — nicht nur „Tech-Spielerei“. Wer alles auf US-APIs mit unklarem Subprozessor-Status legt, trägt das Restrisiko selbst.

Drei Alltags-Szenarien erklären, warum der Laptop scheitert. Erstens: Der MacBook-Deckel fällt zu, der LaunchAgent-Daemon von openclaw onboard --install-daemon überlebt den Sleep-Modus nicht zuverlässig — Telegram meldet „Bot offline“, obwohl gestern alles grün war. Zweitens: Ein selbst gekaufter Mac mini M4 kostet schnell vier- bis sechsstellige Euro-Beträge inklusive Lieferzeit; für einen dreimonatigen Pilot fehlt die Geduld. Drittens: AWS- oder GCP-Instanzen sind zwar 7×24, aber Linux — OpenClaws launchd-Pfad und OpenHumans Tauri-Oberfläche laufen dort nur mit Abstrichen; die Apple Neural Engine fehlt komplett.

Gemietete, dedizierte Mac-mini-M4-Knoten sind der Mittelweg, den wir in Kundenprojekten am häufigsten empfehlen: SSH und VNC in etwa zehn Minuten, 1-Gbit-Anbindung, feste IP für Webhook-Callbacks, Apple Silicon für 13B-Modelle auf 16 GB akzeptabel und M4 Pro mit 64 GB für 70B-Quantisierung. Der Mandant bleibt physisch getrennt — relevant für Art. 32 DSGVO (Trennung von Verarbeitungsumgebungen). Voraussetzung: Admin-Rechte auf dem Remote-Mac und Homebrew installiert; prüfen Sie mit sysctl -n hw.memsize und uname -m, dass arm64 vorliegt.

2. OpenClaw vs. OpenHuman — Entscheidungsmatrix

Beide Projekte teilen Ollama als lokale Schicht, zielen aber auf unterschiedliche Operatoren. OpenClaw ist das Werkzeug für Teams, die aus dem Handy heraus Server-Aktionen auslösen wollen; OpenHuman richtet sich an Wissensarbeiter, die einen Desktop-Assistenten mit Langzeitgedächtnis und Kalender-Integration erwarten. Die Lizenzwahl hat Compliance-Folgen: MIT bei OpenClaw erlaubt breite interne Nutzung; GPL-3.0 bei OpenHuman verlangt bei Weitergabe von Derivaten Offenlegung — prüfen Sie das mit Ihrer Rechtsabteilung, bevor Sie Forks in Kundenprojekten einsetzen.

Dimension	OpenClaw	OpenHuman
Lizenz	MIT	GPL-3.0
Interaktion	CLI + Telegram/WhatsApp/Discord	Desktop-GUI, Sprache, Google Meet
Gedächtnis	Workspace / Plugin-Erweiterungen	Memory Tree nativ
Lokales Modell	Ollama (OpenAI-kompatibler Endpunkt)	Ollama / LM Studio (`config.toml`)
Typischer Einsatz	Kanal-Automation, Ops-Bots	Persönlicher Super-Assistent, Notion/Gmail
DSGVO-Hinweis	Kanal-Logs und Tokens im Workspace	Memory Tree kann personenbezogene Präferenzen enthalten

Faustregel: „Befehl per Handy, Ausführung auf dem Server“ → OpenClaw. „Erinnere dich an meine Gewohnheiten der letzten drei Wochen und nimm an Meetings teil“ → OpenHuman. Beide parallel sind möglich, erfordern aber getrennte LaunchAgent-Labels und RAM-Budget — siehe unsere Hermes-Leitlinie zur Multi-Agent-Koexistenz für launchd-Disziplin auf demselben Host.

3. Hardware und Cloud-Node-Auswahl

Unified Memory auf Apple Silicon ist der gemeinsame Pool für CPU, GPU und Neural Engine — anders als bei NVIDIA-VPS mit fester VRAM-Grenze. Das vereinfacht Ollama-Betrieb, macht aber Oversubscription teuer: swap auf NVMe zerstört Latenz für Echtzeit-Kanäle.

16 GB M4: Cloud-API als Primärmodell, lokale 7B–13B-Modelle (Qwen2.5 7B, Llama 3.1 8B) für datensensitive Zwischenschritte; Leistungsaufnahme im Dauerbetrieb oft 8–15 W — relevant für Nebenkosten vs. Desktop-GPU.
32 GB: OpenClaw-Hauptagent plus zwei bis drei Sub-Agenten und eine 13B-Ollama-Instanz parallel; empfohlene Linie für DACH-Piloten mit gemischter Cloud- und Lokal-Route.
M4 Pro 48–64 GB: Zero-Cloud-Ziel mit 30B–70B quantisiert; OpenHuman mit großem Kontext und gleichzeitigem GUI-Betrieb über VNC.
Region: EU-Knoten (Frankfurt, Amsterdam) für DSGVO-Rechenzentrum-Nähe; personenbezogene Memory-Tree-Daten nicht in unkontrollierte US-Public-Cloud-Syncs legen.

Node.js ≥ 22 ist Pflicht — das OpenClaw-Install-Skript kann Node 24 mitbringen. macOS 14 Sonoma oder neuer. Nach Node-Bereitstellung: Remote Login aktivieren, dedizierten macOS-Benutzer für Produktion anlegen, damit HOME-Drift wie in unseren systemd-/launchd-Artikeln nicht auftritt.

4. OpenClaw + Ollama + LaunchAgent in fünf Schritten

Der folgende Ablauf setzt einen frischen Remote-Mac voraus. Dokumentieren Sie jeden Schritt für Ihr ISMS — Auditoren fragen nach „wer hat wann welches Modell aktiviert“.

Ollama installieren und Modelle ziehen:

brew install ollama
ollama pull qwen2.5:7b
# optional: ollama pull llama3.1:8b

OpenClaw installieren (offizielles Skript, Node 24 empfohlen):

curl -fsSL https://openclaw.ai/install.sh | bash
openclaw onboard --install-daemon

Lokale Inferenz anbinden: In ~/.openclaw/openclaw.json (oder json5) baseUrl auf http://127.0.0.1:11434/v1, Hauptmodell z. B. ollama/qwen2.5:7b. OLLAMA_KEEP_ALIVE=-1 reduziert Cold-Start nach Leerlauf.
Kanäle konfigurieren: Im Onboard-Wizard Telegram-Bot-Token oder WhatsApp; nach Plugin-Installation openclaw gateway restart, dann openclaw channels status --probe. Grün ohne Antwort? Unser Kanal-Probe-Runbook in der OpenClaw-Reihe hilft weiter.
Sicherheit: openclaw security audit --fix für Ausführungsgrenzen; Gateway niemals unauthentifiziert auf 0.0.0.0 binden — besonders auf gemieteten Hosts mit öffentlicher IP.

Der LaunchAgent aus --install-daemon überlebt SSH-Disconnect — der zentrale Vorteil gegenüber dem Entwickler-Laptop. Nach Upgrades bei Split-Brain zwischen CLI und Service: Meta-Version und doctor ausrichten, dann erneut proben.

Abnahme-Checkliste für Produktion. Führen Sie in dieser Reihenfolge aus: openclaw doctor ohne rote Flags; openclaw gateway status mit erwarteter Build-Revision; openclaw channels status --probe mit Antwortlatenz unter Ihrer internen Schwelle (typisch < 3 s für Telegram bei EU-Node); abschließend eine Testnachricht vom Handy, die einen Tool-Aufruf auslöst. Dokumentieren Sie Screenshots oder Log-Auszüge für das ISMS — besonders wenn personenbezogene Inhalte in der Antwort verarbeitet werden. Bei gemieteten Remote-Macs empfiehlt sich ein wöchentlicher Cron, der nur die Probe ausführt und bei Nicht-OK an Ihr Monitoring geht; unser launchd-Neustart-Leitfaden beschreibt, wie Sie Restart-Schleifen vermeiden, wenn doctor bereits grün war.

Ollama-Tuning auf M4. Quantisierte Modelle (q4_K_M) sind der Sweet Spot für 16 GB: Qwen2.5 7B liefert auf Apple Silicon oft 25–40 Token/s — ausreichend für Ops-Bots, nicht für Echtzeit-Diktat. Setzen Sie OLLAMA_MAX_LOADED_MODELS=1, wenn nur ein Kanal aktiv ist; bei Multi-Agent-Szenarien lieber ein größerer Miet-Knoten als aggressives Parallel-Loading. Warmup nach Reboot: einmal ollama run qwen2.5:7b "ping" vor der ersten Kundennachricht, damit der erste User-Request nicht in Cold-Start läuft.

5. OpenHuman v0.53: Installation und lokale KI

curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash

Lokale Inferenz ist standardmäßig aus — bewusst, weil GPU/RAM-Last und DSGVO-Einwilligung gekoppelt sein sollten. In config.toml:

local_ai.runtime_enabled = true
local_ai.opt_in_confirmed = true

Ollama- oder LM-Studio-Endpunkt auf Port 11434. Beim ersten Onboarding für Gmail, Notion oder Slack: OAuth mit minimalen Scopes — nur Leserechte, wo möglich; dokumentieren Sie Verarbeitungsverzeichnis-Einträge für Drittanbieter-Integrationen. Memory Tree strukturiert Wochenpläne und Präferenzen retrieval-freundlich; OpenClaw hat kein eingebautes Langzeitgedächtnis auf gleichem Niveau — die Frameworks ergänzen sich: einer für Nachrichten-Automation, einer für Desktop-Tiefe.

OpenHuman-GUI auf dem Remote-Mac erfordert VNC oder Bildschirmfreigabe. Reine Backend-Szenarien: OpenClaw plus Kanäle als Primärpfad, OpenHuman als zweite Instanz mit begrenzter Modell-Parallelität. Prüfen Sie mit dem Datenschutzbeauftragten, ob Meeting-Audio in Google Meet als besondere Kategorie personenbezogener Daten gilt.

6. Multi-Agent-Ressourcen, DSGVO und Sicherheit

RAM-Budget: Ollama hält ein 7B-q4-Modell oft bei 5–8 GB resident; OpenClaw-Gateway plus OpenHuman-Desktop gemeinsam → 32 GB als praktische Untergrenze.
Prozessisolierung: Eigene LaunchAgent-Labels, getrennte Log-Verzeichnisse; OLLAMA_NUM_PARALLEL nicht zu hoch setzen — swap ist der stille Kanal-Killer.
Backup ohne Git-Leak: ~/.openclaw und OpenHuman-Konfiguration per SFTP/rsync auf Admin-Workstation; API-Keys und OAuth-Refresh-Tokens nie in Repositories.
Datenminimierung: Für rein EU-interne Texte Qwen2.5 oder Mistral lokal; Cloud-Fallback-Provider in openclaw.json deaktivieren, wenn keine Standardvertragsklauseln vorliegen.
Auftragsverarbeitung: Bei Miet-Mac Vertrag mit Anbieter prüfen: Löschung bei Kündigung, kein Multi-Tenant auf derselben Platte, optional AV-Vertrag nach Art. 28 DSGVO.
Protokollierung: Gateway-Logs redigieren vor Weitergabe an SIEM — siehe unseren Remote-Mac-Log-Leitfaden in der OpenClaw-Serie.

Wer zusätzlich Hermes Agent für Skill-Evolution nutzt, sollte drei getrennte Speicherbäume führen — Hermes unter ~/.hermes/, OpenClaw-Workspace, OpenHuman Memory Tree. Vermischung erzeugt widersprüchliche Nutzerprofile und erschwert Löschkonzepte nach Art. 17 DSGVO.

DSGVO-Vertiefung für DACH-Betrieb. Art. 5 Abs. 1 lit. f verlangt angemessene Sicherheit — auf einem Agent-Host bedeutet das: Verschlüsselung der Festplatte (FileVault auf dem Remote-Mac), Zugriff nur per SSH-Key ohne Passwort-Login, regelmäßige Rotation der Telegram-Bot-Tokens und dokumentierte Löschfristen für Konversations-Exports. Wenn OpenHuman Gmail anbindet, ist Google oft Auftragsverarbeiter; Ihr Verzeichnis von Verarbeitungstätigkeiten sollte Zweck, Rechtsgrundlage und Speicherdauer für Memory-Tree-Einträge nennen. Lokale Inferenz mit Qwen2.5 reduziert Datenübermittlung in Drittländer — ersetzt aber nicht die Pflicht, bei Cloud-Fallback in openclaw.json erneut zu prüfen, ob Standardvertragsklauseln vorliegen. Gemietete Mandanten-Macs erleichtern die Trennung: Kunde A und Kunde B erhalten physisch getrennte Instanzen statt Namespaces auf einem VPS, den Sie selbst hardenen müssten.

Typische Miet-Szenarien. Ein Platform-Team betreibt OpenClaw für interne Ops-Runbooks per Telegram, während Produkt OpenHuman für persönliche Wissensarbeit testet — beide auf demselben 32-GB-Miet-Mac mit getrennten Unix-Usern. Eine Agentur hält pro Endkunde einen isolierten Mini, damit Memory Tree und OAuth-Tokens nicht vermischt werden. Ein Compliance-Officer verlangt Snapshots vor jedem Modell-Upgrade — per SFTP/rsync in Minuten erledigt, ohne Techniker vor Ort. In allen Fällen ist der gemeinsame Nenner: launchd hält Dienste am Leben, während Ihr Team per SSH Konfigurationen rollt.

7. Kostenvergleich, FAQ und nächste Schritte

Option	24-Monats-Größenordnung	Hauptlimit
Eigener M4 16 GB	Hardware ca. 600–900 € + Strom	Abschreibung, Heimnetz-Uplink, keine SLA
Cloud-GPU (A10-Klasse)	Oft > 200 €/Monat	Kein macOS, US-Region, variable Rechnung
Mac mini M4 Miete	Monatliche Opex, Kurzzeit-Pilot möglich	Vertrauen in physische Isolation und Löschung

Q: Nur Cloud-API, kein lokales Modell? 16 GB Miet-Node reicht; Ollama optional weglassen, OpenClaw mit Claude oder OpenAI betreiben — trotzdem LaunchAgent für 7×24.

Q: OpenClaw vs. Hermes? Hermes stark bei selbst-evolvierenden Skills; OpenClaw/OpenHuman bei Kanälen und Desktop-Ökosystem. Hardware-Vergleich: 90-Tage-Test Pi, VPS, M4.

Q: 16 GB — welches maximale Modell? Quantisierte 7B–13B stabil; 70B nur mit M4 Pro 48–64 GB.

Q: Linux-VPS als Sparoption? Für reine OpenClaw-CLI-Experimente möglich; LaunchAgent-Qualität und OpenHuman-GUI fehlen — siehe unsere Linux-VPS-Probe-Matrix.

Q: Wie migriere ich von Laptop auf Miet-Mac? Stoppen Sie lokale Dienste, rsync ~/.openclaw und Ollama-Modellcache (~/.ollama), auf dem Remote-Mac dieselbe Unix-UID wenn möglich, dann openclaw gateway restart und Probe. OpenHuman: config.toml und Memory-Tree-Verzeichnis mit übernehmen; OAuth ggf. neu autorisieren, weil Redirect-URLs sich ändern können.

Q: Welche Modelle für Deutsch? Qwen2.5 7B und Mistral-Varianten liefern brauchbare DE-Antworten lokal; für juristische Texte weiterhin Cloud-Modelle mit Vertrag prüfen oder größeren lokalen Checkpoint auf M4 Pro fahren.

8. Fazit: Frameworks sind schnell — der Wert liegt im dauerhaften macOS

OpenClaw und OpenHuman lassen sich in unter einer Stunde installieren. Was den Produktionswert ausmacht: Neural Engine dauerhaft verfügbar, LaunchAgent überlebt SSH-Abbruch, Konfiguration und Modelle sind per SFTP versionierbar und DSGVO-Löschungen sind auf einem Mandanten-Mac nachvollziehbar. Laptop, billiger Linux-VPS und improvisiertes Docker scheitern typischerweise gleichzeitig bei „Kanal scheinbar online“, „lokales Modell OOM“ und „GUI nicht nativ“.

Haben Sie sich für lokal-first plus Nachrichten- oder Desktop-Doppelspur entschieden, gehört der Gateway- und Workspace-Baum auf einen ständig online Apple-Silicon-Knoten. SFTPMAC Remote Mac mini M4 liefert dedizierte Physik, launchd-Baseline und EU-nahe Regionen: schneller als Hardwarekauf, näher an macOS als Cloud-GPU, besser für Telegram/WhatsApp-Callbacks als Heim-Fritzbox — damit Sie Modellwahl und Skills optimieren, statt um drei Uhr nachts das Gateway neu zu starten.

Weiterlesen: Hermes Persistent Memory, Gateway-Neustart launchd, Split-Brain nach Upgrade.