2026 Cursor Agent Skills Leitfaden: SKILL.md, Skill-vs-Rule-Matrix und Remote-Mac-7×24-Entscheidung
Wenn Ihr Team in jedem neuen Cursor-Chat dieselbe Deploy-Checkliste einfügt — Tests vor Commit, Staging nur nach Freigabe, Production mit zweiter Bestätigung — haben Sie kein Modellproblem, sondern ein Wissensmanagement-Problem. 2026 standardisieren Cursor, Claude Code und OpenClaw auf agentskills.io: wiederverwendbare Abläufe landen in SKILL.md und werden nur geladen, wenn die Aufgabe passt. Dieser Leitfaden liefert die Skill-vs-Rule-Matrix, das dreistufige Lademodell, fünf konkrete Erstellungsschritte und eine DSGVO-bewusste Entscheidung, warum 7×24-Agent-Gateways auf einem Remote Mac stabiler sind als auf dem Entwickler-MacBook.
1. Drei Schmerzpunkte: Prompt-Wiederholung, Kontext, fehlende Versionierung
KI-Assistenten schreiben heute Code, rufen APIs über MCP auf und öffnen Pull Requests. In wachsenden DACH-Teams sehen wir dieselben drei Reibungspunkte — unabhängig davon, ob das Gateway OpenClaw, Hermes oder reines Cursor Agent ist.
- Wiederholte manuelle Prompts. Jede Person formuliert Deploy- und Review-Checklisten neu; wechselt das Modell oder der Chat, ist das Wissen weg. Das kostet Audit-Zeit und erzeugt inkonsistente Releases.
- Kontextfenster wird verbraucht. Wer ganze Runbooks in die Systemnachricht klebt, reduziert den Token-Budget für eigentliche Implementierung. Gerade bei langen Monorepos ist das messbar in langsameren Diffs und teureren API-Rechnungen.
- Kein versionierbares Betriebswissen. Mundregeln lassen sich nicht per Pull Request reviewen; Onboarding bleibt mündliche Tradition. Für Verarbeitungsverzeichnisse und interne IT-Security-Reviews ist das unzureichend, wenn Agenten produktive Systeme berühren.
Agent Skills kapseln diese Lücke: spezialisierte Playbooks, die der Agent zur richtigen Zeit lädt — nicht dauerhaft wie Rules, nicht wegwerfbar wie ein einmaliger Prompt. In Compliance-Projekten empfiehlt es sich, Skills wie interne Verfahrensanweisungen zu behandeln: Autor, Änderungsgrund, Reviewer — alles in Git nachvollziehbar.
Typisches Szenario in FinTech- oder Health-Tech-Teams: Ein Senior-Engineer hinterlässt im Chat „bitte immer HIPAA-konforme Logs“. Drei Wochen später nutzt ein Junior dasselbe Repo mit einem anderen Modell — die Anweisung ist verschwunden. Ein Skill hipaa-deploy-guard mit klarer description („wenn Production-Deploy oder PHI-Touch“) und Referenzdokument zur Maskierung macht das Verhalten reproduzierbar. Das ist keine Garantie für Compliance, aber eine deutlich bessere Evidenzkette als Chat-Verlauf.
2. Skill vs. Rule: Vergleichsmatrix
Rules und Skills ergänzen sich. Verwechseln Sie sie nicht: Rules sind das „Betriebssystem“ des Verhaltens, Skills sind die „SOP“ für komplexe Einsätze. Die folgende Matrix hilft bei Architektur-Reviews mit Security und Platform Engineering.
| Dimension | Rule (Regel) | Skill (Fähigkeit) |
|---|---|---|
| Ladezeitpunkt | Dauerhaft in der Session aktiv | Bei passender Aufgabe on-demand |
| Typischer Inhalt | Benennung, kein force push, Git-Sicherheit, DSGVO-Hinweise zu Logs | Staging-Deploy, PR-Erstellung, Security-Audit, OpenClaw doctor-Schichten |
| Kontextkosten | Fixer Overhead pro Chat | Nur bei Aktivierung; Skriptausgabe statt voller Skriptquelle |
| Team-Analogie | Onboarding-Handzettel | Release-Manager-Runbook |
| Bezug zu MCP | Ruft APIs nicht direkt auf | Orchestriert, wann welche MCP-Toolkette läuft |
MCP bleibt das Kabel zu GitHub, Jira oder Ihrer Cloud — Skills entscheiden, ob und wann diese Kabel gezogen werden. Ein Skill „create-pr“ kann festlegen: zuerst git status, dann Branch, dann gh pr create, während eine Rule verbietet, --force auf main zu pushen. Diese Trennung hält Sessions vorhersehbar und auditierbar.
3. Verzeichnisstruktur und SKILL.md-Spezifikation
Projektspezifische Skills liegen unter .cursor/skills/ in Cursor; für Claude Code und Gemini CLI oft parallel unter .agents/skills/. Jeder Skill ist ein Ordner mit zwingender Datei SKILL.md:
.cursor/skills/deploy-staging/
├── SKILL.md # Pflicht: Frontmatter + Anweisungen
├── scripts/ # Optional: ausführbare Helfer
│ └── validate.py
├── references/ # Optional: lange Docs bei Bedarf
└── assets/ # Optional: Vorlagen
Das YAML-Frontmatter braucht mindestens name (Kleinbuchstaben und Bindestriche, identisch zum Ordnernamen) und description. Die description ist der Routing-Schlüssel: Beim Start indexiert der Agent alle name+description-Paare und entscheidet später, ob der Skill relevant ist. Optionale Felder: paths (Glob, z. B. nur apps/web/**), disable-model-invocation: true (nur manuell per /skill-name).
Für DACH-Teams mit personenbezogenen Daten in Deploy-Skills: dokumentieren Sie in references/, welche Umgebungsvariablen Secrets enthalten, und verweisen Sie in der Skill-Body auf „keine Tokens in Logs“. Das ersetzt keine Rechtsberatung, reduziert aber typische Verstöße bei Agent-gestützten Releases.
Ein minimales Frontmatter-Beispiel für Staging-Deploys könnte so aussehen — der Body folgt darunter mit nummerierten Schritten:
---
name: deploy-staging
description: Wenn der Nutzer Staging-Deploy, Preview-Release oder Go-Live auf Staging erwähnt.
paths: apps/**, infra/staging/**
---
# Staging Deploy
1. Branch und letzten CI-Status prüfen.
2. scripts/validate.py ausführen; bei Exit != 0 abbrechen.
3. Nur nach expliziter Nutzerbestätigung: deploy.sh staging.
Halten Sie name kurz und stabil; investieren Sie Zeit in description, denn sie steuert die automatische Aktivierung. Zu breite Descriptions („alles mit Deploy“) führen zu Fehlalarmen in Frontend-Chats; zu enge verpassen legitime Anfragen.
4. Dreistufiges Laden und Trigger
- Level 1 — Discovery. Der Agent liest alle Skill-Namen und Descriptions und baut einen Index — geringer Token-Fußabdruck.
- Level 2 — Aktivierung. Passt die Aufgabe, wird der vollständige
SKILL.md-Body geladen und Schritt für Schritt ausgeführt. - Level 3 — On demand. Lange Referenzen aus
references/; Skripte unterscripts/liefern typischerweise nur Stdout/Stderr zurück, nicht den gesamten Quelltext.
Drei Trigger-Modi: automatisch (Modell wählt), Slash (/deploy-staging), @Referenz (@deploy-staging als Kontext). In Monorepos können verschachtelte .cursor/skills/ pro Package die Wirkung auf Teilbäume begrenzen — wichtig, wenn ein Team nur Mobile-Deploys automatisieren will.
Vergleichen Sie Level 3 mit dem Lesen einer 200-seitigen PDF: Der Agent öffnet nicht alles auf einmal, sondern Kapitel bei Bedarf. Ein Security-Audit-Skill kann references/owasp-checklist.md nur laden, wenn der Nutzer „tiefe Prüfung“ sagt — das spart Kontext gegenüber dem Einfügen der ganzen Checkliste in jede Session.
5. Fünf Schritte zum ersten Skill
- Eine Verantwortung wählen. „Staging deployen“ statt „gesamte Ops“. Große Domänen in mehrere Skills splitten und per Beschreibung verketten.
- Ordner und SKILL.md anlegen. Ab Cursor 2.4+ hilft
/create-skillbeim Gerüst; prüfen Sie den Output dennoch manuell. - Description als Trigger formulieren. Schreiben Sie „Wenn der Nutzer Staging-Deploy, Release oder Go-Live erwähnt“, nicht „Dieser Skill handelt von Deploy“.
- Gather → Act → Verify. Zuerst Kontext sammeln (Branch, Env), dann Skripte, dann Health-Check oder Log-Zeile als Beweis.
- Regression mit echten Aufgaben. Verschiedene Formulierungen testen; bei Fehlaktivierung
pathsverschärfen oderdisable-model-invocationfür kritische Produktionsschritte.
Teams mit Legacy-.cursorrules oder Slash-Commands sollten /migrate-to-skills nutzen, um Doppelpflege zu vermeiden. Dokumentieren Sie die Migration im internen Changelog — Security-Teams fragen sonst, warum plötzlich zwei Quellen existieren.
Schritt-für-Schritt-Beispiel „erster Tag“: (1) Skill pr-smoke nur für Test-Repo; (2) description auf „PR erstellen, Pull Request, gh pr“ testen; (3) absichtlich falsche Formulierung („merge bitte“) — soll den Skill nicht triggern; (4) nach grünem Test in Haupt-Monorepo kopieren; (5) in CODEOWNERS den Skill-Ordner einem Platform-Team zuweisen. So vermeiden Sie, dass jeder Entwickler private Varianten pflegt.
6. Description, DSGVO und Best Practices
- Progressive Disclosure. Kernablauf unter ~500 Zeilen; Schema- und Compliance-Details in
references/. - Begründungen statt Stichworte. „Vor Deploy
validate.py, damit halb gesetzte Env-Vars keinen Dienst im Zwischenzustand starten“ reduziert Agent-Skip-Fehler. - Terminologie vereinheitlichen. Entweder durchgängig „Deploy“ oder „Release“ — nicht synonym mischen.
- Fehlerpfade definieren. Exit-Code ≠ 0: Rollback ja/nein, wen benachrichtigen — verhindert „grüne“ Zusammenfassungen bei rotem Status.
- Datenminimierung. Skills, die PII aus Tickets lesen, sollten in references verlangen, Ausgaben zu maskieren — relevant für Art. 5 DSGVO und interne Löschfristen.
7. Ökosystem agentskills.io 2026
agentskills.io pflegt das offene Format; Cursor Marketplace installiert gebündelt Rules, Skills und MCP-Server. Beliebte Community-Pakete: addyosmani/agent-skills (Engineering-Gates), Vercel-Frontend-Audit-Skills, sowie betriebsnahe Playbooks wie unser OpenClaw-Kanal-Probe-Leitfaden als Skill-Vorlage.
Globale Skills für alle Repositories: ~/.cursor/skills/. Repo-spezifisch: .cursor/skills/. Für Agent-Gateways außerhalb der IDE (Hermes skills/, OpenClaw-Plugins) empfiehlt sich ein zentrales Git-Repo, das per SFTP/rsync auf den Produktionshost synchronisiert wird — eine einzige Wahrheit für Mensch und Daemon.
Der Standard auf agentskills.io definiert auch Interoperabilität: Skills, die heute in Cursor laufen, lassen sich morgen in Claude Code oder internen Forks wiederverwenden, solange Frontmatter und Ordnerlayout eingehalten werden. Für Einkaufs- und Architektur-Gremien ist das ein Argument gegen proprietäre „Prompt-Bibliotheken“ ohne Export — Sie behalten die Dateien im eigenen Git.
8. Praxis: PR, Agent-Loop und Remote Mac
PR-Skill: fester Ablauf git status → Branch → push → gh pr create, gekoppelt an Git-Safety-Rules. OpenClaw/Hermes: Gateway-Skills auf einem zugeklappten MacBook brechen ab; Konfiguration und Skill-Bäume gehören auf einen 7×24-macOS-Knoten (siehe Hermes-Installationsleitfaden und OpenClaw launchd-Diagnose).
| Betriebsebene | Entwickler-MacBook | SFTPMAC Remote Mac |
|---|---|---|
| 7×24-Gateway | Sleep, Reisen, NAT-Wechsel | launchd/systemd, vertragliche Verfügbarkeit |
| Skill-Sync | Nur lokal | Git + SFTP/rsync, Team-Audit |
| Lokale Inferenz | RAM/Thermal begrenzt | M4/M5-Stufen testen vor CapEx |
| DSGVO-Trennung | Privatgerät vermischt Kontexte | Isolierter Mandant, EU-Optionen |
Der Agent-Loop 2026 sieht so aus: IDE-Skills für Entwicklung, identische oder abgeleitete Skills auf dem Gateway-Host für Telegram/Slack-Antworten, Monitoring wenn openclaw doctor oder hermes doctor rot wird. Stabilität ist Infrastruktur — kein Prompt-Trick.
Konkret OpenClaw: Ein Skill kann vorschreiben, nach jedem Plugin-Update openclaw doctor --fix und channels status --probe auszuführen — dieselbe Disziplin wie in unseren Gateway-Runbooks, nur automatisch geroutet, wenn jemand „Kanal tot“ meldet. Hermes-Nutzer spiegeln das mit hermes doctor und Skill-Dokumenten unter ~/.hermes/skills/. Beide Stacks profitieren von einem Host, der nicht um 23 Uhr in den Schlafmodus geht, wenn Asien-Standorte noch Nachrichten senden.
Kostenbetrachtung für Entscheider: Ein MacBook ist „kostenlos“, solange man Ausfallzeiten nicht rechnet. Ein Remote-Mac-Mietmodell erscheint teurer in der Monatsrechnung, eliminiert aber wiederholte „warum hat der Bot nachts nicht geantwortet“-Eskalationen — oft teurer als die Miete, wenn SLAs mit Kunden oder internen Führungskräften vereinbart sind.
9. FAQ
Skill und MCP? MCP verbindet; Skill orchestriert. Beides zusammen bildet „Werkzeug plus Verfahren“. Ohne MCP bleibt ein Skill eine reine Textanleitung; ohne Skill ruft der Agent Tools in unvorhersehbarer Reihenfolge auf.
Skill und Rule? Rule = immer an; Skill = bei Bedarf. Nicht alles in Skills verlagern — sonst verlieren Sie die dauerhafte Sicherheitsrail. Umgekehrt gehören mehrstufige Deploys nicht in Rules — die würden jeden Refactor-Chat verstopfen.
Warum Remote Mac statt VPS? Viele macOS-native Agent-Pfade (Browser-Skills, Keychain, Apple-Silicon-Inferenz) scheitern auf Linux-VPS; ein gemieteter Mac mini liefert echte macOS-Semantik mit 7×24-Betrieb.
Kann ein Skill Secrets lesen? Nur, wenn Skripte und Env-Zugriff es erlauben. Legen Sie Secrets in CI oder Keychain ab; Skills sollten auf vorhandene Hooks verweisen, nicht API-Keys in Markdown speichern. Für DSGVO: Zugriff in Verarbeitungsverzeichnis unter „automatisierte Deploy-Assistenz“ dokumentieren.
Wie oft Skills reviewen? Bei jedem Breaking Change an Deploy-Pipeline oder Gateway-Version — analog zu Runbooks. Ein vierteljährlicher Stichprobe-Chat pro Skill reicht oft, um veraltete descriptions zu finden. Dokumentieren Sie Review-Datum im CHANGELOG des Skill-Ordners — hilft bei Audits.
Wer heute mit Cursor 2.4+ startet, sollte parallel eine Rule „Git-Sicherheit“ und einen Skill „staging-deploy“ pflegen — nicht beides in einem Skill vermischen. Nach vier Wochen messen Sie: weniger manuelle Prompts pro Release, kürzere Agent-Sessions, weniger Rollbacks wegen vergessener Checks. Diese KPIs überzeugen Management schneller als abstrakte „KI-Effizienz“. In Due-Diligence-Calls mit Enterprise-Kunden hilft ein Git-Ordner .cursor/skills/ mit Änderungshistorie mehr als Screenshots aus ChatGPT.
Optional: Skills in CI linten — z. B. prüfen, ob description unter 1024 Zeichen bleibt und ob verbotene Wörter („production deploy ohne Bestätigung“) fehlen. Das ist Engineering-Reife, keine Pflicht — aber sie trennt Hobby-Setup von produktionsnaher Agent-Plattform.
Fazit: Prozesse in Skills, Gateways auf stabilem Mac
SKILL.md beendet die Prompt-Schleife; zusammen mit MCP entsteht ein vorhersagbarer Agent-Stack. Zielt Ihr Use Case auf dauerhaft online OpenClaw oder Hermes, ist das schlafende Laptop die Schwachstelle — nicht das Modell. Lasttests für Gateway-Skills auf einem Remote-Knoten zeigen Timeouts und Token-Limits realistischer als auf einem Akku-MacBook.
SFTPMAC Remote Mac bietet echtes macOS, SLA-fähigen 7×24-Betrieb und SSH/SFTP für Skill- sowie Config-Sync: Gateway auf dem Host, Steuerung von Ihrem Schreibtisch. Für regulierte Teams lohnt sich die Trennung von Entwickler-Laptop und Produktions-Gateway — Audit-Logs und Zugriffspfad bleiben nachvollziehbar. Starten Sie heute mit /create-skill, validieren Sie den ersten Deploy-Zyklus auf einem Remote-Knoten, dann skalieren Sie ins Team ohne Doppelpflege.