Was ist der Unterschied zwischen Hermes Skills und MCP?

Skills sind prozedurale Wissensdokumente, die dem Agenten beibringen, eine Aufgabenklasse zu erledigen; MCP ist eine Tool-Schnittstelle mit zusätzlichen aufrufbaren Werkzeugen. Sie ergänzen sich: MCP liefert Datenbankzugriff, ein Skill lehrt die korrekte Migration.

Warum greift meine Skill-Änderung nicht?

Die aktuelle Sitzung hat die alte Version gecacht. Neue Sitzung mit /reset starten oder mit --now neu installieren (bricht Prompt Cache und erhöht Token-Kosten).

2026 Hermes Agent Skills Fortgeschritten: SKILL.md, Bundles & GEPA-Entscheidungsleitfaden

Anfang 2026 veröffentlichte Nous Research Hermes Agent — binnen zwei Monaten über 160.000 GitHub-Stars. Der Kern ist nicht ein größeres Modell, sondern „the agent that grows with you“: ein standardisiertes, evolvierbares, sitzungsübergreifendes Skills-System. Dieser Leitfaden überspringt die Erstinstallation (siehe Hermes Agent Installationsanleitung) und geht direkt in die Architekturentscheidungen: SKILL.md-Format, Progressive Disclosure, Skill Bundles, bedingte Aktivierung, Tap-Publishing und wie GEPA + DSPy Skills zu verbessernden Produktionsassets machen — mit DSGVO-bewusster Betriebsführung auf stabilen Knoten.

1. Drei Schmerzpunkte: Warum das Hermes-Skills-System eine eigene Studie verdient

Viele Teams behandeln Hermes als „noch eine ChatGPT-Hülle“ und übersehen Skills — dabei liefern sie den höchsten langfristigen ROI:

Token-Kosten außer Kontrolle: SOPs im System Prompt verbrennen bei jedem Chat Tokens; Progressive Disclosure bei Skills kostet vor Aktivierung null.
Wissen fließt ab: Einmal-Prompts verschwinden mit der Sitzung; Skills sind sitzungsübergreifendes prozedurales Gedächtnis — versionierbar, teilbar, evolvierbar.
Workflows mühsam einzeln triggern: Komplexe Aufgaben erfordern mehrere /skill-name-Aufrufe; Skill Bundles bündeln alles zu einem Slash-Befehl.

Fortgeschrittene Leser sollten fünf Fragen beantworten können: Wie steuert Progressive Disclosure Tokens? Wie funktioniert bedingte Aktivierung? Wie triggern Bundles Workflows? Wie verbessern DSPy + GEPA Skills automatisch? Welche Community-Repos sind produktionsreif? Die folgenden Abschnitte liefern die Datengrundlage.

2. Kernkonzepte: Skills ≠ Prompts, Skills ≠ Memory

Verwechslungen führen zu falschen Architekturentscheidungen. Merksatz: Prompt = Haftnotiz (nur diese Sitzung); Memory = Notizbuch (dauerhafte Fakten, immer präsent); Skill = SOP-Handbuch (Schritt-für-Schritt-Prozess, bei Bedarf geöffnet).

Dimension	Normaler Prompt	Memory	Skills
Persistenz	Aktuelle Konversation	Sitzungsübergreifend, dauerhaft	Sitzungsübergreifend, dauerhaft
Ladezeitpunkt	Immer im Kontext	Automatisch pro Sitzung injiziert	On-Demand (entscheidender Unterschied)
Token-Kosten	Bei jedem Aufruf	Klein und stabil	Vor Aktivierung null
Inhaltstyp	Beliebige Absicht	Nutzerpräferenzen/Fakten	Prozedurale Schritte (wie etwas erledigt wird)
Pflege	Manuell durch Nutzer	Automatisch durch Agent	Nutzer + Agent
Teilbarkeit	Umständlich	Privat	Als Community-Tap veröffentlichbar

3. SKILL.md-Format im Detail und Progressive Disclosure

3.1 Grundstruktur (agentskills.io-Offenstandard)

Alle Hermes Skills folgen dem agentskills.io-Standard — portabel zwischen Hermes, Claude Code und Cursor.

---
name: my-skill                    # Pflicht: Kleinbuchstaben+Bindestrich, ≤64 Zeichen
description: |                    # Pflicht: ≤1024 Zeichen, ideal „Use when...“
  Use when the user needs to [...].
  Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
  hermes:
    tags: [devops, automation]
    category: software-development
    related_skills: [github-pr-workflow, test-driven-development]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title

## Overview
## When to Use
## Procedure
## Common Pitfalls
## Verification Checklist

3.2 Skill-Verzeichnisstruktur (modular)

~/.hermes/skills/
└── my-category/
    └── my-skill/
        ├── SKILL.md              # Hauptdatei (Kernschritte, ≤500 Zeilen empfohlen)
        ├── references/           # API-Referenz (On-Demand)
        ├── templates/            # Wiederverwendbare Vorlagen
        └── scripts/              # Vom Agent ausführbare Skripte

3.3 Progressive Disclosure — dreistufiges Laden (Token-Kern)

Level	Inhalt	Trigger	Token-Kosten
Level 0	`name` + `description`	Sitzungsstart, alle Skills	~3K (Summe aller Skills)
Level 1	Vollständiger SKILL.md-Text	`/skill-name` oder LLM-Entscheidung	Abhängig von Dateilänge
Level 2	references/ scripts/ Dateien	LLM bei Ausführung	On-Demand, pro Datei

Autorentipp: description ist die einzige Level-0-Information — das LLM entscheidet danach, ob der vollständige Skill geladen wird. „Wann nutzen“ schlägt „Was ist es“.

4. Skill Bundles: ein Befehl triggert den vollständigen Workflow

Skill Bundles sind eine Hermes-Neuerung 2026 und werden oft unterschätzt. Ein Bundle ist leichtes YAML, das mehrere Skills zu einem Slash-Befehl bündelt; bei /bundle-name werden alle gelisteten Skills gleichzeitig geladen.

Speicherort: ~/.hermes/skill-bundles/<slug>.yaml

name: backend-dev
description: |
  Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

Fortgeschrittene Szenarien:

AI-Forschungs-Workflow (research-session): arxiv + deep-research + plan + excalidraw — Papers prüfen, Architektur skizzieren.
MLOps-Deploy-Pipeline (mlops-deploy): vllm + llama-cpp + github-pr-workflow + systematic-debugging — Inferenz-Benchmark vor und nach Deploy.

Bundle-Prioritätsregeln:

Bei Namenskollision gewinnt das Bundle gegenüber dem Einzel-Skill.
Fehlende Skills werden übersprungen, nicht abgebrochen — mit Hinweis beim Laden.
Bundles ändern den System Prompt nicht — Prompt Cache bleibt intakt (token-freundlich).

hermes bundles create backend-dev \
  --skills github-code-review,test-driven-development,github-pr-workflow \
  --instruction "Always write failing tests first"

5. Bedingte Aktivierung: umgebungsbewusste Skills

Skills können je nach Tool-Verfügbarkeit in der Sitzung automatisch ein- oder ausgeblendet werden. Konfiguration unter metadata.hermes:

metadata:
  hermes:
    requires_toolsets: [web]
    requires_tools: [web_search]
    fallback_for_toolsets: [browser]
    fallback_for_tools: [browser_navigate]

Feld	Verhalten
requires_toolsets	Skill ausblenden, wenn Toolset fehlt
requires_tools	Skill ausblenden, wenn Tool fehlt
fallback_for_toolsets	Skill ausblenden, wenn Toolset vorhanden (Fallback-Rolle)
fallback_for_tools	Skill ausblenden, wenn Tool vorhanden

Klassisches Szenario: kostenlose vs. kostenpflichtige Suche. duckduckgo-search mit fallback_for_tools: [web_search]: Bei FIRECRAWL_KEY / BRAVE_SEARCH_KEY verschwindet DuckDuckGo automatisch zugunsten von web_search — weniger Token, bessere Ergebnisse. Fällt die API aus, taucht der Fallback wieder auf.

Plattformbeispiel: telegram-notify mit requires_toolsets: [messaging] und platforms: [telegram, discord]; per hermes skills-TUI lassen sich Skills für CLI, Telegram und Discord getrennt schalten — relevant für DSGVO-Trennung interner vs. externer Kanäle.

6. Skills Hub und Open-Source-Ökosystem

6.1 Offizielle Installationskanäle

hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills

6.2 Empfehlenswerte Open-Source-Repositories

Repository	Beschreibung	Highlight
ChuckSRQ/awesome-hermes-skills	Kuratierte Produktions-Skills	Deep Research, MLOps, Apple-Integration; 23 Skills mit GitHub Copilot
amanning3390/hermeshub	Community-Register	Sicherheitsscan, API und Marktplatz
kevinnft/ai-agent-skills	191 Skills, 28 Kategorien	Ein-Klick-Install für Hermes/Claude Code/Cursor
NousResearch/hermes-agent	Offizielles Hauptrepo	Autoritative Quelle inkl. aller Built-in-Skills

Der agentskills.io-Standard ermöglicht Portabilität zwischen Hermes, Claude Code, Cursor und OpenCode. Validierung: skills-ref validate ./my-skill.

7. Eigenen Skill Tap veröffentlichen: Team- und Community-Sharing

Ein GitHub-Repo als Tap lässt Teams und Communities Ihre Skill-Sammlung abonnieren — selten dokumentiert, aber produktionsrelevant für einheitliche SOPs.

my-skills-tap/
├── skills.sh.json
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md

skills.sh.json steuert Hub-Kategorien. Team-Deployment:

hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap update
hermes skills tap list

Versionsmanagement: ~/.hermes/skills/ in Git versionieren; geräteübergreifend git pull && hermes skills reset für konsistente Built-ins. Für DSGVO-Auditierbarkeit: Commit-Historie = nachvollziehbare Skill-Änderungen.

8. Self-Evolving Skills: GEPA + DSPy für automatische Verbesserung

Das ist Hermes' stärkster Differenzierer. GEPA (Genetic-Pareto Prompt Evolution) — ICLR Oral 2026 — ist in hermes-agent-self-evolution integriert. Prinzip: kein Modell-Fine-Tuning, sondern Analyse von Ausführungstraces, Variantengenerierung und multiobjektive Pareto-Optimierung der SKILL.md-Texte. Kosten pro Lauf: ca. 2–10 USD (reine API-Aufrufe, keine GPU).

8.1 GEPA-Fünf-Phasen-Evolutionsprozess

Phase 1 — Trace-Sammlung: Vollständige Reasoning-Traces aus SQLite (Tool-Calls, Verzweigungen, Fehler).
Phase 2 — Reflektive Fehleranalyse: LLM liefert „actionable side information“ — nicht „fehlgeschlagen“, sondern „warum“.
Phase 3 — Gezielte Mutation: 10–20 SKILL.md-Varianten pro Fehlerursache.
Phase 4 — Multiobjektive Pareto-Bewertung: Erfolgsrate × Token-Effizienz × Geschwindigkeit gleichzeitig.
Phase 5 — Manueller PR-Review: Beste Variante → PR → Freigabe vor Produktion.

8.2 Schnellstart

git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source synthetic

python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source sessiondb

8.3 Vier Sicherheits-Leitplanken

Volle Testsuite: pytest tests/ -q muss 100 % bestehen.
Größenlimit: Skills ≤ 15KB, Tool-Beschreibungen ≤ 500 Zeichen.
Prompt-Cache-Kompatibilität: Keine mid-session-Änderungen, die Cache invalidieren.
Semantische Erhaltung: Ursprünglicher Skill-Zweck darf nicht abdriften.

8.4 Fünf-Phasen-Roadmap (offizieller Status)

Phase	Optimierungsziel	Engine	Status
Phase 1	Skill-Dateien (SKILL.md)	DSPy + GEPA	✅ Implementiert
Phase 2	Tool-Beschreibungen	DSPy + GEPA	🔲 Geplant
Phase 3	System-Prompt-Fragmente	DSPy + GEPA	🔲 Geplant
Phase 4	Tool-Implementierungscode	Darwinian Evolver	🔲 Geplant
Phase 5	Kontinuierlicher Verbesserungszyklus	Automatisierte Pipeline	🔲 Geplant

Plattformübergreifende Traces: Skills folgen agentskills.io — Claude Code- oder Gemini-CLI-Traces können GEPA gespeist werden:

python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

9. Plugin-Skills: Grenzen von Hermes erweitern

Plugins bündeln Skills unter einem Namespace (plugin:skill): nicht in der Standard-skills_list (weniger Rauschen), nur bei explizitem Aufruf (Opt-in), Skills im Plugin können sich gegenseitig referenzieren.

skill_view("superpowers:writing-plans")
# Zeigt beim Laden Geschwister-Skills desselben Plugins

Deklaration in plugin.yaml:

name: my-hermes-plugin
skills:
  - name: writing-plans
    path: skills/writing-plans/SKILL.md
  - name: editing
    path: skills/editing/SKILL.md

10. Fortgeschrittene Autorentechniken (Ingenieurperspektive)

10.1 description bestimmt Aktivierungsgenauigkeit

❌ Zu vage: Helps with code. → ✅ Präziser Trigger: Use when reviewing a pull request... Do NOT use for writing new code.

10.2 Pitfalls als Qualitätsmerkmal

Hochwertige Pitfalls enthalten: konkretes Fehlermuster, Root-Cause-Analyse, umsetzbare Fix-Schritte — z. B. fragile CSS-Selektoren, GitHub-API-Rate-Limits, große Diffs mit Token-Overflow und Chunking-Strategien.

10.3 Skripte und skill_manage

In Procedure scripts/extract_schema.py referenzieren; bei Fehler references/manual-extract.md laden. Der Agent kann Skills via skill_manage(action='patch'| 'create') pflegen; mit skills.agent_writes_require_approval: true in config.yaml bleibt menschliche Freigabe Pflicht — DSGVO-relevant bei Skills mit personenbezogenen Daten.

10.4 Skill-Größensteuerung

Größe	Empfehlung
< 500 Zeilen	Alles in SKILL.md
500–1000 Zeilen	Details nach references/
> 1000 Zeilen	Stark splitten; evtl. zwei Skills
> 15KB	GEPA-Limit überschritten — zwingend splitten

11. Praxisfall: Skills für Ihren Tech-Blog-Workflow

Bundle blog-workflow mit seo-keyword-research, outline-generator, code-example-validator, bilingual-checker, publish-to-platform:

name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.
  Generate both Chinese and English title options.

Custom-Skill seo-keyword-research sollte zu Sitzungsbeginn DE/EN-Long-Tails („X einrichten“, „how to X“, „X vs Y“) extrahieren: 3–5 Hauptkeywords + 10–15 Long-Tails — mit Terminologie-Matrix für DACH (Agent/KI-Assistent/Agentic AI).

12. Häufige Fragen (FAQ)

F: Was ist der Unterschied zwischen Skills und MCP?
Skills sind prozedurale Wissensdokumente; MCP ist eine Tool-Schnittstelle. MCP liefert Datenbankzugriff, ein Skill lehrt die korrekte Migration — beides ergänzt sich.

F: Warum nutzt der Agent nach meiner Bearbeitung noch die alte Skill-Version?
/reset für neue Sitzung, oder Installation mit --now (invalidiert Prompt Cache).

F: Sind GEPA-evolvierte Skills sicher?
Vier Leitplanken plus manueller PR-Review; semantische Drift-Prüfung verhindert Zweckabweichung. Dennoch jeden Diff vor Merge prüfen — besonders bei Skills mit DSGVO-relevanten Prozessen.

F: Wie nutze ich Hermes Skills in Claude Code?
Nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills Multi-Plattform-Installer verwenden.

F: Beeinflusst deutscher Skill-Inhalt die Token-Effizienz?
Deutsch liegt bei ca. 1–1,5 Token pro Wort — vergleichbar mit Englisch. Für präzises Routing empfiehlt sich description auf Englisch oder zweisprachig.

13. Ressourcen und Remote-Mac-7×24-Entscheidung

13.1 Offizielle und Community-Ressourcen

Hermes Agent offizielle Dokumentation · Chinesische Dokumentation
Skills-System-Referenz · agentskills.io-Offenstandard
GEPA-Selbstevolution · GEPA-Algorithmus · DSPy-Framework
Weitere SFTPMAC-Artikel: Cursor Agent Skills Leitfaden · OpenRouter CLI und Hermes-Auswahl

13.2 Deployment-Szenario-Entscheidungsmatrix

Szenario	Lokaler Mac / Laptop	Remote Mac 7×24 (SFTPMAC)
GEPA-Evolution + sessiondb	Zuklappen bricht Traces; unvollständige Stichproben	Kontinuierliche Sitzungstraces; reichere Evolutionsdaten
Telegram/Discord-Gateway	Schlafmodus und WLAN-Wechsel nehmen Bot offline	launchd-Überwachung hält Gateway online
Team-Tap-Sync	Jedes ~/.hermes driftet lokal	Einheitlicher Knoten + SFTP/rsync für skills-Verzeichnis
Skill Bundles — lange Sitzungen	RAM und Tokens konkurrieren mit anderen Apps	Apple Silicon Unified Memory; stabile Multi-Skill-Läufe
DSGVO-Audit & Datenresidenz	Heim-ISP, gemischte Privat-/Arbeitsdaten	Getrennte Zustandsverzeichnisse, SSH-only-Zugriff, dokumentierte Löschfristen

13.3 Fazit: vom lokalen Experiment zum Produktions-Agent-Knoten

Dieser Leitfaden deckt die vollständige Hermes-Skills-Kette ab: Konzeptvergleich → SKILL.md und Progressive Disclosure → Skill Bundles → bedingte Aktivierung → Hub-Ökosystem → Tap-Publishing → GEPA-Selbstevolution → Plugin-Erweiterungen → Autorentechniken → Blog-Workflow-Praxis. Damit wird Ihr Agent vom Wegwerf-Prompt zum versionierbaren, teilbaren, selbstverbessernden prozeduralen Asset.

Lokales Hermes hat klare Grenzen: Laptop-Zuklappen unterbricht Konnektivität, GEPA-sessiondb-Traces bleiben lückenhaft, Telegram-Gateway fällt beim Schlafmodus aus, Team-Taps driften zwischen Entwickler-Maschinen. Teams, die 7×24-Betrieb für Evolutions-Traces, Gateway-Hosting oder einheitliche ~/.hermes/skills/-Synchronisation brauchen, sollten Hermes auf einem Apple-Silicon-Remote-Mac betreiben — native launchd-Überwachung, macOS-konforme Toolchains und SFTP/rsync für sichere Skill-Verzeichnis-Sync.

SFTPMAC Remote-Mac-Miete richtet sich an Hermes Agent Skills-Workflows: 7×24-Gateway, kontinuierliche GEPA-Trace-Sammlung und Team-Tap-Verzeichnis-Sync — ein besserer Produktionseinstieg als ein Heim-Mac mit Doppelrolle. Beginnen Sie heute mit Ihrer ersten SKILL.md und lassen Sie den Agenten mit jeder Sitzung stärker werden.