2026 Hermes Agent Skills Fortgeschritten: SKILL.md, Bundles & GEPA-Entscheidungsleitfaden
Anfang 2026 veröffentlichte Nous Research Hermes Agent — binnen zwei Monaten über 160.000 GitHub-Stars. Der Kern ist nicht ein größeres Modell, sondern „the agent that grows with you“: ein standardisiertes, evolvierbares, sitzungsübergreifendes Skills-System. Dieser Leitfaden überspringt die Erstinstallation (siehe Hermes Agent Installationsanleitung) und geht direkt in die Architekturentscheidungen: SKILL.md-Format, Progressive Disclosure, Skill Bundles, bedingte Aktivierung, Tap-Publishing und wie GEPA + DSPy Skills zu verbessernden Produktionsassets machen — mit DSGVO-bewusster Betriebsführung auf stabilen Knoten.
1. Drei Schmerzpunkte: Warum das Hermes-Skills-System eine eigene Studie verdient
Viele Teams behandeln Hermes als „noch eine ChatGPT-Hülle“ und übersehen Skills — dabei liefern sie den höchsten langfristigen ROI:
- Token-Kosten außer Kontrolle: SOPs im System Prompt verbrennen bei jedem Chat Tokens; Progressive Disclosure bei Skills kostet vor Aktivierung null.
- Wissen fließt ab: Einmal-Prompts verschwinden mit der Sitzung; Skills sind sitzungsübergreifendes prozedurales Gedächtnis — versionierbar, teilbar, evolvierbar.
- Workflows mühsam einzeln triggern: Komplexe Aufgaben erfordern mehrere
/skill-name-Aufrufe; Skill Bundles bündeln alles zu einem Slash-Befehl.
Fortgeschrittene Leser sollten fünf Fragen beantworten können: Wie steuert Progressive Disclosure Tokens? Wie funktioniert bedingte Aktivierung? Wie triggern Bundles Workflows? Wie verbessern DSPy + GEPA Skills automatisch? Welche Community-Repos sind produktionsreif? Die folgenden Abschnitte liefern die Datengrundlage.
2. Kernkonzepte: Skills ≠ Prompts, Skills ≠ Memory
Verwechslungen führen zu falschen Architekturentscheidungen. Merksatz: Prompt = Haftnotiz (nur diese Sitzung); Memory = Notizbuch (dauerhafte Fakten, immer präsent); Skill = SOP-Handbuch (Schritt-für-Schritt-Prozess, bei Bedarf geöffnet).
| Dimension | Normaler Prompt | Memory | Skills |
|---|---|---|---|
| Persistenz | Aktuelle Konversation | Sitzungsübergreifend, dauerhaft | Sitzungsübergreifend, dauerhaft |
| Ladezeitpunkt | Immer im Kontext | Automatisch pro Sitzung injiziert | On-Demand (entscheidender Unterschied) |
| Token-Kosten | Bei jedem Aufruf | Klein und stabil | Vor Aktivierung null |
| Inhaltstyp | Beliebige Absicht | Nutzerpräferenzen/Fakten | Prozedurale Schritte (wie etwas erledigt wird) |
| Pflege | Manuell durch Nutzer | Automatisch durch Agent | Nutzer + Agent |
| Teilbarkeit | Umständlich | Privat | Als Community-Tap veröffentlichbar |
3. SKILL.md-Format im Detail und Progressive Disclosure
3.1 Grundstruktur (agentskills.io-Offenstandard)
Alle Hermes Skills folgen dem agentskills.io-Standard — portabel zwischen Hermes, Claude Code und Cursor.
---
name: my-skill # Pflicht: Kleinbuchstaben+Bindestrich, ≤64 Zeichen
description: | # Pflicht: ≤1024 Zeichen, ideal „Use when...“
Use when the user needs to [...].
Handles [...] and [...].
version: 1.0.0
license: MIT
compatibility: Requires git, docker
allowed-tools: Bash(git:*) Read
metadata:
hermes:
tags: [devops, automation]
category: software-development
related_skills: [github-pr-workflow, test-driven-development]
requires_toolsets: [terminal]
fallback_for_toolsets: [web]
---
# My Skill Title
## Overview
## When to Use
## Procedure
## Common Pitfalls
## Verification Checklist
3.2 Skill-Verzeichnisstruktur (modular)
~/.hermes/skills/
└── my-category/
└── my-skill/
├── SKILL.md # Hauptdatei (Kernschritte, ≤500 Zeilen empfohlen)
├── references/ # API-Referenz (On-Demand)
├── templates/ # Wiederverwendbare Vorlagen
└── scripts/ # Vom Agent ausführbare Skripte
3.3 Progressive Disclosure — dreistufiges Laden (Token-Kern)
| Level | Inhalt | Trigger | Token-Kosten |
|---|---|---|---|
| Level 0 | name + description |
Sitzungsstart, alle Skills | ~3K (Summe aller Skills) |
| Level 1 | Vollständiger SKILL.md-Text | /skill-name oder LLM-Entscheidung |
Abhängig von Dateilänge |
| Level 2 | references/ scripts/ Dateien | LLM bei Ausführung | On-Demand, pro Datei |
Autorentipp: description ist die einzige Level-0-Information — das LLM entscheidet danach, ob der vollständige Skill geladen wird. „Wann nutzen“ schlägt „Was ist es“.
4. Skill Bundles: ein Befehl triggert den vollständigen Workflow
Skill Bundles sind eine Hermes-Neuerung 2026 und werden oft unterschätzt. Ein Bundle ist leichtes YAML, das mehrere Skills zu einem Slash-Befehl bündelt; bei /bundle-name werden alle gelisteten Skills gleichzeitig geladen.
Speicherort: ~/.hermes/skill-bundles/<slug>.yaml
name: backend-dev
description: |
Full backend feature workflow — code review, TDD, and PR management.
skills:
- github-code-review
- test-driven-development
- github-pr-workflow
instruction: |
Always write failing tests first before implementation.
Never push directly to main.
Fortgeschrittene Szenarien:
- AI-Forschungs-Workflow (research-session): arxiv + deep-research + plan + excalidraw — Papers prüfen, Architektur skizzieren.
- MLOps-Deploy-Pipeline (mlops-deploy): vllm + llama-cpp + github-pr-workflow + systematic-debugging — Inferenz-Benchmark vor und nach Deploy.
Bundle-Prioritätsregeln:
- Bei Namenskollision gewinnt das Bundle gegenüber dem Einzel-Skill.
- Fehlende Skills werden übersprungen, nicht abgebrochen — mit Hinweis beim Laden.
- Bundles ändern den System Prompt nicht — Prompt Cache bleibt intakt (token-freundlich).
hermes bundles create backend-dev \
--skills github-code-review,test-driven-development,github-pr-workflow \
--instruction "Always write failing tests first"
5. Bedingte Aktivierung: umgebungsbewusste Skills
Skills können je nach Tool-Verfügbarkeit in der Sitzung automatisch ein- oder ausgeblendet werden. Konfiguration unter metadata.hermes:
metadata:
hermes:
requires_toolsets: [web]
requires_tools: [web_search]
fallback_for_toolsets: [browser]
fallback_for_tools: [browser_navigate]
| Feld | Verhalten |
|---|---|
| requires_toolsets | Skill ausblenden, wenn Toolset fehlt |
| requires_tools | Skill ausblenden, wenn Tool fehlt |
| fallback_for_toolsets | Skill ausblenden, wenn Toolset vorhanden (Fallback-Rolle) |
| fallback_for_tools | Skill ausblenden, wenn Tool vorhanden |
Klassisches Szenario: kostenlose vs. kostenpflichtige Suche. duckduckgo-search mit fallback_for_tools: [web_search]: Bei FIRECRAWL_KEY / BRAVE_SEARCH_KEY verschwindet DuckDuckGo automatisch zugunsten von web_search — weniger Token, bessere Ergebnisse. Fällt die API aus, taucht der Fallback wieder auf.
Plattformbeispiel: telegram-notify mit requires_toolsets: [messaging] und platforms: [telegram, discord]; per hermes skills-TUI lassen sich Skills für CLI, Telegram und Discord getrennt schalten — relevant für DSGVO-Trennung interner vs. externer Kanäle.
6. Skills Hub und Open-Source-Ökosystem
6.1 Offizielle Installationskanäle
hermes skills install official/research/arxiv
hermes skills install https://example.com/SKILL.md --name my-skill
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
6.2 Empfehlenswerte Open-Source-Repositories
| Repository | Beschreibung | Highlight |
|---|---|---|
| ChuckSRQ/awesome-hermes-skills | Kuratierte Produktions-Skills | Deep Research, MLOps, Apple-Integration; 23 Skills mit GitHub Copilot |
| amanning3390/hermeshub | Community-Register | Sicherheitsscan, API und Marktplatz |
| kevinnft/ai-agent-skills | 191 Skills, 28 Kategorien | Ein-Klick-Install für Hermes/Claude Code/Cursor |
| NousResearch/hermes-agent | Offizielles Hauptrepo | Autoritative Quelle inkl. aller Built-in-Skills |
Der agentskills.io-Standard ermöglicht Portabilität zwischen Hermes, Claude Code, Cursor und OpenCode. Validierung: skills-ref validate ./my-skill.
7. Eigenen Skill Tap veröffentlichen: Team- und Community-Sharing
Ein GitHub-Repo als Tap lässt Teams und Communities Ihre Skill-Sammlung abonnieren — selten dokumentiert, aber produktionsrelevant für einheitliche SOPs.
my-skills-tap/
├── skills.sh.json
├── mlops/vllm-deploy/SKILL.md
├── research/paper-summarizer/SKILL.md
└── README.md
skills.sh.json steuert Hub-Kategorien. Team-Deployment:
hermes skills tap add github:your-org/your-skills-tap
hermes skills tap add github:your-org/private-skills --token $GH_TOKEN
hermes skills tap update
hermes skills tap list
Versionsmanagement: ~/.hermes/skills/ in Git versionieren; geräteübergreifend git pull && hermes skills reset für konsistente Built-ins. Für DSGVO-Auditierbarkeit: Commit-Historie = nachvollziehbare Skill-Änderungen.
8. Self-Evolving Skills: GEPA + DSPy für automatische Verbesserung
Das ist Hermes' stärkster Differenzierer. GEPA (Genetic-Pareto Prompt Evolution) — ICLR Oral 2026 — ist in hermes-agent-self-evolution integriert. Prinzip: kein Modell-Fine-Tuning, sondern Analyse von Ausführungstraces, Variantengenerierung und multiobjektive Pareto-Optimierung der SKILL.md-Texte. Kosten pro Lauf: ca. 2–10 USD (reine API-Aufrufe, keine GPU).
8.1 GEPA-Fünf-Phasen-Evolutionsprozess
- Phase 1 — Trace-Sammlung: Vollständige Reasoning-Traces aus SQLite (Tool-Calls, Verzweigungen, Fehler).
- Phase 2 — Reflektive Fehleranalyse: LLM liefert „actionable side information“ — nicht „fehlgeschlagen“, sondern „warum“.
- Phase 3 — Gezielte Mutation: 10–20 SKILL.md-Varianten pro Fehlerursache.
- Phase 4 — Multiobjektive Pareto-Bewertung: Erfolgsrate × Token-Effizienz × Geschwindigkeit gleichzeitig.
- Phase 5 — Manueller PR-Review: Beste Variante → PR → Freigabe vor Produktion.
8.2 Schnellstart
git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes
python -m evolution.skills.evolve_skill \
--skill github-code-review --iterations 10 --eval-source synthetic
python -m evolution.skills.evolve_skill \
--skill github-code-review --iterations 10 --eval-source sessiondb
8.3 Vier Sicherheits-Leitplanken
- Volle Testsuite:
pytest tests/ -qmuss 100 % bestehen. - Größenlimit: Skills ≤ 15KB, Tool-Beschreibungen ≤ 500 Zeichen.
- Prompt-Cache-Kompatibilität: Keine mid-session-Änderungen, die Cache invalidieren.
- Semantische Erhaltung: Ursprünglicher Skill-Zweck darf nicht abdriften.
8.4 Fünf-Phasen-Roadmap (offizieller Status)
| Phase | Optimierungsziel | Engine | Status |
|---|---|---|---|
| Phase 1 | Skill-Dateien (SKILL.md) | DSPy + GEPA | ✅ Implementiert |
| Phase 2 | Tool-Beschreibungen | DSPy + GEPA | 🔲 Geplant |
| Phase 3 | System-Prompt-Fragmente | DSPy + GEPA | 🔲 Geplant |
| Phase 4 | Tool-Implementierungscode | Darwinian Evolver | 🔲 Geplant |
| Phase 5 | Kontinuierlicher Verbesserungszyklus | Automatisierte Pipeline | 🔲 Geplant |
Plattformübergreifende Traces: Skills folgen agentskills.io — Claude Code- oder Gemini-CLI-Traces können GEPA gespeist werden:
python -m evolution.skills.evolve_skill \
--skill github-code-review --iterations 10 --eval-source mixed \
--trace-dirs ~/.claude/traces,~/.hermes/sessions
9. Plugin-Skills: Grenzen von Hermes erweitern
Plugins bündeln Skills unter einem Namespace (plugin:skill): nicht in der Standard-skills_list (weniger Rauschen), nur bei explizitem Aufruf (Opt-in), Skills im Plugin können sich gegenseitig referenzieren.
skill_view("superpowers:writing-plans")
# Zeigt beim Laden Geschwister-Skills desselben Plugins
Deklaration in plugin.yaml:
name: my-hermes-plugin
skills:
- name: writing-plans
path: skills/writing-plans/SKILL.md
- name: editing
path: skills/editing/SKILL.md
10. Fortgeschrittene Autorentechniken (Ingenieurperspektive)
10.1 description bestimmt Aktivierungsgenauigkeit
❌ Zu vage: Helps with code. → ✅ Präziser Trigger: Use when reviewing a pull request... Do NOT use for writing new code.
10.2 Pitfalls als Qualitätsmerkmal
Hochwertige Pitfalls enthalten: konkretes Fehlermuster, Root-Cause-Analyse, umsetzbare Fix-Schritte — z. B. fragile CSS-Selektoren, GitHub-API-Rate-Limits, große Diffs mit Token-Overflow und Chunking-Strategien.
10.3 Skripte und skill_manage
In Procedure scripts/extract_schema.py referenzieren; bei Fehler references/manual-extract.md laden. Der Agent kann Skills via skill_manage(action='patch'| 'create') pflegen; mit skills.agent_writes_require_approval: true in config.yaml bleibt menschliche Freigabe Pflicht — DSGVO-relevant bei Skills mit personenbezogenen Daten.
10.4 Skill-Größensteuerung
| Größe | Empfehlung |
|---|---|
| < 500 Zeilen | Alles in SKILL.md |
| 500–1000 Zeilen | Details nach references/ |
| > 1000 Zeilen | Stark splitten; evtl. zwei Skills |
| > 15KB | GEPA-Limit überschritten — zwingend splitten |
11. Praxisfall: Skills für Ihren Tech-Blog-Workflow
Bundle blog-workflow mit seo-keyword-research, outline-generator, code-example-validator, bilingual-checker, publish-to-platform:
name: blog-workflow
description: Full tech blog writing workflow.
skills:
- seo-keyword-research
- outline-generator
- code-example-validator
- bilingual-checker
- publish-to-platform
instruction: |
Always research SEO keywords before writing.
Ensure all code examples are tested and runnable.
Generate both Chinese and English title options.
Custom-Skill seo-keyword-research sollte zu Sitzungsbeginn DE/EN-Long-Tails („X einrichten“, „how to X“, „X vs Y“) extrahieren: 3–5 Hauptkeywords + 10–15 Long-Tails — mit Terminologie-Matrix für DACH (Agent/KI-Assistent/Agentic AI).
12. Häufige Fragen (FAQ)
F: Was ist der Unterschied zwischen Skills und MCP?
Skills sind prozedurale Wissensdokumente; MCP ist eine Tool-Schnittstelle. MCP liefert Datenbankzugriff, ein Skill lehrt die korrekte Migration — beides ergänzt sich.
F: Warum nutzt der Agent nach meiner Bearbeitung noch die alte Skill-Version?
/reset für neue Sitzung, oder Installation mit --now (invalidiert Prompt Cache).
F: Sind GEPA-evolvierte Skills sicher?
Vier Leitplanken plus manueller PR-Review; semantische Drift-Prüfung verhindert Zweckabweichung. Dennoch jeden Diff vor Merge prüfen — besonders bei Skills mit DSGVO-relevanten Prozessen.
F: Wie nutze ich Hermes Skills in Claude Code?
Nach ~/.claude/skills/ kopieren oder kevinnft/ai-agent-skills Multi-Plattform-Installer verwenden.
F: Beeinflusst deutscher Skill-Inhalt die Token-Effizienz?
Deutsch liegt bei ca. 1–1,5 Token pro Wort — vergleichbar mit Englisch. Für präzises Routing empfiehlt sich description auf Englisch oder zweisprachig.
13. Ressourcen und Remote-Mac-7×24-Entscheidung
13.1 Offizielle und Community-Ressourcen
- Hermes Agent offizielle Dokumentation · Chinesische Dokumentation
- Skills-System-Referenz · agentskills.io-Offenstandard
- GEPA-Selbstevolution · GEPA-Algorithmus · DSPy-Framework
- Weitere SFTPMAC-Artikel: Cursor Agent Skills Leitfaden · OpenRouter CLI und Hermes-Auswahl
13.2 Deployment-Szenario-Entscheidungsmatrix
| Szenario | Lokaler Mac / Laptop | Remote Mac 7×24 (SFTPMAC) |
|---|---|---|
| GEPA-Evolution + sessiondb | Zuklappen bricht Traces; unvollständige Stichproben | Kontinuierliche Sitzungstraces; reichere Evolutionsdaten |
| Telegram/Discord-Gateway | Schlafmodus und WLAN-Wechsel nehmen Bot offline | launchd-Überwachung hält Gateway online |
| Team-Tap-Sync | Jedes ~/.hermes driftet lokal | Einheitlicher Knoten + SFTP/rsync für skills-Verzeichnis |
| Skill Bundles — lange Sitzungen | RAM und Tokens konkurrieren mit anderen Apps | Apple Silicon Unified Memory; stabile Multi-Skill-Läufe |
| DSGVO-Audit & Datenresidenz | Heim-ISP, gemischte Privat-/Arbeitsdaten | Getrennte Zustandsverzeichnisse, SSH-only-Zugriff, dokumentierte Löschfristen |
13.3 Fazit: vom lokalen Experiment zum Produktions-Agent-Knoten
Dieser Leitfaden deckt die vollständige Hermes-Skills-Kette ab: Konzeptvergleich → SKILL.md und Progressive Disclosure → Skill Bundles → bedingte Aktivierung → Hub-Ökosystem → Tap-Publishing → GEPA-Selbstevolution → Plugin-Erweiterungen → Autorentechniken → Blog-Workflow-Praxis. Damit wird Ihr Agent vom Wegwerf-Prompt zum versionierbaren, teilbaren, selbstverbessernden prozeduralen Asset.
Lokales Hermes hat klare Grenzen: Laptop-Zuklappen unterbricht Konnektivität, GEPA-sessiondb-Traces bleiben lückenhaft, Telegram-Gateway fällt beim Schlafmodus aus, Team-Taps driften zwischen Entwickler-Maschinen. Teams, die 7×24-Betrieb für Evolutions-Traces, Gateway-Hosting oder einheitliche ~/.hermes/skills/-Synchronisation brauchen, sollten Hermes auf einem Apple-Silicon-Remote-Mac betreiben — native launchd-Überwachung, macOS-konforme Toolchains und SFTP/rsync für sichere Skill-Verzeichnis-Sync.
SFTPMAC Remote-Mac-Miete richtet sich an Hermes Agent Skills-Workflows: 7×24-Gateway, kontinuierliche GEPA-Trace-Sammlung und Team-Tap-Verzeichnis-Sync — ein besserer Produktionseinstieg als ein Heim-Mac mit Doppelrolle. Beginnen Sie heute mit Ihrer ersten SKILL.md und lassen Sie den Agenten mit jeder Sitzung stärker werden.