Claude Code Skill + Python NLP Pipeline

Redestil erfassen.
Reproduzierbar machen.

Extrahiere die Sprach-DNA eines Redners aus Beispielreden. Generiere neue Reden im exakten Stil — validiert gegen 47 messbare Dimensionen. Lerne aus Feedback und werde mit jeder Rede besser.

Installation & Start Wie funktioniert es?

Fünf Modi, ein Workflow

Von der Stilanalyse bis zur fertigen Rede — mit eingebauter Lernschleife und Qualitätssicherung.

1

Sprach-DNA erstellen

Analysiert Beispielreden quantitativ (Python: Satzlänge, Rhetorik, Grammatik) und qualitativ (Claude: Tonalität, Argumentation, Bildsprache). Ergebnis ist ein vollständiges, belegtes Stilprofil mit 15 Abschnitten und messbaren Zielwerten.

2

Rede generieren

Nutzt DNA + akkumulierte Learnings + Briefing. Erstellt eine Gliederung nach dem DNA-Blueprint, generiert die Rede abschnittsweise und validiert automatisch gegen die DNA-Metriken. Learnings aus Feedback haben Vorrang. Iteriert bis Score ≥ 85.

3

Feedback & Lernen

Akzeptiert Feedback als Text oder als überarbeitete Rede. Python berechnet die Deltas, identifiziert was verschoben wurde. Learnings werden als konkrete Regeln in LEARNINGS-{Name}.md gespeichert und bei jeder Generierung mitgelesen.

4

Stil-Check

Prüft ob eine Rede zum DNA-Profil passt — quantitativ (Score) und qualitativ (Tonalität, Rhetorik, Wort-DNA). Verdikt: Authentisch / Teilweise passend / Stilfremd. Hilft zu entscheiden ob eine Rede als Trainingsmaterial geeignet ist.

5

Skill exportieren

Exportiert die aktuelle Skill-Version als lesbares Paket — Skill-Definition, Templates und Referenzdateien gebündelt in einem Verzeichnis.

So arbeitet die Pipeline

Python liefert die Zahlen. Claude liefert das Verständnis. Zusammen entsteht die Sprach-DNA.

Modus 1: Sprach-DNA erstellen

Konvergenz-Diagnose

Python

Inkrementelle Analyse: Jede Rede wird einzeln hinzugefügt und ihr Einfluss auf die Metriken gemessen. Zeigt ob die DNA stabil wird oder mehr Reden nötig sind.

Quantitative Analyse

Python spaCy

47 Dimensionen extrahieren: Satzlänge, TTR, Rhetorik, POS-Verteilung, Interpunktion, Lesbarkeit, Aktiv/Passiv, Pronomen-Profil.

Rhetorische Figuren

Python

Anaphern, Epiphern, Trikola, rhetorische Fragen, Antithesen und bewusste Wiederholungen erkennen.

Qualitative Analyse

Claude

Tonalität, Argumentationsmuster, Aufbau-Architektur, Bildsprache, Rhythmus, Quellen-Integrationsstil, Anti-Patterns.

SPRACH-DNA schreiben

Claude

15-Abschnitte-Stilprofil mit Zitaten als Belegen, quantitativen Zielwerten und Toleranzbereichen.

Modus 2: Rede generieren

Briefing

Thema, Zielgruppe,
Dauer, Quellen

Gliederung

Nach DNA-Blueprint,
User bestätigt

Generierung + Validierung

Abschnittsweise, Score-Check,
max. 3 Iterationen

Konvergenz-Diagnose

Reichen deine Beispielreden? Der Skill prüft automatisch ob die DNA stabil wird — oder ob mehr Material nötig ist.

KONVERGENZ-DIAGNOSE
──────────────────────────────────────────────────

Rede 1-2: Basis-Analyse

Rede 3 "gruswort-juni.txt" (450 Wörter):
  Metriken-Drift:    Ø 12.3% (4 signifikante Shifts)
  Neue Signalwörter: +8 (innovation, wandel, zukunft...)
  Neue Rhetorik:    trikolon
  🔵 Diese Rede hat den Stil ERWEITERT
    ↳ Satzlänge: 14.2 → 12.8 (-9.9%)
    ↳ Stakkato-Quote: 12.0 → 18.5 (+54.2%)

Rede 4 "impulsvortrag-sept.txt" (720 Wörter):
  Metriken-Drift:    Ø 6.1% (2 signifikante Shifts)
  Neue Signalwörter: +3
  Neue Rhetorik:    keine neuen Muster
  🟡 Diese Rede hat den Stil VERFEINERT

Rede 5 "ansprache-herbst.txt" (680 Wörter):
  Metriken-Drift:    Ø 3.1% (0 signifikante Shifts)
  Neue Signalwörter: +1
  Neue Rhetorik:    keine neuen Muster
  🟢 Diese Rede hat den Stil BESTÄTIGT

══════════════════════════════════════════════════
🟢 GESAMTBEWERTUNG: STABIL
   DNA konvergiert (Ø Shift der letzten Reden: 3.1%). 5 Reden sind eine solide Basis.
STABIL

DNA konvergiert,
genug Material

FAST STABIL

Leichte Shifts,
1-2 Reden mehr

INSTABIL

Deutliche Shifts,
mehr Reden nötig

UNZUREI-
CHEND

Unter 3 Reden,
Minimum fehlt

47 messbare Dimensionen

Jeder Stil hat einen quantifizierbaren Fingerabdruck. Diese Metriken machen ihn reproduzierbar.

Kategorie Metriken Werkzeug
Satzebene Satzlänge (Mittelwert, Median, Stddev, Min/Max), Satztypen-Mix, Satzanfänge-Verteilung, Stakkato-Quote spaCy
Wortebene Type-Token-Ratio, Hapax-Legomena, Wortlänge, Füllwort-Profil, Modalverb-Frequenz, Top-50 Signalwörter spaCy
Pronomen Ich/Wir/Sie/Man/Es-Verteilung, Wir/Ich-Verhältnis, Gesamt-Pronomen-Anteil spaCy
Interpunktion Gedankenstriche, Doppelpunkte, Semikolons, Ellipsen, Ausrufezeichen, Fragezeichen, Klammern, Kommas (je /1000 W.) Python
Lesbarkeit Flesch-Reading-Ease (DE), Silben/Wort, Lange-Wörter-Anteil, Wörter/Satz textstat
Grammatik POS-Verteilung, Aktiv/Passiv-Verhältnis, Tempus-Verteilung, Adjektiv-Dichte, Verb/Substantiv-Ratio spaCy
Rhetorik Anaphern, Epiphern, Trikola, Rhetorische Fragen, Antithesen, bewusste Wiederholungen (je /1000 W.) Regex+NLP

Qualitative Dimensionen (Claude)

Dimension Was wird erfasst
Tonalität & RegisterFormalitätsgrad, emotionale Temperatur, Autoritätsstil, Humor-Typ, Empathie-Signale
ArgumentationMuster, Evidenz-Präferenz, Gegenargument-Behandlung, Logos/Pathos/Ethos-Gewichtung
Aufbau-BlueprintEröffnungstechnik, Übergänge, Spannungsbogen, Schluss-Technik, Proportionen
Zielgruppen-AnspracheAnrede-Muster, Inklusion, Vorwissen-Annahme, Appell-Frequenz
BildspracheMetaphern-Dichte, bevorzugte Bildfelder, Vergleiche, Abstrakt/Konkret
RhythmusSprechbarkeit, Pause-Markierungen, Emphase-Wiederholungen, Atem-Einheiten
Quellen-IntegrationZitat-Einbau, Quellennennung, Daten-Präsentation
Anti-PatternsWas bewusst NICHT getan wird, vermiedene Wörter/Konstruktionen

Automatische Validierung

Jede generierte Rede wird gegen die DNA-Metriken geprüft. Abweichungen werden identifiziert und iterativ korrigiert.

Dimension Ziel Ist Abw. Status
────────────────────────────────── ────── ────── ────── ─────
Satzlänge (Ø Wörter) 14.2 15.8 11.3% ✓
Stakkato-Quote 18.0 12.0 33.3% ⚠️
Type-Token-Ratio 0.42 0.45 7.1% ✓
Füllwörter/1000 8.5 7.2 15.3% ✓
Aktiv-Anteil (%) 78.0 74.0 5.1% ✓
Wir/Ich-Verhältnis 2.1 1.8 14.3% ✓
Fragezeichen/1000 8.0 3.2 60.0% ⚠️
Flesch-Index 52.0 48.0 7.7% ✓
Silben/Wort 1.82 1.88 3.3% ✓
Kommas/1000 62.0 58.0 6.5% ✓

STIL-ÜBEREINSTIMMUNG: 80/100 (8/10 Dimensionen im Toleranzbereich)
→ Gute Übereinstimmung, einzelne Dimensionen weichen ab
≥85

Sehr gut

70-84

Gut

50-69

Moderat

<50

Niedrig

Sprechdauer & Wortanzahl

Sage einfach "schreibe eine Rede für 10 Minuten" — der Skill rechnet automatisch um. Standard: 130 Wörter pro Minute (ruhiger Vortragsstil). Individuell anpassbar.

3
Minuten
~390 Wörter
5
Minuten
~650 Wörter
10
Minuten
~1.300 Wörter
15
Minuten
~1.950 Wörter
20
Minuten
~2.600 Wörter
30
Minuten
~3.900 Wörter

Feedback & Learnings

Der Skill lernt aus jeder Korrektur. Learnings werden pro DNA gespeichert und bei jeder Generierung mitgelesen.

Text-Feedback

"Die Rede ist zu formell."
"Mehr rhetorische Fragen."
"Der Schluss ist zu abrupt."

Claude interpretiert das Feedback, identifiziert welche DNA-Dimensionen betroffen sind und schlägt konkrete Anpassungen vor.

Überarbeitete Rede

Du korrigierst die Rede selbst. Der Skill analysiert automatisch was du geändert hast.

Python berechnet die exakten Deltas: Satzlänge +51%, Stakkato -40%, Füllwörter +12%. Daraus leitet der Skill ab, wie die DNA angepasst werden muss.

Rede generieren

Modus 2

Feedback geben

Text oder Korrektur

Delta-Analyse

Python + Claude

DNA + Learnings

Akkumuliert

Learnings statt Skill-Modifikation

Statt den Skill selbst zu verändern, werden Erkenntnisse als konkrete Regeln in LEARNINGS-{Name}.md gespeichert — pro DNA, versionierbar, nachvollziehbar. Bei jeder Generierung werden Learnings automatisch mitgelesen und haben Vorrang vor generischen DNA-Zielwerten. Der Skill bleibt stabil, das Wissen wächst.

Installation & Start

In drei Schritten zur ersten Sprach-DNA.

1. Repository klonen

git clone <repository-url> RedenSkill
cd RedenSkill

2. Dependencies installieren

bash scripts/setup.sh

# Oder manuell:
pip install -r scripts/requirements.txt
python -m spacy download de_core_news_lg

Installiert spaCy (MIT), deutsches Sprachmodell (MIT), textstat (MIT). Ca. 600 MB.

3. Material ablegen

# Beispielreden (mind. 3 empfohlen)
cp meine-reden/*.txt archive/beispielreden/

# Referenzquellen (optional)
cp quellenmaterial/*.md archive/quellen/

4. Skill starten

# In Claude Code (CLI, Desktop App, oder IDE Extension):
/project:reden

Wähle "Sprach-DNA erstellen" beim ersten Durchlauf.

Voraussetzungen

KomponenteVersionLizenz
Python3.9+PSF
Claude CodeaktuellAnthropic
spaCy3.7+MIT
de_core_news_lgaktuellMIT
textstat0.7+MIT

Projektstruktur

RedenSkill/
├── .claude/commands/reden.md # Skill + Orchestrator
├── references/
│ ├── sprach-dna-template.md # DNA-Template (15 Abschnitte)
│ ├── generierung-regeln.md # Qualitäts-Regeln mit Begründungen
│ └── beispiele.md # Input→Output Beispiele
├── scripts/
│ ├── analyze_style.py # Haupt-Pipeline
│ ├── diagnose_convergence.py # Konvergenz-Diagnose
│ ├── extract_metrics.py # 47 quantitative Dimensionen
│ ├── detect_rhetoric.py # Rhetorische Figuren
│ ├── validate_speech.py # Validierung (Score 0-100)
│ ├── compare_feedback.py # Feedback-Delta-Analyse
│ ├── requirements.txt
│ └── setup.sh
├── archive/
│ ├── beispielreden/ # Beispielreden ablegen
│ └── quellen/ # Referenzquellen ablegen
├── output/
│ ├── sprach-dna/ # DNA + Metriken + Learnings
│ └── reden/ # Generierte Reden + Reports
├── CLAUDE.md
├── README.md
└── index.html # Diese Seite

Häufige Fragen

Wie viele Beispielreden brauche ich?

Minimum 3, empfohlen 5-10. Mehr Reden ergeben stabilere Metriken. Bei nur 3 Reden können Ausreißer (eine besonders kurze oder formelle Rede) die Durchschnittswerte verzerren.

Kann ich mehrere Stile verwalten?

Ja. Lege verschiedene Sets von Beispielreden an und erstelle je eine eigene Sprach-DNA. In Modus 2 wählst du bei jedem Durchlauf welche DNA verwendet werden soll. So kannst du z.B. einen formellen Konferenz-Stil und einen lockeren Team-Meeting-Stil parallel pflegen.

Was gehört in die Quellen?

Alles woraus sich die Rede inhaltlich speisen darf: Studien, Marktzahlen, Zitate, Hintergrundinfos, Pressemitteilungen, interne Reports. Die Quellen beeinflussen den Inhalt, nicht den Stil — der kommt ausschließlich aus der DNA.

Funktioniert es auch für englische Reden?

Prinzipiell ja, aber das Sprachmodell ist für Deutsch optimiert. Für Englisch müsste in extract_metrics.py das Modell auf en_core_web_lg gewechselt und die Füllwort- und Modalverb-Listen angepasst werden.

Brauche ich eine GPU?

Nein. spaCy läuft effizient auf der CPU. Die Analyse von 10 Reden dauert typisch 10-30 Sekunden. Das ist kein Deep Learning mit Millionen Parametern, sondern statistische Sprachanalyse.

Was passiert mit meinen Reden?

Alles läuft lokal. Keine Daten werden an externe Server geschickt (außer an Claudes API im Rahmen der normalen Claude Code Nutzung). Beispielreden, DNA und generierte Reden bleiben auf deinem Rechner.

Wie genau ist die Stilübertragung?

Der Validierungs-Score misst die quantitative Übereinstimmung. Typische Scores bei guter DNA liegen bei 75-90. Die qualitative Übereinstimmung (Tonalität, Argumentationsstil) lässt sich nicht automatisiert messen — dafür gibt es die Feedback-Schleife.

Wie ist die Lizenzierung?

Alle verwendeten Bibliotheken (spaCy, textstat, de_core_news_lg) stehen unter der MIT-Lizenz und sind kommerziell uneingeschränkt nutzbar.

Impressum

Angaben gemäß § 5 TMG

Verantwortlich

Mark Zimmermann
Ehlersstraße 18C
76187 Karlsruhe
Deutschland

Kontakt:
E-Mail: schiff_spritziger7j@icloud.com

Verantwortlich für den Inhalt nach § 18 Abs. 2 MStV

Mark Zimmermann
Ehlersstraße 18C
76187 Karlsruhe

Haftungsausschluss

Die Repositories werden privat und zum Nutzen der Gemeinschaft erstellt. Der Betreiber übernimmt keine Haftung für den Einsatz, die Nutzung oder die Weiterverwendung der in den Repositories enthaltenen Inhalte. Es wird keine Gewähr für Richtigkeit, Vollständigkeit oder Aktualität der Inhalte übernommen. Externe Links unterliegen der Verantwortung der jeweiligen Betreiber. Die Inhalte unterliegen dem deutschen Urheberrecht; es gelten die jeweiligen Repository-Lizenzen.

© 2026 Mark Zimmermann