Mehrere Mac-Knoten, ein gemeinsames Canary-Fenster: Wer Rollouts-Analysen blind an „irgendeine Health-URL“ heftet, riskiert, dass eine grüne Mikro-Probe die Promotion freigibt, obwohl eine andere Slice-Metrik längst aus dem Ruder läuft. Ebenso schädlich ist es, AnalysisRun-Webhooks mit CD-Sync-Hooks zu verwechseln. Diese Anleitung ordnet die Verantwortlichkeiten klar zu, definiert die Probe-Zusammenführung als Vertrag, hält Token-Rotation überlappend und legt eine Fehler-Summary auf den Notifier-Pfad, den OpenClaw-Cluster ohnehin bedienen.
- Rollouts ≠ Argo CD: CD synchronisiert Manifeste; Rollouts misst Canary-Schritte über AnalysisRun-Webhooks.
- Eine Stimme pro Fenster: Sonden in einem JSON-Dokument bündeln, sonst widersprechen sich Mikro-Endpunkte.
- Sicherheit vor Stampede: Token mit Überlappung rotieren, Retries mit Jitter und Hard-Cap deckeln.
Argo Rollouts ≠ Argo CD: in der Analyse-Spur bleiben
Argo CD reconciliiert Soll-Zustände aus Git: Sync-Status, Diff, App-Health. Argo Rollouts besitzt dagegen Canary-Schritte, Verkehrsverteilung und Experiment-Hooks. Erreicht ein Rollout die Analyse-Phase, erzeugt der Controller eine AnalysisRun, die Ihren Measurement-Provider aufruft — typischerweise einen HTTP-Webhook an Infrastruktur, die Sie selbst betreiben. Dieser Webhook ist kein CD-Sync-Hook; er bewertet, ob die Canary-Slice promoted werden darf.
Behandeln Sie Rollouts als Progressive-Delivery-Gehirn und OpenClaw-Gateways auf dedizierten Mac-Knoten als Sensorebene. Wer bereits Gateways nach Region trennt, übernimmt die Disziplin aus dem Multi-AZ-Gateway- und Webhook-Token-Leitfaden sowie aus den Canary-Skills mit Probe-Merge; dieser Artikel tauscht nur den Aufrufer aus — vom Operator-Drill zur Rollouts-Analyse-Schleife.
Mehrknoten-Topologie: Knoten und Progressive-Release synchronisieren
Stellen Sie sich zwei Gateway-Macs hinter einem Load-Balancer plus einen dritten Knoten vor, der strukturierte Logs tailt und Digests pusht — exakt das Kollaborationsmodell aus dem Tenant-Split mit Doctor-Merge. Rollouts schiebt Canary-Anteile auf der Kubernetes-Seite hoch, während Gateways OpenClaw-Verkehr oder Feature-Flags umschalten. Der AnalysisRun-Webhook muss auf einen canary-getaggten Hostnamen oder eine interne VIP zeigen, die ohnehin nur die zu messende Slice empfängt.
| Komponente | Verantwortung | Knoten | Sicherheit |
|---|---|---|---|
| Argo CD | Manifeste aus Git syncen, App-Health | Cluster-Controller | Schreibrechte ausschließlich Git-driven |
| Argo Rollouts | Canary-Schritte, Verkehrsmathematik, AnalysisRun | Cluster-Controller | RBAC für Webhook-Secrets streng begrenzt |
| OpenClaw-Gateway | Probe-Merge, Verkehrsumschaltung | Mac-mini-M4 (canary-Pool) | mTLS + Bearer, Rate-Limit pro Pfad |
| Notifier | Fehler-Digest, Audit, Alarmierung | Mac-mini (Log-Knoten) | Append-only-JSONL, Quoten |
Versionspins koppeln Sie an die Rolling-Upgrades und Peer-Deps, damit jedes Gateway während eines Analyse-Fensters vergleichbares JSON liefert. Bei Fragment-Änderungen vorher dem Fragment-Merge-Workflow folgen, statt Verkehr zu verbreitern.
Minimal reproduzierbare Schritte
- Rollouts ohne CD-Vermischung installieren: CRDs und Controller-Health prüfen; Argo CD bleibt für Sync zuständig, nicht für Canary-Messung.
- Eine HTTPS-Route auf einem Gateway-Mac veröffentlichen: z. B.
/rollouts/analysis, neben dem internen DNS-Split aus dem Split-DNS-Leitfaden dokumentiert. - Webhook-URL in der
AnalysisTemplateregistrieren oder inline; jedeAnalysisRunpostet einen vorhersagbaren JSON-Body für diesen Provider-Typ. - Aufrufer authentifizieren: Bearer-Token oder mTLS-Cert für den Rollouts-ServiceAccount-Pfad; Geheimnisse mit Rotations-Überlappung wie in Gateway-Token-Rotation.
- Sonden im Handler zusammenführen: Gateway-Process-Health, Canary-Fehlerratenzähler, Dependency-Pings und optional Doctor-Felder zu einem JSON-Verdikt plus
degraded-Flag verbinden. - Schnell und idempotent antworten: kurze Upstream-Timeouts, deterministische Status-Codes; wiederholte Messungen aus Rollouts-Retries dürfen Zustand nicht aufspalten.
- Retries deckeln, Jitter ergänzen: Mess-Intervalle in Rollouts und Rate-Limits am Gateway koppeln, damit transiente Aussetzer ohne Retry-Sturm verheilen.
- Fehler broadcasten: nicht-2xx- oder degraded-Klassifikationen als strukturierte Zeile an das Notifier-Muster aus Cluster-Logs & Webhook-Digest.
- Rollback proben: Load-Balancer-Gewichte und Rollouts-Abort-Schritte vor der ersten Produktions-AnalysisRun bookmarken — angelehnt an Doctor-Deep-Checks & Canary-Slices.
- End-to-end beobachten: Controller-Logs auf Webhook-Fehler tailen und parallel die Merge-Probe vom Bastion curlen, um Parität zwischen Mensch- und Rollouts-Aufruf zu bestätigen.
Probe-Merge: ein Body, viele Signale
Rollouts wertet pro Intervall genau das aus, was Ihr Mess-Endpunkt zurückgibt. Wer fünf Mikro-Endpunkte exponiert, läuft Gefahr, dass Operatoren den grünen curlen, während die Analyse zufällig den roten trifft. Stattdessen mergen: Disk-Druck, Queue-Tiefe, OpenClaw-Worker-Erreichbarkeit und canary-spezifische Zähler erscheinen als benannte Felder in einem Dokument. Feldnamen an die Konventionen aus Tenant-Webhook-Merges angleichen.
{
"status": "healthy",
"rollout": "payments-api",
"canary": { "5xx_rate": 0.002, "p99_ms": 180 },
"gateway": { "disk_ok": true, "queue_depth": 3 },
"degraded": false
}
Ist eine Slice grenzwertig, lieber explizit degraded mit HTTP 200 setzen — so teilen Verkehrssteuerung und Mensch dieselbe nuancierte Geschichte. Vertiefung im Canary-Skills-Leitfaden.
Token, Überlappung und begrenzte Retries
Webhook-Credentials so ausstellen, dass der Rollouts-Controller sie über sealed secrets mountet oder referenziert. Dual-Token-Überlappung für mindestens ein Analyse-Fenster fahren, damit das Rotieren des Gateway-Geheimnisses nie eine laufende AnalysisRun reißt. Verifikationsfehler mit Rollout-Name, Namespace und Mess-Index loggen — das hält die Triage kurz.
Retries gehören auf beide Seiten: Rollouts treibt fehlgeschlagene Messungen erneut an; Gateways nutzen Exponential-Backoff mit Hard-Cap, wenn sie Upstream-Telemetrie aufrufen. Den Cap im Runbook neben SSH-Mustern aus der Hilfe dokumentieren, damit On-Call-Engineers verkeilte Analysen pausieren statt verstärken.
Fehler-Summary-Broadcast für Mehrknoten-Kollaboration
Schlägt eine Analyse fehl, brauchen Operatoren ein lesbares Digest mit Gateway-AZ, Mess-Versuch und zusammengefassten Metrik-Deltas. Diese Events an den Notifier-Mac fan-out — gleiche Batching-Philosophie wie bei generischen Webhook-Digests — damit Slack oder E-Mail lesbar bleiben, während Kubernetes weiter misst. Pair mit Append-only-JSONL-Quoten aus dem Cluster-Log-Merge-Leitfaden, damit Disk-Druck nie ein Sekundärincident wird.
Wer Build-Artefakte über Knoten betreibt, hält Mess-Abhängigkeiten unabhängig von rsync-Promotion-Fenstern aus der Cross-Region-Artefakt-Matrix — nichts verwirrt eine Canary-Analyse schneller als ein Gateway-Binary, das mitten im Lauf wechselt.
FAQ
Können Argo-CD-PreSync-Hooks diesen Webhook ersetzen? Nein. PreSync-Hooks feuern um App-Sync herum, nicht pro Revision der Canary-Bewertung. Mess-Logik gehört in Rollouts-AnalysisTemplates.
Sollte jeder Gateway-Mac AnalysisRun-Verkehr annehmen? Lieber einen dedizierten Canary-Pool, damit stabile Gateways ruhig bleiben, während Rollouts in engen Schleifen misst.
Was, wenn das gemergte JSON einen Spike in einer Metrik kaschiert? Sub-Threshold-Warnungen kodieren und Rollouts mehrere Messungen zeitlich kombinieren lassen — oder Templates nach Anliegen splitten und auf denselben TLS-Endpunkt mit unterschiedlichen Pfaden posten.
Mac-Gateways bereitstellen, die Rollouts-Tempo halten
Öffentliche Preise einsehen, in der Hilfe SSH- und Onboarding-Muster lesen oder direkt zur Bestellseite springen — kein Account-Wall, bevor Sie mit dem Plattform-Team Tarife vergleichen.