« Les équipes plateforme sur grappes Mac clustervps ont besoin d'un canari piloté par événements : monter l'échelle quand la file de build déborde, trancher le trafic sur les passerelles, et diffuser les échecs webhook avant que KEDA ajoute des réplicas. » Ce guide est une reproduction minimale — déclencheurs ScaledObject liés à la file, tranches passerelle multi-AZ, sondes latence et erreurs fusionnées, diffusion des résumés d'échec, verrouillage des skill-packs et jalons disque 1 To / 2 To — avec une matrice qui distingue KEDA de notre guide Flagger canari et du guide Argo Rollouts AnalysisRun.

Public : administrateurs de grappe qui orchestrent OpenClaw sur des ressources parallèles Mac mini M4. Conclusion : KEDA répond à combien de workers lancer ; le jugement canari reste sur les Mac passerelle qui consolident les logs et promeuvent les artefacts. Vous trouverez trois matrices, sept étapes et des garde-fous citables pour vos runbooks.

Points de friction avant le premier scale KEDA

1. Scale file seule. Les réplicas montent alors qu'une tranche canari sert encore le mauvais hash skill-pack.

2. Métriques éclatées. Le HPA voit un CPU bas pendant que le taux 5xx grimpe sur le VIP que le webhook ne score jamais.

3. Tempête webhook. Le polling ScaledObject plus des relances illimitées saturent chaque nœud clustervps derrière l'équilibreur.

Déclencheurs KEDA ScaledObject et file de build

Pointez le déclencheur ScaledObject sur le même signal de profondeur que votre voie build OpenClaw — longueur de liste Redis, messages NATS en attente ou jauge Prometheus du coordinateur sur un Mac passerelle clustervps. Plafonnez maxReplicaCount pendant le canari pour que le scale-out ne dépasse pas le budget de sondes.

DéclencheurValeur de départNote canari
Profondeur fileScale à ≥ 8 jobs en attenteMaintenir max replicas +1 jusqu'au JSON fusionné OK.
Cooldown120 s avant scale-downÉvite le thrash quand les webhooks relancent l'analyse.
minReplicaCount1 stable + 0 worker canariWorkers canari : label Deployment séparé.
Activation0 → passerelles idle endormiesRéveiller seulement la tranche AZ sous test.

Alignez les verrous de promotion sur les schémas Nomad build-lock pour qu'aucun rsync ne court pendant que KEDA scale le Deployment canari.

Tranches passerelle canari multi-AZ

Épinglez les labels gateway_version et az par Mac. Routez les webhooks canari vers un hostname tagué depuis le guide webhooks passerelle multi-AZ, pas vers le pool stable utilisé pour SSH. Réutilisez les ratios du guide skills canari multi-AZ et les fragments du workflow fusion de fragments. Cartographiez les régions sur l'accueil avant d'ajouter un quatrième nœud passerelle.

Sondes métriques : seuils latence et taux d'erreur

Retournez un document JSON fusionné par intervalle de polling ScaledObject — même discipline que Rollouts ou Flagger, mais scoré par votre webhook passerelle avant que KEDA augmente les réplicas.

SignalSeuil de départÉchec si
Taux 5xx canari≤ 0,5 % sur cinq minutesDeux fenêtres consécutives au-dessus du plafond.
Latence p99 passerelle≤ 220 ms sur VIP canariRégression > 15 % vs baseline stable.
Profondeur file≤ 12 jobs en attenteProfondeur croît pendant que le poids canari augmente.
degradedHTTP 200 avec booléen explicitedegraded: true échoue fermé.
{
  "status": "healthy",
  "keda": "openclaw-build-lane",
  "canary": { "5xx_rate": 0.003, "p99_ms": 158 },
  "gateway": { "disk_ok": true, "queue_depth": 5, "skill_hash": "c4e1…" },
  "degraded": false
}

Diffusion des résumés d'échec webhook

Montez deux secrets bearer avec chevauchement d'au moins une fenêtre complète de polling KEDA. Sur toute classification non réussie, regroupez un digest vers le Mac notificateur via logs de grappe et digests webhook — les opérateurs lisent un seul résumé pendant que le scaler relance.

  • Jeton principal : métrique custom ScaledObject / en-tête webhook passerelle.
  • Jeton de chevauchement : accepté sept jours après rotation.
  • Plafond relances : trois tentatives passerelle avec jitter ; intervalle polling ≥ 60 s en maintenance.

Verrouillage version skill-pack et rollback

Gelez les hash skill-pack tant que canary_active=true. En cas d'abort, revenez au hash, remettez maxReplicaCount KEDA à la valeur de la voie stable, et relâchez les verrous rsync flock selon la matrice artefacts rsync. Les échecs Doctor font encore échouer le JSON fusionné — voir contrôles Doctor approfondis avant d'élargir le trafic.

Jalons disque 1 To / 2 To sur Mac passerelle

Incluez disk_ok dans les sondes fusionnées. Échouez fermé lorsque l'APFS franchit les seuils jaunes pendant un scale-out.

SKUSeuil jauneAction
Passerelle 1 To≥ 82 % utiliséBloquer scale-up KEDA ; diffuser digest.
Passerelle 2 To≥ 78 % utiliséIdem ; voie stable uniquement.
Seuil rouge≥ 90 % (tout SKU)Scale vers min replicas ; drainer VIP canari.

KEDA vs Flagger vs Argo Rollouts (apport de ce guide)

Flagger et Rollouts déplacent surtout les poids de trafic sur un nombre de réplicas quasi fixe. KEDA ajuste la capacité quand les files ou métriques custom l'exigent — idéal pour les pics de build sur voies Mac parallèles clustervps.

  • KEDA (cet article) : déclencheurs ScaledObject, couplage file, plafonds d'échelle pendant canari.
  • Flagger : CRD Canary + webhooks AnalysisRun — voir notre guide Flagger.
  • Argo Rollouts : AnalysisRun sur objets Rollouts — voir sondes Rollouts.
  • Flux : automatisation image GitOps — voir canari Flux.

Un seul appelant amont par URL de mesure passerelle. Ne doublez jamais le même handler depuis un événement scale KEDA et un AnalysisRun Rollouts dans la même minute.

Déploiement reproductible (sept étapes)

  1. Installer KEDA et confirmer que le ScaledObject cible le Deployment worker OpenClaw — pas le DaemonSet passerelle.
  2. Câbler le déclencheur à la profondeur de file avec cooldown et plafond max replica canari.
  3. Exposer /keda/metrics sur un Mac passerelle tagué canari avec auth bearer.
  4. Retourner le JSON fusionné avec latence, taux d'erreur, profondeur file, disk_ok et skill_hash.
  5. Verrouiller les skill-packs et pauser rsync jusqu'à passage ou abort des sondes.
  6. Activer la diffusion d'échec vers votre chemin notificateur ; répéter le scale-down sur degraded true.
  7. Valider en curl depuis un bastion pendant que KEDA maintient les réplicas au plafond canari.

Garde-fous citables

  • Contrat de mesure : un schéma JSON fusionné versionné dans Git par flotte passerelle.
  • Gel d'échelle : aucun scale-up KEDA tant que degraded: true pendant deux fenêtres de polling.
  • Gel de promotion : aucun rsync delete-heavy tant que canary_active est vrai.
Note d'exploitation. Les API KEDA, Kubernetes et OpenClaw évoluent ; validez déclencheurs ScaledObject et payloads webhook contre vos versions installées avant production.
Grappe Mac parallèle clustervps

Câblez les canaris KEDA sur une flotte OpenClaw multi-nœuds

Comparez Flagger et les verrous Nomad, puis partez de l'accueil ou de l'achat forfaits grappe pour provisionner des passerelles Mac mini M4 parallèles avec accès SSH/VNC.

Commander une grappe parallèle Tarifs multi-nœuds