Public : administrateurs de grappe qui orchestrent OpenClaw sur des ressources parallèles Mac mini M4. Conclusion : KEDA répond à combien de workers lancer ; le jugement canari reste sur les Mac passerelle qui consolident les logs et promeuvent les artefacts. Vous trouverez trois matrices, sept étapes et des garde-fous citables pour vos runbooks.
Points de friction avant le premier scale KEDA
1. Scale file seule. Les réplicas montent alors qu'une tranche canari sert encore le mauvais hash skill-pack.
2. Métriques éclatées. Le HPA voit un CPU bas pendant que le taux 5xx grimpe sur le VIP que le webhook ne score jamais.
3. Tempête webhook. Le polling ScaledObject plus des relances illimitées saturent chaque nœud clustervps derrière l'équilibreur.
Déclencheurs KEDA ScaledObject et file de build
Pointez le déclencheur ScaledObject sur le même signal de profondeur que votre voie build OpenClaw — longueur de liste Redis, messages NATS en attente ou jauge Prometheus du coordinateur sur un Mac passerelle clustervps. Plafonnez maxReplicaCount pendant le canari pour que le scale-out ne dépasse pas le budget de sondes.
| Déclencheur | Valeur de départ | Note canari |
|---|---|---|
| Profondeur file | Scale à ≥ 8 jobs en attente | Maintenir max replicas +1 jusqu'au JSON fusionné OK. |
| Cooldown | 120 s avant scale-down | Évite le thrash quand les webhooks relancent l'analyse. |
| minReplicaCount | 1 stable + 0 worker canari | Workers canari : label Deployment séparé. |
| Activation | 0 → passerelles idle endormies | Réveiller seulement la tranche AZ sous test. |
Alignez les verrous de promotion sur les schémas Nomad build-lock pour qu'aucun rsync ne court pendant que KEDA scale le Deployment canari.
Tranches passerelle canari multi-AZ
Épinglez les labels gateway_version et az par Mac. Routez les webhooks canari vers un hostname tagué depuis le guide webhooks passerelle multi-AZ, pas vers le pool stable utilisé pour SSH. Réutilisez les ratios du guide skills canari multi-AZ et les fragments du workflow fusion de fragments. Cartographiez les régions sur l'accueil avant d'ajouter un quatrième nœud passerelle.
Sondes métriques : seuils latence et taux d'erreur
Retournez un document JSON fusionné par intervalle de polling ScaledObject — même discipline que Rollouts ou Flagger, mais scoré par votre webhook passerelle avant que KEDA augmente les réplicas.
| Signal | Seuil de départ | Échec si |
|---|---|---|
| Taux 5xx canari | ≤ 0,5 % sur cinq minutes | Deux fenêtres consécutives au-dessus du plafond. |
| Latence p99 passerelle | ≤ 220 ms sur VIP canari | Régression > 15 % vs baseline stable. |
| Profondeur file | ≤ 12 jobs en attente | Profondeur croît pendant que le poids canari augmente. |
| degraded | HTTP 200 avec booléen explicite | degraded: true échoue fermé. |
{
"status": "healthy",
"keda": "openclaw-build-lane",
"canary": { "5xx_rate": 0.003, "p99_ms": 158 },
"gateway": { "disk_ok": true, "queue_depth": 5, "skill_hash": "c4e1…" },
"degraded": false
}
Diffusion des résumés d'échec webhook
Montez deux secrets bearer avec chevauchement d'au moins une fenêtre complète de polling KEDA. Sur toute classification non réussie, regroupez un digest vers le Mac notificateur via logs de grappe et digests webhook — les opérateurs lisent un seul résumé pendant que le scaler relance.
- Jeton principal : métrique custom ScaledObject / en-tête webhook passerelle.
- Jeton de chevauchement : accepté sept jours après rotation.
- Plafond relances : trois tentatives passerelle avec jitter ; intervalle polling ≥ 60 s en maintenance.
Verrouillage version skill-pack et rollback
Gelez les hash skill-pack tant que canary_active=true. En cas d'abort, revenez au hash, remettez maxReplicaCount KEDA à la valeur de la voie stable, et relâchez les verrous rsync flock selon la matrice artefacts rsync. Les échecs Doctor font encore échouer le JSON fusionné — voir contrôles Doctor approfondis avant d'élargir le trafic.
Jalons disque 1 To / 2 To sur Mac passerelle
Incluez disk_ok dans les sondes fusionnées. Échouez fermé lorsque l'APFS franchit les seuils jaunes pendant un scale-out.
| SKU | Seuil jaune | Action |
|---|---|---|
| Passerelle 1 To | ≥ 82 % utilisé | Bloquer scale-up KEDA ; diffuser digest. |
| Passerelle 2 To | ≥ 78 % utilisé | Idem ; voie stable uniquement. |
| Seuil rouge | ≥ 90 % (tout SKU) | Scale vers min replicas ; drainer VIP canari. |
KEDA vs Flagger vs Argo Rollouts (apport de ce guide)
Flagger et Rollouts déplacent surtout les poids de trafic sur un nombre de réplicas quasi fixe. KEDA ajuste la capacité quand les files ou métriques custom l'exigent — idéal pour les pics de build sur voies Mac parallèles clustervps.
- KEDA (cet article) : déclencheurs ScaledObject, couplage file, plafonds d'échelle pendant canari.
- Flagger : CRD Canary + webhooks AnalysisRun — voir notre guide Flagger.
- Argo Rollouts : AnalysisRun sur objets Rollouts — voir sondes Rollouts.
- Flux : automatisation image GitOps — voir canari Flux.
Un seul appelant amont par URL de mesure passerelle. Ne doublez jamais le même handler depuis un événement scale KEDA et un AnalysisRun Rollouts dans la même minute.
Déploiement reproductible (sept étapes)
- Installer KEDA et confirmer que le ScaledObject cible le Deployment worker OpenClaw — pas le DaemonSet passerelle.
- Câbler le déclencheur à la profondeur de file avec cooldown et plafond max replica canari.
- Exposer
/keda/metricssur un Mac passerelle tagué canari avec auth bearer. - Retourner le JSON fusionné avec latence, taux d'erreur, profondeur file, disk_ok et skill_hash.
- Verrouiller les skill-packs et pauser rsync jusqu'à passage ou abort des sondes.
- Activer la diffusion d'échec vers votre chemin notificateur ; répéter le scale-down sur degraded true.
- Valider en curl depuis un bastion pendant que KEDA maintient les réplicas au plafond canari.
Garde-fous citables
- Contrat de mesure : un schéma JSON fusionné versionné dans Git par flotte passerelle.
- Gel d'échelle : aucun scale-up KEDA tant que
degraded: truependant deux fenêtres de polling. - Gel de promotion : aucun rsync delete-heavy tant que canary_active est vrai.
Câblez les canaris KEDA sur une flotte OpenClaw multi-nœuds
Comparez Flagger et les verrous Nomad, puis partez de l'accueil ou de l'achat forfaits grappe pour provisionner des passerelles Mac mini M4 parallèles avec accès SSH/VNC.