npm -g unique, des arbres peer alignés, un Doctor sur chaque nœud, une readiness JSON fusionnée, des diffusions d’échec visibles pour l’astreinte, et des points de retour nommés avant d’élargir le trafic canari.
À lire en parallèle des guides ratios canari et tranches de skills, passerelles multi-AZ et webhooks et fusion Doctor par locataire : ici l’accent est posé sur la séquence d’installation avant tout mouvement de charge. Une fois les binaires homogènes, croisez avec la matrice rsync des artefacts pour garder des arbres « dorés » identiques entre régions. Pour le contexte réseau et DNS, le guide DNS scindé et registre complète la vue d’ensemble d’un cluster déjà en production.
Pourquoi les mises à jour roulantes échouent encore sur de petits clusters Mac
Les incidents se concentrent sur un semver éclaté entre passerelles, une prolifération de sondes qui masque un Doctor périmé, et des pairs silencieux qui n’ont jamais vu le même arbre npm -g. Sans marque-pages de rollback entre les étapes npm, launchd et répartiteur — et sans signal d’échec partagé — le roulant paraît vert pendant que les ratios dérivent.
Le remède est l’exploitation « ennuyeuse » : figer les preuves, monter de version avec intention, valider Doctor sur chaque hôte, fusionner les sondes, diffuser l’état rouge, et seulement ensuite ajuster les pourcentages canari en s’appuyant sur les guides de trafic cités plus haut.
Ce que les notes 2026.4.x suggèrent — sans marketing
Les journaux de 2026.4.x évoquent une gestion plus explicite des peers des plugins et des correctifs sur la résolution des liens registre lorsque des scopes privés réordonnent les tarballs, ainsi que des valeurs par défaut revues pour les assistants optionnels de génération d’images (chemins temporaires, indices GPU). Traitez ces points comme une liste de vérification : réinstallez sur chaque nœud et mesurez la latence disque sur vos hôtes clustervps plutôt que de présumer une parfaite équivalence entre miroirs.
Matrice de décision : fenêtre big-bang vs canari roulant
Choisissez la stratégie selon le nombre de passerelles que vous pouvez vider et la durée tolérable de builds mixtes par les locataires.
| Dimension | Fenêtre big-bang | Canari roulant | Note opérateur |
|---|---|---|---|
| Cohérence peer | Simple : tout bouge ensemble. | Plus exigeant : parité de lockfile à chaque saut. | Le roulant exige des règles d’arrêt explicites. |
| Rayon d’explosion | Toutes les passerelles rebondissent à la fois. | Un nœud porte le risque en premier. | À coupler avec une discipline stricte sur les ratios LB. |
| Signal Doctor | Un bandeau de maintenance unique. | Exige des sondes fusionnées pour éviter le faux vert. | N’élargissez pas tant que les sondes divergent. |
Quelle que soit l’option, archivez à côté de chaque point de retour le JSON des poids LB, les empreintes openclaw.lock et le condensé de la sonde composite. Les revues d’incident vont plus vite lorsque la ligne de tableur — et non la mémoire Slack — fait foi.
Ordre npm -g pour garder des graphes peer honnêtes
- Geler :
npm ls -g --depth=0,openclaw.lock, pondérations du répartiteur. - Noyau puis plugins :
openclaw@2026.4.xen premier, puis les paquets de plugins maison ; relancernpm ls -g --depth=1et échouer sur les doublons. - Redémarrage : ne relancer launchd qu’après un Doctor local vert (liste ci-dessous).
# Exemple — épinglez la version exacte autorisée par votre lockfile sudo npm install -g openclaw@2026.4.3 sudo npm install -g @openclaw/plugin-bundle@2026.4.3 /usr/local/bin/openclaw doctor --json | /usr/bin/tee /tmp/doctor.post-upgrade.json
Liste roulante et points de rollback explicites
Mode roulant : un nœud à la fois. Après chaque étape, vérifiez que la readiness fusionnée correspond au JSON de référence archivé.
- Vidage : retirer la charge LB de la cible. Rollback : restaurer le cliché des poids.
- Mise à niveau : enchaîner la séquence npm. Rollback : réinstaller le semver précédent depuis le cache.
- Doctor + redémarrage :
openclaw doctor --jsonpar tranche locataire ; redémarrer la passerelle ; Doctor à chaud. Rollback : build antérieur ; restaurer le lien symbolique skill si utilisé. - Fusion sonde : publier une readiness JSON unique (Doctor, file, digest). Rollback : retirer du LB si l’empreinte ≠ aux pairs.
- Élargir : augmenter les ratios seulement après accord vert des pairs. Rollback : poids + symlink ensemble.
- Nœud suivant : répéter ; évitez deux passerelles adjacentes sur des noyaux différents sans ratio tampon.
Fusionner les sondes d’abord, puis seulement déplacer le trafic
Exposez une URL de readiness dont le JSON agrège Doctor, instantanés de file et totaux digest ; si le semver sur disque ≠ openclaw.lock, échouez fermement même lorsque les webhooks semblent sains.
#!/usr/bin/env bash
set -euo pipefail
/usr/local/bin/openclaw doctor --json >/tmp/doctor.json
/usr/bin/curl -fsS --max-time 3 http://127.0.0.1:9099/v1/queue-snapshot -o /tmp/queue.json
/usr/bin/curl -fsS --max-time 3 http://127.0.0.1:9099/v1/webhook-digest -o /tmp/digest.json
/usr/bin/python3 - <<'PY'
import hashlib, json, pathlib
parts = [pathlib.Path(p).read_bytes() for p in ("/tmp/doctor.json","/tmp/queue.json","/tmp/digest.json")]
print(json.dumps({"ready_probe_sha256": hashlib.sha256(b"".join(parts)).hexdigest()}))
PY
Une divergence d’empreinte face aux pairs doit déclencher la même diffusion d’échec et, si vous l’avez câblé, un crochet lb freeze avant que l’automatisation n’élargisse les ratios.
FAQ
Plugins avant le noyau ? Uniquement si les notes de version l’exigent ; sinon les avertissements peer peuvent rester invisibles jusqu’au runtime.
Assistants image après 2026.4.x ? Anticipez une activité disque temporaire différente ou des indices d’ordonnancement GPU ; surveillez APFS pendant la première heure canari et recoupez la marge avec le guide affinité disque / verrous de build si des jobs batch partagent l’hôte.
Taille de grappe ? Trois Mac clustervps suffisent souvent pour les rôles stable, canari et témoin.
Parcourez les forfaits pour dimensionner les nœuds ; la base d’aide et l’accueil restent accessibles sans friction pour aligner l’équipe avant d’ouvrir une console.
Répétez les montées OpenClaw sur des Mac mini M4 dédiés
Avant d’enchaîner sur 2026.4.x, parcourez l’accueil, la aide et le parcours achat. Pour le contexte grappe déjà publié : skills canari, passerelles multi-AZ, Doctor locataires, DNS scindé, matrice rsync, Mosh vs SSH.