Три операционных ловушки до первого зелёного AnalysisRun
Смешение ответственности Argo CD и Argo Rollouts ломает runbook: CD следит за Git, Rollouts — за шагами канарейки и webhook анализа. Вторая ловушка — «зоопарк» микроэндпоинтов: один возвращает 200, другой уже видит рост ошибок среза. Третья — наивные повторы без потолка при кратком отвале DNS или залипшем шлюзе, когда за балансировщиком стоят несколько Mac-узлов и очередь канареечного трафика.
- Размытая граница CD/Rollouts: правки в sync hook не заменяют контракт AnalysisRun и не дают merge метрик канарейки.
- Расщеплённые пробы: Rollouts читает одно тело за окно — дробите ответы, получите ложноположительные «зелёные» окна.
- Токен без overlap и retry без капа: ротация секрета обрывает половину измерений; неограниченный backoff множит нагрузку на шлюз OpenClaw.
Согласуйте шлюз с практиками merge логов и digest webhook из руководства по логам и webhook кластера OpenClaw, а профиль узла — с глубоким doctor и канареечными портами, чтобы канарейка не спотыкалась о дубликаты launchd.
Матрица: Argo CD и Argo Rollouts — где живёт webhook
Таблица фиксирует зону ответственности: CD не вызывает ваш endpoint канареечных метрик за каждый шаг AnalysisRun.
| Контур | Триггер | Webhook / HTTP | Связка с OpenClaw |
|---|---|---|---|
| Argo CD | Reconcile манифестов, уведомления о sync | Опциональные уведомления, не измерение канарейки | Полезен для GitOps, но не заменяет пробы канарейки |
| Argo Rollouts | Шаги canary, pause, promote, AnalysisRun | HTTP(S) webhook на каждое окно измерения | Шлюз OpenClaw агрегирует метрики и код вердикта |
| Многоузловой clustervps | LB распределяет канареечный срез по Mac | Один стабильный URL шлюза + sticky или leader | Координация с multi-AZ паттерном из шлюза и webhook в нескольких зонах |
Минимальные шаги интеграции AnalysisRun → OpenClaw
Порядок рассчитан на то, чтобы сначала зафиксировать контракт HTTP, затем — устойчивость к секретам и нагрузке; навыки канарейки на стороне агента см. в multi-AZ canary skills.
- Изоляция контроллеров: убедитесь, что Rollouts Controller видит ваш
Rollout, а Argo CD лишь отдаёт манифесты — не смешивайте измерения в CD hooks. - Endpoint шлюза: поднимите HTTPS на помеченном canary узле OpenClaw в пуле clustervps; в AnalysisTemplate укажите URL, заголовок
Authorization: Bearer …и таймаут окна строго короче SLA канарейки. - Merge проб в один JSON: внутри обработчика соберите здоровье шлюза, долю ошибок канареечного среза, задержку зависимостей и единый флаг
verdict; не разбрасывайте критерии по разным путям. - Токен с перекрытием: храните два действительных секрета при ротации (старый + новый), переключайте Rollouts только после ACK на шлюзе; снимайте старый через окно, равное максимальному интервалу AnalysisRun.
- Retry с потолком: на стороне Rollouts задайте экспоненциальный backoff, верхнюю границу попыток и джиттер; на шлюзе — rate limit по идентификатору rollout, чтобы «залипание» не било по всем Mac за LB.
- Эфир digest сбоев: при
4xx/5xxилиverdict=failпубликуйте нормализованный JSON в канал дежурств (корреляция сrollout, окно, узел, код upstream) по тому же принципу краткого широковещания, что и в материале про логи.
Сводный чек-лист шагов (перед promote)
- Контракт HTTP: один URL, один формат JSON, явные поля
verdictиreason. - Аутентификация: bearer в Rollouts + проверка на шлюзе; журнал отказов без утечки полного токена.
- Merge метрик: нет скрытых вторичных эндпоинтов, от которых зависит promote.
- Retry: заданы max attempts, jitter, таймауты; сторожевой алерт при исчерпании.
- Многоузловость: понятен выбор активного шлюза (leader/sticky) и поведение при drain узла.
- Уведомления: digest уходит в канал при любом неуспехе измерения или деградации
verdict.
Цифры и параметры, которые стоит зафиксировать в runbook
401 на стыке смены.Итог: канарейка Kubernetes и Mac-узлы дышат в одном ритме
Когда AnalysisRun бьёт в шлюз OpenClaw на пуле clustervps, выигрывает тот, кто заранее развёл CD и Rollouts, объединил пробы, перекрыл токены и ограничил retry. Тогда поэтапный выпуск в кластере и несколько Mac-узлов остаются согласованными: канареечный срез растёт только при честном verdict, а дежурные получают короткий digest вместо разрозненных логов.
Публичные тарифы и оформление узлов доступны без входа; технические детали доступа — в справочном центре.
Добавьте узлы clustervps под OpenClaw и поэтапный выпуск
Выделенные Mac mini M4 рядом с вашим трафиком: шлюз для AnalysisRun, merge проб и эфир digest без простоя канарейки. Связанные материалы: multi-AZ шлюз, логи и webhook, canary skills.