Что такое корпоративный AI Harness и зачем он platform-команде
AI Harness (agent harness) — управляемый контур вокруг LLM: регламентированные инструменты, память задачи, проверки до и после действия, квоты и журнал, пригодный для аудита. Модель без harness даёт советы; с harness — выполняет цепочки: читает репозиторий, запускает тесты, открывает PR, но только в разрешённом sandbox. В enterprise-сценариях к harness почти всегда подключают выделенное железо Apple Silicon: Xcode, codesign, локальные CLI и стабильный APFS-кэш не переносятся на generic Linux runner без потери предсказуемости.
Три риска, из-за которых пилоты «умирают» на пути в prod
1. Shadow tools. Разработчики подключают MCP и скрипты в обход реестра. Секреты утекают в промпты, а комплаенс не видит, кто и когда вызвал production API.
2. Нет границы исполнения. Агент с правами на весь monorepo и хост без изоляции — один промпт до удаления ветки или смены секретов. Корпоративный стандарт: отдельный workspace, TTL сессии, deny-list на shell.
3. Разрыв между «агентом» и сборкой. LLM генерирует патч, а подпись и TestFlight живут на Mac, который не входит в тот же correlation ID. Откат превращается в расследование по трём консолям.
Матрица зрелости: от эксперимента к корпоративному контуру
| Уровень | Контур | Аудит / политики | Исполнение |
|---|---|---|---|
| L0 — Чат | Ручной copy-paste | Нет trail | Локальная машина |
| L1 — Скрипт | Один агент + API | Логи в файле | Shared runner |
| L2 — Harness | Реестр tools, OPA | Immutable audit | Изолированный workspace |
| L3 — Enterprise | Multi-tenant, SLA | SOC2-ready отчёты | Mac mini M4 на clustervps |
Технические пределы и целевые SLO для production
Ориентиры ниже — для согласования с SRE и InfoSec; точные цифры зависят от модели и размера репозитория, но порядок величин устойчив при rollout harness на десятки команд.
| Метрика | Цель в prod | Комментарий |
|---|---|---|
| p95 latency tool-call | < 8 с (без LLM) | Таймауты и circuit breaker на каждый tool |
| Доля задач с human-in-the-loop | 100 % до prod-deploy | Авто-merge только в sandbox-ветках |
| Успешность проверок (gates) | > 95 % на пилоте | Линтер, unit, SAST до merge |
| Ёмкость Mac-узла | SSD > 20 % свободно | M4 / 24 ГБ / 512 ГБ: очередь Xcode + водяной знак APFS |
Семь шагов: внедрить AI Harness в enterprise за 60–90 дней
- Шаг 1 — Каталог сценариев. Выберите 3–5 задач с измеримым ROI: миграция тестов, обновление зависимостей, генерация release notes — не «всё подряд».
- Шаг 2 — Реестр инструментов. Whitelist MCP/API; запрет произвольного shell; версионирование контрактов tool schema.
- Шаг 3 — Политики и секреты. Vault или аналог; секреты не в промпт; маскирование PII в логах harness.
- Шаг 4 — Sandbox исполнения. Отдельный git worktree, сеть egress по списку, лимит CPU/RAM на сессию агента.
- Шаг 5 — Mac-контур. Xcode, Fastlane и codesign на арендованных Mac mini M4 по SSH; один correlation ID на задачу агента и сборку.
- Шаг 6 — Наблюдаемость. Единый digest: tool-call, gate failures, хвост логов Mac — в webhook для on-call.
- Шаг 7 — Масштаб по очереди. Добавляйте узлы clustervps по глубине очереди, а не закупайте ЦОД «под эксперимент с LLM».
Цитируемые ориентиры для архитекторов и InfoSec
- Глубина контекста: для mono-repo > 500k LOC используйте индексацию и retrieval вместо «всего репо в промпт» — иначе растут стоимость и риск утечки фрагментов чужого кода.
- Audit trail: каждый tool-call с actor, tenant, hash промпта (без сырого PII) и результатом gate — минимум для расследований уровня SOC2.
- Ёмкость Apple: на M4 с 24 ГБ считайте не только параллель симуляторов, но и пиковую запись DerivedData; при < 20 % свободного SSD очередь агента + Xcode деградирует синхронно.
Итог: harness в policy layer, исполнение — на выделенном Mac
Корпоративный AI Harness в 2026 — это не «ещё один Copilot», а платформенный слой: кто что может вызвать, где исполняется код и как откатывается цепочка. Без изолированного Apple Silicon вы теряете половину mobile и desktop-контура — агент «заканчивает» на патче, а релиз всё равно ждёт Mac.
Начните с одного L2-пилота на выделенном Mac mini M4 clustervps: помесячная оплата, SSH/VNC, регионы под RTT команды. После стабильных gates и audit trail масштабируйте узлы по очереди сборок и агентных сессий — быстрее и дешевле, чем разовая закупка железа под непредсказуемый спрос LLM.
Запустите корпоративный пилот на Mac mini M4 уже в этом месяце
Выделенный узел под агентные сессии, Xcode и codesign: без оверхеда виртуализации, с SSH/VNC и помесячным масштабированием. Оформите аренду — и привяжите harness к реальному исполнению, а не к демо в чате.