Files
Business/Business/Nate Corpus/2026-05-18_55-of-employers-regret-ai-driven.md
T

8.1 KiB

title, source, author, published, processed, slug, type, themes, frameworks, terminology
title source author published processed slug type themes frameworks terminology
55% работодателей сожалеют об ИИ-увольнениях: агенты хороши в задачах, плохи в работах https://natesnewsletter.substack.com/p/55-of-employers-regret-ai-driven Nate Jones (Nate's Substack) 2026-03-21 2026-05-18 55-of-employers-regret-ai-driven video
Agentic Workflow
Evals
Implementation Layer
Audit Trails
Contextual Stewardship
Task-versus-Job Gap
Evals
Agentic Workflow
Implementation Layer
Audit Trails
Forward Deployed Engineer
Harness

55% работодателей сожалеют об ИИ-увольнениях

Центральный тезис

Средняя продолжительность работы в ИТ — 18 месяцев–2 года. Средний запуск ИИ-агента — около 2 часов. Эти числа несопоставимы. Агенты хорошо справляются с задачами (tasks), но не умеют выполнять работу (jobs) — потому что не накапливают институциональный контекст. Чем мощнее агент, тем разрушительнее его «молчаливые» ошибки.

"A mediocre tool that fails obviously is annoying. A powerful tool that fails silently is dangerous." Посредственный инструмент, который ломается очевидно — раздражает. Мощный инструмент, который ломается незаметно — опасен.


Якорный кейс: Grigorev и продакшн-база

Инженер Алексей Григорьев запустил ИИ-агент (через Cursor). Агент уничтожил 1,9 млн строк данных студентов вместе с бэкапами. Технических ошибок не было — каждое действие было локально корректным. Агент просто не знал, что перед ним боевая инфраструктура, а не временная копия. Знание об этом различии существовало только в голове инженера.

Три новых исследования подтверждают: это паттерн, не случайность.


Ключевые фреймворки

Task-versus-Job Gap — Разрыв задача-работа

Два бенчмарка на одних и тех же моделях дали кардинально разные результаты. Причина: один тестировал задачи (дискретные, без контекста), другой — работу (с накопленным контекстом, организационными зависимостями). Агенты побеждают в первом, проваливаются во втором.

Contextual Stewardship — Контекстное стюардство

Новая роль человека в связке с агентами — не управление задачами, а хранение и передача контекста. Именно это умение рынок труда начинает оплачивать (Harvard, 62 млн работников). Лучшие люди должны писать Evals, а не выполнять рутину.

Три промпта для закрытия разрыва

# Название (EN) Назначение
1 Context gap audit Аудит того, что агент не знает о вашем контексте
2 Eval writer for non-engineers Написание Evals без навыков разработки
3 Decision documenter Фиксация логики решений, которую агент никогда не узнает сам

"The best tools we have for managing agent risk are human brains and human brains crafting evaluations. Not better prompts. Not bigger context windows." Лучший инструмент управления риском агента — человеческий мозг и Evals, которые он создаёт. Не лучшие промпты. Не большее контекстное окно.


Терминология

RU EN Примечание
Разрыв задача-работа Task-versus-job gap Центральный концепт статьи
Контекстное стюардство Contextual stewardship Новая роль человека рядом с агентом
Институциональный контекст Institutional context Знание, живущее только в головах людей
Стена вайб-кодинга Vibe coding wall Момент, где AI-разработка упирается в пределы промптинга
Аудит контекстного разрыва Context gap audit Промпт №1 для диагностики
Evals Evals Оценочные наборы; писать должны лучшие, не джуны
Audit Trails Audit trails Фиксация решений для передачи агентам
Agentic Workflow Agentic workflow Рабочий процесс с делегированием агентам
Implementation Layer Implementation layer Слой между моделью и реальным workflow

Что использовать для нашего портфеля

Как AI-интегратор и Implementation Layer:

  1. Контекстное стюардство как продукт. Клиент покупает не агента — он покупает систему передачи институционального контекста агентам. Это наша ценность: мы знаем, как описать «что живёт только в голове у инженера» в форме, понятной агенту. Это ближе к Forward Deployed Engineer, чем к вендору ПО.

  2. Evals как deliverable. Вместо того чтобы писать Evals силами джунов, предлагать клиенту услугу: «ваши лучшие эксперты + наш Harness → корпоративный eval-набор». Это защищает от тихих отказов агентов.

  3. Audit Trails как обязательный компонент. Кейс Григорьева показывает: отсутствие фиксации контекста решений = риск уничтожения данных. Каждый Agentic Workflow в нашем Implementation Layer должен включать decision log.

  4. PE-канал: фрейм «сожаление». 55% работодателей сожалеют — значит, у них есть болевая точка для разговора. Заход: «Вы уже попробовали агентов. Что пошло не так?» → диагностика контекстного разрыва → наш Implementation Layer.


Открытые вопросы

  • Какие конкретно из наших клиентов уже столкнулись с «молчаливыми» отказами агентов? Есть ли у нас кейсы, аналогичные Grigorev?
  • Как операционализировать «контекстное стюардство» в наш onboarding-процесс для новых клиентов?

Связанные заметки: Evals, Agentic Workflow, Implementation Layer, Audit Trails, Forward Deployed Engineer, Harness