ingest: i-broke-down-anthropics-25-billion-leak-your-agent-is-missin

2026-05-18 14:03:40 +03:00
parent 6ef0923f33
commit f7ec7e043c
2 changed files with 473 additions and 0 deletions
@@ -0,0 +1,166 @@
+---
+title: "Агентная индустриальная революция: что упускает твой агент"
+slug: i-broke-down-anthropics-25-billion-leak-your-agent-is-missin
+source: https://www.youtube.com/watch?v=FtCdYhspm7w
+published: unknown
+processed: 2026-05-18
+type: video
+themes:
+  - "[[Agentic Workflow]]"
+  - "[[Harness]]"
+  - "[[Implementation Layer]]"
+  - "[[Moat]]"
+frameworks:
+  - "[[Six Layers of Agentic Capability]]"
+  - "[[Conversion Stack]]"
+  - "[[Swiss Cheese Model of Defense]]"
+  - "[[TCLD Framework]]"
+  - "[[Five Managerial Disciplines]]"
+  - "[[Access-Meaning-Authority Framework]]"
+terminology:
+  - "[[Judge Layer]]"
+  - "[[Anticipatory Influence]]"
+  - "[[Primitive Fluency]]"
+  - "[[Vibe Coding]]"
+  - "[[Cybernetic Development]]"
+  - "[[Soul Trap]]"
+  - "[[Tomorrow Test]]"
+  - "[[J-Curve]]"
+---
+
+## Тезисы
+
+- **От «болтуна» к рабочей силе.** Q2 2026 — структурная точка перегиба: LLM-ы перестали быть автодополнением и стали автономной целеориентированной рабочей силой, встроенной в глубокую корпоративную инфраструктуру.
+- **Суверенность определяет [[Harness]], не модель.** Стратегическое преимущество — не в выборе «лучшей модели», а в построении архитектуры-обвязки: конвейеры данных, права на решения, петли обратной связи, превращающие институциональный замысел в машинно-исполнимое действие.
+- **Разрушение карьерной лестницы.** Найм на начальные позиции в крупных tech-компаниях упал >50% с 2019 г. ИИ поглотил «тренировочные ступени» (саммари, чистка данных, черновики). Результат: начальные роли требуют опыта, который эти же роли больше не дают.
+- **«Экономика узких мест» (Bottleneck Economy).** Ценность ИИ не распределяется равномерно — она концентрируется вокруг физической инфраструктуры (энергия, земля), стоимости доверия и способности интегрировать общие модели в конкретный организационный контекст. Это новый [[Moat]].
+- **Крах seat-based SaaS.** Поседельная лицензия ломается под агентами: коммерческая единица смещается от «пользователя» к «делегированной единице работы» (delegated work unit). Кто не переговорит условия до внедрения — потеряет рычаг.
+- **[[Cybernetic Development]] vs Vibe Coding.** Отрасль раскалывается: интуитивные прототиписты («vibe coders») vs «кибернетические разработчики», применяющие System 2 дисциплину (BDD/TDD) для управления генеративной мощью.
+- **[[Soul Trap]] — новый вид локина.** Прежние локины держались на файлах и записях. Персистентные агенты захватывают когнитивный отпечаток пользователя — паттерны мышления, приоритизации, принятия решений. Это принципиально иная зависимость.
+
+---
+
+## Терминология
+
+| RU | EN | Определение |
+|---|---|---|
+| [[Harness\|Обвязка]] | [[Harness]] | Окружающая архитектура (конвейеры данных, конфигурация модели, воркфлоу, права решений), через которую институциональный замысел становится машинно-исполнимым действием |
+| [[Anticipatory Influence\|Упреждающее влияние]] | Anticipatory Influence | Структурирование среды принятия решений до того, как начнётся формальное обсуждение — через ранжирование, маршрутизацию, дефолты и пороги |
+| [[Judge Layer\|Слой-судья]] | Judge Layer | Независимый LLM-экземпляр, выступающий «менеджером» агента: верифицирует его действия на границе системы, предотвращает несанкционированные вызовы |
+| [[Agentic Workflow\|Агентный воркфлоу]] | [[Agentic Workflow]] | Итеративные многошаговые последовательности: агент рассуждает → действует → наблюдает результат → при необходимости откатывается |
+| [[Primitive Fluency\|Примитивная грамотность]] | Primitive Fluency | Способность специалиста понимать и манипулировать базовыми артефактами системы (файлы, git-состояния, права доступа), а не только высокоуровневым синтаксисом |
+| [[Vibe Coding]] | Vibe Coding | Генеративный стиль разработки: опора на интуицию LLM и сопоставление паттернов (System 1) — «пожелать» код в существование |
+| [[J-Curve]] | J-Curve | Провал производительности при «прикручивании» ИИ к нереформированному воркфлоу до того, как воркфлоу перестроен под инструмент |
+| [[Abstraction Tax\|Налог абстракции]] | Abstraction Tax | Скрытая цена удобных слоёв (GUI, визарды), которые блокируют агентам доступ к базовым примитивам системы |
+| [[Agent Context Bundle\|Контекстный пакет агента]] | Agent Context Bundle | Преассемблированный набор данных, который агент получает для конкретного задания — решает проблему «переоткрытия контекста» при каждом запуске |
+| [[Cybernetic Development\|Кибернетическая разработка]] | Cybernetic Development | Автоматизация, сопряжённая с квалифицированным управлением: генеративная мощь (System 1) + инженерная дисциплина BDD/TDD (System 2) |
+| [[Soul Trap\|Ловушка души]] | Soul Trap / Behavioral Lock-in | Локин нового типа: не файлы и записи, а когнитивный отпечаток пользователя — то, как он мыслит, приоритизирует и решает |
+| [[Tomorrow Test\|Тест завтра]] | Tomorrow Test | Эвристика безопасности ИИ: «Сделает ли это завтра труднее?» — заменяет жёсткие правила на отношенческий принцип |
+
+---
+
+## Фреймворки
+
+### [[Six Layers of Agentic Capability]] — Шесть слоёв агентной готовности
+
+Производственный агент должен пройти все шесть слоёв. Большинство ранних продуктов провалились на 3–6:
+
+| Слой | Функция | Что ломается без него |
+|---|---|---|
+| Intent (Намерение) | Парсинг и валидация высокоуровневых целей в машинные ограничения | Семантический дрейф: агент делает не то |
+| Context (Контекст) | Персистентная память и состояние между запусками | Агент «забывает» 85% истории при каждом запуске |
+| Tool (Инструменты) | Интерфейс с внешним миром (API, SDK, MCP) | Агент умён, но «безрук» в легаси-среде |
+| Control (Управление) | Петля принятия решений, откат, триаж ошибок | Бесконечные циклы, дублирование действий |
+| [[Judge Layer\|Judge]] (Судья) | Независимая верификация действий на границе системы | Несанкционированные письма, нелегальные вызовы |
+| Responsibility (Ответственность) | Финансовый и юридический аудит-трейл автономных действий | Неизвестные расходы, неотслеживаемая ответственность |
+
+### [[Conversion Stack]] — Стек конвертации
+
+7-шаговый путь от данных к результатам:
+
+> Данные и права доступа → Движки → Агенты → Воркфлоу → Суперкогниция → Петли обучения → Результаты
+
+### [[Swiss Cheese Model of Defense]] — Швейцарский сыр обороны
+
+Безопасность = слои защиты, каждый несовершенен, каждый с дырами. Аварии случаются, когда дыры выстраиваются в прямую. Пять губернаторов:
+- **Tool Governors** — песочницы, минимальные права
+- **Merge Governors** — линтинг, типы, тесты, проверки безопасности
+- **Release Governors** — стейджинг, канарейки, авто-откат
+- **Runtime Governors** — rate limits, таймауты, circuit breakers
+- **Learning Governors** — постмортемы без обвинений → новые тесты и гарды
+
+### [[TCLD Framework]] — Аудит работы за 10 дней
+
+Каждый рабочий элемент / встреча → одна из четырёх категорий:
+- **T**heater — видимо, но низкоценно
+- **C**ommodity — легко автоматизируется
+- **L**-On-the-Line — AI-рычаг уже работает
+- **D**urable — требует суждения, труднореплицируемо
+
+### [[Five Managerial Disciplines]] — Пять управленческих дисциплин
+
+**Specify → Instrument → Assign → Contest → Learn**
+(Специфицировать → Измерять → Назначить права → Оспаривать → Учиться)
+
+### [[Access-Meaning-Authority Framework]] — AMА для агентных продуктов
+
+Три обязательных слоя:
+- **Access** — вход в систему
+- **Meaning** — семантическое понимание действий
+- **Authority** — разрешение действовать
+
+---
+
+## Формулы и паттерны
+
+**Компаундирование надёжности (Reliability Compounding):**
+> "Five primitives each at 99% uptime produce only 95% end-to-end reliability."
+> *Пять примитивов по 99% uptime дают лишь 95% сквозной надёжности.*
+
+**Say/Do Ratio:**
+> "The gap between saying you will do something and actually doing it."
+> *Разрыв между «я сделаю» и фактическим выполнением — мера высокого agency.*
+
+**Кибернетическая инверсия WIP:**
+> "In the pre-AI world, high WIP killed velocity. In the AI world, low WIP kills velocity."
+> *В доагентном мире высокий WIP убивал скорость. В агентном — низкий WIP убивает скорость.*
+
+**Little's Law (агентная редакция):**
+> "Cycle Time = WIP / Throughput" — где WIP = количество фич, которые человек активно управляет (не кодирует, а *ревьюит/мерджит*).
+
+**[[Tomorrow Test]] — Тест завтра:**
+> "Is this going to make tomorrow harder?"
+> *Сделает ли это завтра труднее?* — заменяет кодекс правил одним отношенческим вопросом.
+
+**«Это вопрос навыка» (Skill Issue Reframing):**
+> "That's a skill issue." — рефрейминг внешних барьеров как устранимых пробелов в компетенциях.
+
+---
+
+## Открытые вопросы
+
+- **Обрыв талантливых поколений.** Где следующее поколение экспертов будет нарабатывать суждение и [[Primitive Fluency\|примитивную грамотность]], если ИИ забирает «окопную работу» джунов?
+- **Разрыв спецификации и ценностей.** Кто имеет право определять, что оптимизирует система? Что происходит, когда спецификация кодирует неверные ценности?
+- **Агентная ответственность.** Кто несёт ответственность, когда агент самостоятельно подаёт документы или переводит деньги?
+- **Портируемость контекста.** Появятся ли организации по цифровым правам, которые обеспечат «intelligence portability» — право забрать свой когнитивный профиль при смене инструмента?
+- **Банкротство верификации.** Как организации не уйдут в «долговой дефолт» верификации по мере экспоненциального роста генерируемого кода при линейной человеческой пропускной способности ревью?
+
+---
+
+## Что использовать для нашего портфеля
+
+**Как AI-интегратор / [[Implementation Layer]]:**
+
+1. **[[Harness]] > модель** — главный аргумент в продажах. Клиент смотрит на бенчмарк модели, мы строим обвязку. Одна и та же модель показывает до 6× разницы в результатах в зависимости от дизайна harness-а. Это наш margin.
+
+2. **[[Six Layers of Agentic Capability]] как чеклист внедрения.** Большинство клиентских «пилотов» закрывают только Intent + Tool. Мы предлагаем аудит: где у них дыры на слоях Control, Judge, Responsibility — и закрываем их. Это [[Implementation Fabric]].
+
+3. **[[TCLD Framework]] как входной артефакт.** Перед любым агентным проектом — 10-дневный аудит работы команды клиента. Результат: карта того, что автоматизировать первым (Commodity), что усилить ИИ (On-the-Line), что защитить (Durable). Даёт обоснование ROI и снижает риск «театра».
+
+4. **[[J-Curve]] — управление ожиданиями.** Клиент видит провал после внедрения и думает «ИИ не работает». Мы называем это по имени заранее и объясняем: дип — признак незавершённой конвертации воркфлоу, не провала технологии. Это позиционирует нас как консультанта, а не вендора.
+
+5. **SaaS-переговоры как сервис.** Renewal-цикл 2026 — стратегический момент. Клиенты не знают, что переговаривать метр, кепы, пути доступа до того, как использование зафиксируется. Мы можем упаковать это в engagement.
+
+6. **PE-канал:** тезис о «разрушении карьерной лестницы» и «экономике узких мест» — прямой вход в разговор с PE о портфельных компаниях, которые сидят на устаревших seat-based лицензиях и нереформированных воркфлоу. TCLD-аудит + [[Harness]]-дизайн = готовый тезис для value creation plan.
+
+7. **[[Soul Trap]] — риск для клиента, возможность для нас.** Если клиент строит агентный продукт с поведенческим локином, мы должны помочь ему думать о portability policy до запуска, а не после. Это differentiator и доверие.