ingest: i-broke-down-anthropics-25-billion-leak-your-agent-is-missin

This commit is contained in:
2026-05-18 14:03:40 +03:00
parent 6ef0923f33
commit f7ec7e043c
2 changed files with 473 additions and 0 deletions
@@ -0,0 +1,166 @@
---
title: "Агентная индустриальная революция: что упускает твой агент"
slug: i-broke-down-anthropics-25-billion-leak-your-agent-is-missin
source: https://www.youtube.com/watch?v=FtCdYhspm7w
published: unknown
processed: 2026-05-18
type: video
themes:
- "[[Agentic Workflow]]"
- "[[Harness]]"
- "[[Implementation Layer]]"
- "[[Moat]]"
frameworks:
- "[[Six Layers of Agentic Capability]]"
- "[[Conversion Stack]]"
- "[[Swiss Cheese Model of Defense]]"
- "[[TCLD Framework]]"
- "[[Five Managerial Disciplines]]"
- "[[Access-Meaning-Authority Framework]]"
terminology:
- "[[Judge Layer]]"
- "[[Anticipatory Influence]]"
- "[[Primitive Fluency]]"
- "[[Vibe Coding]]"
- "[[Cybernetic Development]]"
- "[[Soul Trap]]"
- "[[Tomorrow Test]]"
- "[[J-Curve]]"
---
## Тезисы
- **От «болтуна» к рабочей силе.** Q2 2026 — структурная точка перегиба: LLM-ы перестали быть автодополнением и стали автономной целеориентированной рабочей силой, встроенной в глубокую корпоративную инфраструктуру.
- **Суверенность определяет [[Harness]], не модель.** Стратегическое преимущество — не в выборе «лучшей модели», а в построении архитектуры-обвязки: конвейеры данных, права на решения, петли обратной связи, превращающие институциональный замысел в машинно-исполнимое действие.
- **Разрушение карьерной лестницы.** Найм на начальные позиции в крупных tech-компаниях упал >50% с 2019 г. ИИ поглотил «тренировочные ступени» (саммари, чистка данных, черновики). Результат: начальные роли требуют опыта, который эти же роли больше не дают.
- **«Экономика узких мест» (Bottleneck Economy).** Ценность ИИ не распределяется равномерно — она концентрируется вокруг физической инфраструктуры (энергия, земля), стоимости доверия и способности интегрировать общие модели в конкретный организационный контекст. Это новый [[Moat]].
- **Крах seat-based SaaS.** Поседельная лицензия ломается под агентами: коммерческая единица смещается от «пользователя» к «делегированной единице работы» (delegated work unit). Кто не переговорит условия до внедрения — потеряет рычаг.
- **[[Cybernetic Development]] vs Vibe Coding.** Отрасль раскалывается: интуитивные прототиписты («vibe coders») vs «кибернетические разработчики», применяющие System 2 дисциплину (BDD/TDD) для управления генеративной мощью.
- **[[Soul Trap]] — новый вид локина.** Прежние локины держались на файлах и записях. Персистентные агенты захватывают когнитивный отпечаток пользователя — паттерны мышления, приоритизации, принятия решений. Это принципиально иная зависимость.
---
## Терминология
| RU | EN | Определение |
|---|---|---|
| [[Harness\|Обвязка]] | [[Harness]] | Окружающая архитектура (конвейеры данных, конфигурация модели, воркфлоу, права решений), через которую институциональный замысел становится машинно-исполнимым действием |
| [[Anticipatory Influence\|Упреждающее влияние]] | Anticipatory Influence | Структурирование среды принятия решений до того, как начнётся формальное обсуждение — через ранжирование, маршрутизацию, дефолты и пороги |
| [[Judge Layer\|Слой-судья]] | Judge Layer | Независимый LLM-экземпляр, выступающий «менеджером» агента: верифицирует его действия на границе системы, предотвращает несанкционированные вызовы |
| [[Agentic Workflow\|Агентный воркфлоу]] | [[Agentic Workflow]] | Итеративные многошаговые последовательности: агент рассуждает → действует → наблюдает результат → при необходимости откатывается |
| [[Primitive Fluency\|Примитивная грамотность]] | Primitive Fluency | Способность специалиста понимать и манипулировать базовыми артефактами системы (файлы, git-состояния, права доступа), а не только высокоуровневым синтаксисом |
| [[Vibe Coding]] | Vibe Coding | Генеративный стиль разработки: опора на интуицию LLM и сопоставление паттернов (System 1) — «пожелать» код в существование |
| [[J-Curve]] | J-Curve | Провал производительности при «прикручивании» ИИ к нереформированному воркфлоу до того, как воркфлоу перестроен под инструмент |
| [[Abstraction Tax\|Налог абстракции]] | Abstraction Tax | Скрытая цена удобных слоёв (GUI, визарды), которые блокируют агентам доступ к базовым примитивам системы |
| [[Agent Context Bundle\|Контекстный пакет агента]] | Agent Context Bundle | Преассемблированный набор данных, который агент получает для конкретного задания — решает проблему «переоткрытия контекста» при каждом запуске |
| [[Cybernetic Development\|Кибернетическая разработка]] | Cybernetic Development | Автоматизация, сопряжённая с квалифицированным управлением: генеративная мощь (System 1) + инженерная дисциплина BDD/TDD (System 2) |
| [[Soul Trap\|Ловушка души]] | Soul Trap / Behavioral Lock-in | Локин нового типа: не файлы и записи, а когнитивный отпечаток пользователя — то, как он мыслит, приоритизирует и решает |
| [[Tomorrow Test\|Тест завтра]] | Tomorrow Test | Эвристика безопасности ИИ: «Сделает ли это завтра труднее?» — заменяет жёсткие правила на отношенческий принцип |
---
## Фреймворки
### [[Six Layers of Agentic Capability]] — Шесть слоёв агентной готовности
Производственный агент должен пройти все шесть слоёв. Большинство ранних продуктов провалились на 3–6:
| Слой | Функция | Что ломается без него |
|---|---|---|
| Intent (Намерение) | Парсинг и валидация высокоуровневых целей в машинные ограничения | Семантический дрейф: агент делает не то |
| Context (Контекст) | Персистентная память и состояние между запусками | Агент «забывает» 85% истории при каждом запуске |
| Tool (Инструменты) | Интерфейс с внешним миром (API, SDK, MCP) | Агент умён, но «безрук» в легаси-среде |
| Control (Управление) | Петля принятия решений, откат, триаж ошибок | Бесконечные циклы, дублирование действий |
| [[Judge Layer\|Judge]] (Судья) | Независимая верификация действий на границе системы | Несанкционированные письма, нелегальные вызовы |
| Responsibility (Ответственность) | Финансовый и юридический аудит-трейл автономных действий | Неизвестные расходы, неотслеживаемая ответственность |
### [[Conversion Stack]] — Стек конвертации
7-шаговый путь от данных к результатам:
> Данные и права доступа → Движки → Агенты → Воркфлоу → Суперкогниция → Петли обучения → Результаты
### [[Swiss Cheese Model of Defense]] — Швейцарский сыр обороны
Безопасность = слои защиты, каждый несовершенен, каждый с дырами. Аварии случаются, когда дыры выстраиваются в прямую. Пять губернаторов:
- **Tool Governors** — песочницы, минимальные права
- **Merge Governors** — линтинг, типы, тесты, проверки безопасности
- **Release Governors** — стейджинг, канарейки, авто-откат
- **Runtime Governors** — rate limits, таймауты, circuit breakers
- **Learning Governors** — постмортемы без обвинений → новые тесты и гарды
### [[TCLD Framework]] — Аудит работы за 10 дней
Каждый рабочий элемент / встреча → одна из четырёх категорий:
- **T**heater — видимо, но низкоценно
- **C**ommodity — легко автоматизируется
- **L**-On-the-Line — AI-рычаг уже работает
- **D**urable — требует суждения, труднореплицируемо
### [[Five Managerial Disciplines]] — Пять управленческих дисциплин
**Specify → Instrument → Assign → Contest → Learn**
(Специфицировать → Измерять → Назначить права → Оспаривать → Учиться)
### [[Access-Meaning-Authority Framework]] — AMА для агентных продуктов
Три обязательных слоя:
- **Access** — вход в систему
- **Meaning** — семантическое понимание действий
- **Authority** — разрешение действовать
---
## Формулы и паттерны
**Компаундирование надёжности (Reliability Compounding):**
> "Five primitives each at 99% uptime produce only 95% end-to-end reliability."
> *Пять примитивов по 99% uptime дают лишь 95% сквозной надёжности.*
**Say/Do Ratio:**
> "The gap between saying you will do something and actually doing it."
> *Разрыв между «я сделаю» и фактическим выполнением — мера высокого agency.*
**Кибернетическая инверсия WIP:**
> "In the pre-AI world, high WIP killed velocity. In the AI world, low WIP kills velocity."
> *В доагентном мире высокий WIP убивал скорость. В агентном — низкий WIP убивает скорость.*
**Little's Law (агентная редакция):**
> "Cycle Time = WIP / Throughput" — где WIP = количество фич, которые человек активно управляет (не кодирует, а *ревьюит/мерджит*).
**[[Tomorrow Test]] — Тест завтра:**
> "Is this going to make tomorrow harder?"
> *Сделает ли это завтра труднее?* — заменяет кодекс правил одним отношенческим вопросом.
**«Это вопрос навыка» (Skill Issue Reframing):**
> "That's a skill issue." — рефрейминг внешних барьеров как устранимых пробелов в компетенциях.
---
## Открытые вопросы
- **Обрыв талантливых поколений.** Где следующее поколение экспертов будет нарабатывать суждение и [[Primitive Fluency\|примитивную грамотность]], если ИИ забирает «окопную работу» джунов?
- **Разрыв спецификации и ценностей.** Кто имеет право определять, что оптимизирует система? Что происходит, когда спецификация кодирует неверные ценности?
- **Агентная ответственность.** Кто несёт ответственность, когда агент самостоятельно подаёт документы или переводит деньги?
- **Портируемость контекста.** Появятся ли организации по цифровым правам, которые обеспечат «intelligence portability» — право забрать свой когнитивный профиль при смене инструмента?
- **Банкротство верификации.** Как организации не уйдут в «долговой дефолт» верификации по мере экспоненциального роста генерируемого кода при линейной человеческой пропускной способности ревью?
---
## Что использовать для нашего портфеля
**Как AI-интегратор / [[Implementation Layer]]:**
1. **[[Harness]] > модель** — главный аргумент в продажах. Клиент смотрит на бенчмарк модели, мы строим обвязку. Одна и та же модель показывает до 6× разницы в результатах в зависимости от дизайна harness-а. Это наш margin.
2. **[[Six Layers of Agentic Capability]] как чеклист внедрения.** Большинство клиентских «пилотов» закрывают только Intent + Tool. Мы предлагаем аудит: где у них дыры на слоях Control, Judge, Responsibility — и закрываем их. Это [[Implementation Fabric]].
3. **[[TCLD Framework]] как входной артефакт.** Перед любым агентным проектом — 10-дневный аудит работы команды клиента. Результат: карта того, что автоматизировать первым (Commodity), что усилить ИИ (On-the-Line), что защитить (Durable). Даёт обоснование ROI и снижает риск «театра».
4. **[[J-Curve]] — управление ожиданиями.** Клиент видит провал после внедрения и думает «ИИ не работает». Мы называем это по имени заранее и объясняем: дип — признак незавершённой конвертации воркфлоу, не провала технологии. Это позиционирует нас как консультанта, а не вендора.
5. **SaaS-переговоры как сервис.** Renewal-цикл 2026 — стратегический момент. Клиенты не знают, что переговаривать метр, кепы, пути доступа до того, как использование зафиксируется. Мы можем упаковать это в engagement.
6. **PE-канал:** тезис о «разрушении карьерной лестницы» и «экономике узких мест» — прямой вход в разговор с PE о портфельных компаниях, которые сидят на устаревших seat-based лицензиях и нереформированных воркфлоу. TCLD-аудит + [[Harness]]-дизайн = готовый тезис для value creation plan.
7. **[[Soul Trap]] — риск для клиента, возможность для нас.** Если клиент строит агентный продукт с поведенческим локином, мы должны помочь ему думать о portability policy до запуска, а не после. Это differentiator и доверие.
File diff suppressed because one or more lines are too long