ingest: i-broke-down-anthropics-25-billion-leak-your-agent-is-missin
This commit is contained in:
+166
@@ -0,0 +1,166 @@
|
||||
---
|
||||
title: "Агентная индустриальная революция: что упускает твой агент"
|
||||
slug: i-broke-down-anthropics-25-billion-leak-your-agent-is-missin
|
||||
source: https://www.youtube.com/watch?v=FtCdYhspm7w
|
||||
published: unknown
|
||||
processed: 2026-05-18
|
||||
type: video
|
||||
themes:
|
||||
- "[[Agentic Workflow]]"
|
||||
- "[[Harness]]"
|
||||
- "[[Implementation Layer]]"
|
||||
- "[[Moat]]"
|
||||
frameworks:
|
||||
- "[[Six Layers of Agentic Capability]]"
|
||||
- "[[Conversion Stack]]"
|
||||
- "[[Swiss Cheese Model of Defense]]"
|
||||
- "[[TCLD Framework]]"
|
||||
- "[[Five Managerial Disciplines]]"
|
||||
- "[[Access-Meaning-Authority Framework]]"
|
||||
terminology:
|
||||
- "[[Judge Layer]]"
|
||||
- "[[Anticipatory Influence]]"
|
||||
- "[[Primitive Fluency]]"
|
||||
- "[[Vibe Coding]]"
|
||||
- "[[Cybernetic Development]]"
|
||||
- "[[Soul Trap]]"
|
||||
- "[[Tomorrow Test]]"
|
||||
- "[[J-Curve]]"
|
||||
---
|
||||
|
||||
## Тезисы
|
||||
|
||||
- **От «болтуна» к рабочей силе.** Q2 2026 — структурная точка перегиба: LLM-ы перестали быть автодополнением и стали автономной целеориентированной рабочей силой, встроенной в глубокую корпоративную инфраструктуру.
|
||||
- **Суверенность определяет [[Harness]], не модель.** Стратегическое преимущество — не в выборе «лучшей модели», а в построении архитектуры-обвязки: конвейеры данных, права на решения, петли обратной связи, превращающие институциональный замысел в машинно-исполнимое действие.
|
||||
- **Разрушение карьерной лестницы.** Найм на начальные позиции в крупных tech-компаниях упал >50% с 2019 г. ИИ поглотил «тренировочные ступени» (саммари, чистка данных, черновики). Результат: начальные роли требуют опыта, который эти же роли больше не дают.
|
||||
- **«Экономика узких мест» (Bottleneck Economy).** Ценность ИИ не распределяется равномерно — она концентрируется вокруг физической инфраструктуры (энергия, земля), стоимости доверия и способности интегрировать общие модели в конкретный организационный контекст. Это новый [[Moat]].
|
||||
- **Крах seat-based SaaS.** Поседельная лицензия ломается под агентами: коммерческая единица смещается от «пользователя» к «делегированной единице работы» (delegated work unit). Кто не переговорит условия до внедрения — потеряет рычаг.
|
||||
- **[[Cybernetic Development]] vs Vibe Coding.** Отрасль раскалывается: интуитивные прототиписты («vibe coders») vs «кибернетические разработчики», применяющие System 2 дисциплину (BDD/TDD) для управления генеративной мощью.
|
||||
- **[[Soul Trap]] — новый вид локина.** Прежние локины держались на файлах и записях. Персистентные агенты захватывают когнитивный отпечаток пользователя — паттерны мышления, приоритизации, принятия решений. Это принципиально иная зависимость.
|
||||
|
||||
---
|
||||
|
||||
## Терминология
|
||||
|
||||
| RU | EN | Определение |
|
||||
|---|---|---|
|
||||
| [[Harness\|Обвязка]] | [[Harness]] | Окружающая архитектура (конвейеры данных, конфигурация модели, воркфлоу, права решений), через которую институциональный замысел становится машинно-исполнимым действием |
|
||||
| [[Anticipatory Influence\|Упреждающее влияние]] | Anticipatory Influence | Структурирование среды принятия решений до того, как начнётся формальное обсуждение — через ранжирование, маршрутизацию, дефолты и пороги |
|
||||
| [[Judge Layer\|Слой-судья]] | Judge Layer | Независимый LLM-экземпляр, выступающий «менеджером» агента: верифицирует его действия на границе системы, предотвращает несанкционированные вызовы |
|
||||
| [[Agentic Workflow\|Агентный воркфлоу]] | [[Agentic Workflow]] | Итеративные многошаговые последовательности: агент рассуждает → действует → наблюдает результат → при необходимости откатывается |
|
||||
| [[Primitive Fluency\|Примитивная грамотность]] | Primitive Fluency | Способность специалиста понимать и манипулировать базовыми артефактами системы (файлы, git-состояния, права доступа), а не только высокоуровневым синтаксисом |
|
||||
| [[Vibe Coding]] | Vibe Coding | Генеративный стиль разработки: опора на интуицию LLM и сопоставление паттернов (System 1) — «пожелать» код в существование |
|
||||
| [[J-Curve]] | J-Curve | Провал производительности при «прикручивании» ИИ к нереформированному воркфлоу до того, как воркфлоу перестроен под инструмент |
|
||||
| [[Abstraction Tax\|Налог абстракции]] | Abstraction Tax | Скрытая цена удобных слоёв (GUI, визарды), которые блокируют агентам доступ к базовым примитивам системы |
|
||||
| [[Agent Context Bundle\|Контекстный пакет агента]] | Agent Context Bundle | Преассемблированный набор данных, который агент получает для конкретного задания — решает проблему «переоткрытия контекста» при каждом запуске |
|
||||
| [[Cybernetic Development\|Кибернетическая разработка]] | Cybernetic Development | Автоматизация, сопряжённая с квалифицированным управлением: генеративная мощь (System 1) + инженерная дисциплина BDD/TDD (System 2) |
|
||||
| [[Soul Trap\|Ловушка души]] | Soul Trap / Behavioral Lock-in | Локин нового типа: не файлы и записи, а когнитивный отпечаток пользователя — то, как он мыслит, приоритизирует и решает |
|
||||
| [[Tomorrow Test\|Тест завтра]] | Tomorrow Test | Эвристика безопасности ИИ: «Сделает ли это завтра труднее?» — заменяет жёсткие правила на отношенческий принцип |
|
||||
|
||||
---
|
||||
|
||||
## Фреймворки
|
||||
|
||||
### [[Six Layers of Agentic Capability]] — Шесть слоёв агентной готовности
|
||||
|
||||
Производственный агент должен пройти все шесть слоёв. Большинство ранних продуктов провалились на 3–6:
|
||||
|
||||
| Слой | Функция | Что ломается без него |
|
||||
|---|---|---|
|
||||
| Intent (Намерение) | Парсинг и валидация высокоуровневых целей в машинные ограничения | Семантический дрейф: агент делает не то |
|
||||
| Context (Контекст) | Персистентная память и состояние между запусками | Агент «забывает» 85% истории при каждом запуске |
|
||||
| Tool (Инструменты) | Интерфейс с внешним миром (API, SDK, MCP) | Агент умён, но «безрук» в легаси-среде |
|
||||
| Control (Управление) | Петля принятия решений, откат, триаж ошибок | Бесконечные циклы, дублирование действий |
|
||||
| [[Judge Layer\|Judge]] (Судья) | Независимая верификация действий на границе системы | Несанкционированные письма, нелегальные вызовы |
|
||||
| Responsibility (Ответственность) | Финансовый и юридический аудит-трейл автономных действий | Неизвестные расходы, неотслеживаемая ответственность |
|
||||
|
||||
### [[Conversion Stack]] — Стек конвертации
|
||||
|
||||
7-шаговый путь от данных к результатам:
|
||||
|
||||
> Данные и права доступа → Движки → Агенты → Воркфлоу → Суперкогниция → Петли обучения → Результаты
|
||||
|
||||
### [[Swiss Cheese Model of Defense]] — Швейцарский сыр обороны
|
||||
|
||||
Безопасность = слои защиты, каждый несовершенен, каждый с дырами. Аварии случаются, когда дыры выстраиваются в прямую. Пять губернаторов:
|
||||
- **Tool Governors** — песочницы, минимальные права
|
||||
- **Merge Governors** — линтинг, типы, тесты, проверки безопасности
|
||||
- **Release Governors** — стейджинг, канарейки, авто-откат
|
||||
- **Runtime Governors** — rate limits, таймауты, circuit breakers
|
||||
- **Learning Governors** — постмортемы без обвинений → новые тесты и гарды
|
||||
|
||||
### [[TCLD Framework]] — Аудит работы за 10 дней
|
||||
|
||||
Каждый рабочий элемент / встреча → одна из четырёх категорий:
|
||||
- **T**heater — видимо, но низкоценно
|
||||
- **C**ommodity — легко автоматизируется
|
||||
- **L**-On-the-Line — AI-рычаг уже работает
|
||||
- **D**urable — требует суждения, труднореплицируемо
|
||||
|
||||
### [[Five Managerial Disciplines]] — Пять управленческих дисциплин
|
||||
|
||||
**Specify → Instrument → Assign → Contest → Learn**
|
||||
(Специфицировать → Измерять → Назначить права → Оспаривать → Учиться)
|
||||
|
||||
### [[Access-Meaning-Authority Framework]] — AMА для агентных продуктов
|
||||
|
||||
Три обязательных слоя:
|
||||
- **Access** — вход в систему
|
||||
- **Meaning** — семантическое понимание действий
|
||||
- **Authority** — разрешение действовать
|
||||
|
||||
---
|
||||
|
||||
## Формулы и паттерны
|
||||
|
||||
**Компаундирование надёжности (Reliability Compounding):**
|
||||
> "Five primitives each at 99% uptime produce only 95% end-to-end reliability."
|
||||
> *Пять примитивов по 99% uptime дают лишь 95% сквозной надёжности.*
|
||||
|
||||
**Say/Do Ratio:**
|
||||
> "The gap between saying you will do something and actually doing it."
|
||||
> *Разрыв между «я сделаю» и фактическим выполнением — мера высокого agency.*
|
||||
|
||||
**Кибернетическая инверсия WIP:**
|
||||
> "In the pre-AI world, high WIP killed velocity. In the AI world, low WIP kills velocity."
|
||||
> *В доагентном мире высокий WIP убивал скорость. В агентном — низкий WIP убивает скорость.*
|
||||
|
||||
**Little's Law (агентная редакция):**
|
||||
> "Cycle Time = WIP / Throughput" — где WIP = количество фич, которые человек активно управляет (не кодирует, а *ревьюит/мерджит*).
|
||||
|
||||
**[[Tomorrow Test]] — Тест завтра:**
|
||||
> "Is this going to make tomorrow harder?"
|
||||
> *Сделает ли это завтра труднее?* — заменяет кодекс правил одним отношенческим вопросом.
|
||||
|
||||
**«Это вопрос навыка» (Skill Issue Reframing):**
|
||||
> "That's a skill issue." — рефрейминг внешних барьеров как устранимых пробелов в компетенциях.
|
||||
|
||||
---
|
||||
|
||||
## Открытые вопросы
|
||||
|
||||
- **Обрыв талантливых поколений.** Где следующее поколение экспертов будет нарабатывать суждение и [[Primitive Fluency\|примитивную грамотность]], если ИИ забирает «окопную работу» джунов?
|
||||
- **Разрыв спецификации и ценностей.** Кто имеет право определять, что оптимизирует система? Что происходит, когда спецификация кодирует неверные ценности?
|
||||
- **Агентная ответственность.** Кто несёт ответственность, когда агент самостоятельно подаёт документы или переводит деньги?
|
||||
- **Портируемость контекста.** Появятся ли организации по цифровым правам, которые обеспечат «intelligence portability» — право забрать свой когнитивный профиль при смене инструмента?
|
||||
- **Банкротство верификации.** Как организации не уйдут в «долговой дефолт» верификации по мере экспоненциального роста генерируемого кода при линейной человеческой пропускной способности ревью?
|
||||
|
||||
---
|
||||
|
||||
## Что использовать для нашего портфеля
|
||||
|
||||
**Как AI-интегратор / [[Implementation Layer]]:**
|
||||
|
||||
1. **[[Harness]] > модель** — главный аргумент в продажах. Клиент смотрит на бенчмарк модели, мы строим обвязку. Одна и та же модель показывает до 6× разницы в результатах в зависимости от дизайна harness-а. Это наш margin.
|
||||
|
||||
2. **[[Six Layers of Agentic Capability]] как чеклист внедрения.** Большинство клиентских «пилотов» закрывают только Intent + Tool. Мы предлагаем аудит: где у них дыры на слоях Control, Judge, Responsibility — и закрываем их. Это [[Implementation Fabric]].
|
||||
|
||||
3. **[[TCLD Framework]] как входной артефакт.** Перед любым агентным проектом — 10-дневный аудит работы команды клиента. Результат: карта того, что автоматизировать первым (Commodity), что усилить ИИ (On-the-Line), что защитить (Durable). Даёт обоснование ROI и снижает риск «театра».
|
||||
|
||||
4. **[[J-Curve]] — управление ожиданиями.** Клиент видит провал после внедрения и думает «ИИ не работает». Мы называем это по имени заранее и объясняем: дип — признак незавершённой конвертации воркфлоу, не провала технологии. Это позиционирует нас как консультанта, а не вендора.
|
||||
|
||||
5. **SaaS-переговоры как сервис.** Renewal-цикл 2026 — стратегический момент. Клиенты не знают, что переговаривать метр, кепы, пути доступа до того, как использование зафиксируется. Мы можем упаковать это в engagement.
|
||||
|
||||
6. **PE-канал:** тезис о «разрушении карьерной лестницы» и «экономике узких мест» — прямой вход в разговор с PE о портфельных компаниях, которые сидят на устаревших seat-based лицензиях и нереформированных воркфлоу. TCLD-аудит + [[Harness]]-дизайн = готовый тезис для value creation plan.
|
||||
|
||||
7. **[[Soul Trap]] — риск для клиента, возможность для нас.** Если клиент строит агентный продукт с поведенческим локином, мы должны помочь ему думать о portability policy до запуска, а не после. Это differentiator и доверие.
|
||||
+307
File diff suppressed because one or more lines are too long
Reference in New Issue
Block a user