ingest: anthropic-and-openai-just-admitted-the-model-isnt-enough

2026-05-18 13:57:16 +03:00
parent e16857c562
commit 6ef0923f33
2 changed files with 491 additions and 0 deletions
@@ -0,0 +1,178 @@
+---
+slug: anthropic-and-openai-just-admitted-the-model-isnt-enough
+type: video
+source: https://www.youtube.com/watch?v=EpJ0CjTJSag
+date_published: unknown
+date_processed: 2026-05-18
+themes:
+  - "[[Harness]]"
+  - "[[Agentic Workflow]]"
+  - "[[Implementation Layer]]"
+  - "[[Moat]]"
+  - "[[Workflow Completion]]"
+frameworks:
+  - "[[Six Layers of Agentic Capability]]"
+  - "[[Conversion Stack]]"
+  - "[[TCLD Framework]]"
+  - "[[Swiss Cheese Model of Defense]]"
+  - "[[Five Managerial Disciplines]]"
+  - "[[Access-Meaning-Authority Framework]]"
+terminology:
+  - "[[Harness]]"
+  - "[[Anticipatory Influence]]"
+  - "[[Judge Layer]]"
+  - "[[Primitive Fluency]]"
+  - "[[Vibe Coding]]"
+  - "[[J-Curve]]"
+  - "[[Abstraction Tax]]"
+  - "[[Agent Context Bundle]]"
+  - "[[Cybernetic Development]]"
+  - "[[Soul Trap]]"
+---
+
+# Anthropic и OpenAI признали: модель — недостаточно
+
+## Главные тезисы
+
+- **Конец эры «болтушки»**: Q2 2026 — структурный переломный момент. ИИ перестал быть автодополнением; он стал промышленной рабочей силой автономных агентов, встроенных в инфраструктуру предприятий.
+- **Суверенное предприятие зависит от [[Harness]]**: конкурентное преимущество сместилось с выбора «лучшей модели» на построение суверенной архитектуры — [[Harness]], — которая переводит институциональный замысел в машинно-исполняемые действия.
+- **Крах карьерной лестницы**: найм на позиции начального уровня в крупных tech-компаниях упал более чем на 50% с 2019 года. ИИ вытеснил «тренировочные ступени» — рутинные задачи, на которых учились джуниоры.
+- **[[Moat]] сместился в bottleneck-экономику**: ценность ИИ не распределяется равномерно. Она концентрируется вокруг физической инфраструктуры (энергия / земля), стоимости доверия и способности интегрировать модели в конкретный операционный контекст.
+- **Смерть посадочной модели SaaS**: тарификация за «место» (seat-based) разрушается — агенты заменяют человеческие «места». Ценовая логика мигрирует к единицам делегированной работы (delegated work units).
+- **Cybernetic Development vs Vibe Coding**: отрасль разделяется на [[Vibe Coding]] (интуиция + паттерн-матчинг LLM) и [[Cybernetic Development]] — System 2-инженерию с BDD/TDD, которая управляет генеративной мощью.
+- **[[Soul Trap]] — поведенческий lock-in**: в отличие от прежних форм зависимости (файлы, записи), постоянные агенты захватывают когнитивный отпечаток пользователя — паттерны мышления, приоритизации и принятия решений.
+
+---
+
+## Терминология
+
+| RU | EN | Определение |
+|---|---|---|
+| [[Harness]] | Harness | Архитектура (пайплайны данных, конфигурация модели, воркфлоу, права на решения), через которую институциональный замысел становится машинно-исполняемым действием |
+| [[Anticipatory Influence]] | Anticipatory Influence | Структурирование среды принятия решений «выше по потоку» — через ранжирование, маршрутизацию, дефолты и пороги — до любого формального выбора или человеческого обдумывания |
+| [[Judge Layer]] | Judge Layer | Отдельный, независимый экземпляр LLM, действующий как «менеджер»: верифицирует действия агента на границе системы, предотвращая несанкционированное поведение |
+| [[Primitive Fluency]] | Primitive Fluency | Способность специалиста понимать и манипулировать базовыми артефактами системы (файлы, git-состояния, права доступа), а не только высокоуровневым синтаксисом |
+| [[Vibe Coding]] | Vibe Coding | Генеративный стиль разработки, опирающийся на интуицию LLM и паттерн-матчинг (System 1), чтобы «пожелать» код в существование |
+| [[J-Curve]] | J-Curve | Провал производительности, возникающий при «прикручивании» ИИ к нереформированным воркфлоу — до того, как воркфлоу перепроектирован под инструмент |
+| [[Abstraction Tax]] | Abstraction Tax | Скрытая стоимость слоёв удобства (GUI, визарды), которые блокируют агентам доступ к примитивам системы |
+| [[Agent Context Bundle]] | Agent Context Bundle | Предварительно собранный набор данных, необходимых агенту для работы; устраняет проблему «переоткрытия контекста», когда агент тратит вычисления на поиск истории заново |
+| [[Cybernetic Development]] | Cybernetic Development | Автоматизация в связке с квалифицированным управлением: агент генерирует, человек управляет через BDD/TDD, CI/CD и явные спецификации |
+| [[Soul Trap]] | Soul Trap / Behavioral Lock-in | Захват компанией когнитивного отпечатка пользователя — паттернов мышления и принятия решений — через взаимодействие с персистентным агентом |
+| [[Agentic Workflow]] | Agentic Workflow | Итеративные, многошаговые последовательности, в которых агенты рассуждают, действуют, наблюдают результат и откатываются для достижения высокоуровневой цели |
+
+---
+
+## Фреймворки
+
+### [[Six Layers of Agentic Capability]] — Шесть слоёв агентной способности
+
+Blueprint для продакшн-готовых агентов:
+
+| Слой | Функция | Режим отказа |
+|---|---|---|
+| Intent Layer | Разбор и валидация высокоуровневых целей | Семантический дрейф — агент делает не то |
+| Context Layer | Персистентная память и состояние | Context rediscovery — агент «забывает» 85% истории |
+| Tool Layer | Интерфейс с внешним миром (API, MCP) | Агент «умный, но безрукий» в legacy-среде |
+| Control Layer | Управление циклом решений, backtracking | Бесконечные циклы или дублирующие действия |
+| [[Judge Layer]] | Независимая верификация на границе системы | Несанкционированные действия (письма, транзакции) |
+| Responsibility Layer | Финансовые и юридические [[Audit Trails]] | Неизвестные расходы, неотслеживаемая ответственность |
+
+---
+
+### [[Conversion Stack]] — Стек конверсии (7 шагов)
+
+```
+Data & Access Rights → Engines → Agents → Workflows → Supercognition → Learning Loops → Outcomes
+```
+
+Большинство AI-провалов — это сбой в одном из слоёв стека: нет прав доступа, слабая интеграция, неясные права на решения, отсутствие feedback loop.
+
+---
+
+### [[TCLD Framework]] — Аудит рабочего места
+
+Метод категоризации работы на 4 ведра:
+
+| Категория | EN | Описание |
+|---|---|---|
+| Театр | Theater | Видимая работа с низкой ценностью |
+| Товар | Commodity | Легко автоматизируется |
+| На линии | On-the-Line | Усиливается ИИ, но требует человека |
+| Долговечное | Durable | Суждение, не воспроизводимое машиной |
+
+---
+
+### [[Swiss Cheese Model of Defense]] — Модель слоистой защиты
+
+Применительно к [[Cybernetic Development]]: безопасность — это слои фильтров, каждый несовершенен. Аварии происходят, когда «дыры» в слоях совпадают.
+
+Слои (Governors): Tool → Merge → Release → Runtime → Learning.
+
+---
+
+### [[Five Managerial Disciplines]] — Пять управленческих дисциплин
+
+Для governance AI-мощи: **Specify** (определить цель) → **Instrument** (измерить) → **Assign** (назначить права решений) → **Contest** (оспорить / откатить) → **Learn** (feedback loop).
+
+---
+
+### [[Access-Meaning-Authority Framework]]
+
+Три обязательных слоя агентного продукта:
+- **Access** — доступ к системе
+- **Meaning** — семантическое понимание действий
+- **Authority** — разрешение действовать
+
+Большинство агентов имеют только первый слой.
+
+---
+
+## Формулы и паттерны
+
+**Compounding Reliability** (Надёжность с накоплением ошибок):
+> "Five primitives each at 99% uptime produce only 95% end-to-end reliability."
+> *Пять примитивов с 99% uptime каждый дают лишь 95% сквозной надёжности.*
+
+**WIP Inversion** (Инверсия незавершённой работы):
+> "In the pre-AI world, high WIP killed velocity. In the AI world, low WIP kills velocity."
+> *В доагентном мире высокий WIP убивал скорость. В агентном мире скорость убивает низкий WIP.*
+
+**Little's Law (Agentic Edition)**:
+> "Cycle Time = WIP / Throughput" — где WIP теперь = число фич под активным governance человека.
+> *Время цикла = число задач под управлением / пропускная способность агентов.*
+
+**Tomorrow Test** (Тест завтрашнего дня):
+> "Is this going to make tomorrow harder?"
+> *Это сделает завтра труднее?* — заменяет жёсткий свод правил одним эвристическим вопросом.
+
+**Say/Do Ratio** (Соотношение слов и действий):
+> Gap between saying you will do something and actually doing it.
+> *Разрыв между намерением и исполнением* — метрика высокого agency.
+
+---
+
+## Открытые вопросы
+
+- **Кадровый обрыв**: где следующее поколение «экспертов» будет нарабатывать суждение и [[Primitive Fluency]], если ИИ убирает «тренировочные ступени» для джуниоров?
+- **Specification/Value Gap**: кто определяет, для чего система, и что происходит, когда спецификация кодирует неправильные ценности?
+- **Agentic Liability**: кто несёт ответственность, когда агент подаёт юридические документы или автономно переводит деньги?
+- **Context Portability**: появится ли право на «портативность интеллекта» — перенос когнитивного профиля при смене инструмента?
+- **Verification Bankruptcy**: как организации избегают долгового кризиса верификации, когда объём сгенерированного кода растёт экспоненциально, а пропускная способность человеческого review остаётся линейной?
+
+---
+
+## Что использовать для нашего портфеля
+
+**Контекст:** AI-интегратор, [[Implementation Layer]], [[Business Object]], PE как канал.
+
+1. **[[Harness]] как главный продуктовый нарратив.** Тезис «модель — не важна, важна архитектура» — это точное позиционирование AI-интегратора: мы не продаём доступ к GPT-5 или Claude, мы строим [[Harness]], который превращает операционный контекст клиента в machine-executable action. Использовать в pitch и в дифференциации от «просто API».
+
+2. **[[Six Layers of Agentic Capability]] как чеклист delivery.** При оценке любого агентного проекта прогонять через шесть слоёв: где нет Intent-валидации, где нет [[Judge Layer]], где нет [[Audit Trails]] — там и будет провал в production. Интегрировать в pre-sale диагностику.
+
+3. **[[TCLD Framework]] как инструмент продаж PE-каналу.** Помогает портфельной компании за 20 минут понять, какие 55-75% работы «висят на волоске». Открывает разговор о [[Workflow Completion]] без абстрактного AI-хайпа.
+
+4. **[[Conversion Stack]] как карта точек входа.** Большинство клиентов стоят на дне J-кривой, потому что «прикрутили» ИИ к старому воркфлоу. Наша работа — диагностировать, на каком слое стека стоит провал (данные? права доступа? feedback loop?) и устранить именно его.
+
+5. **[[Abstraction Tax]] как аргумент против no-code замены.** Клиент, выбирающий визуальный инструмент, платит налог на удобство — агент не может управлять тем, что нельзя версионировать. Аргумент в пользу «всё как код» (IaC, Agents as Code).
+
+6. **[[Soul Trap]] — риск для enterprise-клиента.** При vendor-selection помогать клиенту задавать вопрос о поведенческой портируемости данных раньше, чем продукт уже запущен: «можем ли мы забрать когнитивный профиль при смене вендора?»