ingest: anthropic-and-openai-just-admitted-the-model-isnt-enough
This commit is contained in:
+178
@@ -0,0 +1,178 @@
|
||||
---
|
||||
slug: anthropic-and-openai-just-admitted-the-model-isnt-enough
|
||||
type: video
|
||||
source: https://www.youtube.com/watch?v=EpJ0CjTJSag
|
||||
date_published: unknown
|
||||
date_processed: 2026-05-18
|
||||
themes:
|
||||
- "[[Harness]]"
|
||||
- "[[Agentic Workflow]]"
|
||||
- "[[Implementation Layer]]"
|
||||
- "[[Moat]]"
|
||||
- "[[Workflow Completion]]"
|
||||
frameworks:
|
||||
- "[[Six Layers of Agentic Capability]]"
|
||||
- "[[Conversion Stack]]"
|
||||
- "[[TCLD Framework]]"
|
||||
- "[[Swiss Cheese Model of Defense]]"
|
||||
- "[[Five Managerial Disciplines]]"
|
||||
- "[[Access-Meaning-Authority Framework]]"
|
||||
terminology:
|
||||
- "[[Harness]]"
|
||||
- "[[Anticipatory Influence]]"
|
||||
- "[[Judge Layer]]"
|
||||
- "[[Primitive Fluency]]"
|
||||
- "[[Vibe Coding]]"
|
||||
- "[[J-Curve]]"
|
||||
- "[[Abstraction Tax]]"
|
||||
- "[[Agent Context Bundle]]"
|
||||
- "[[Cybernetic Development]]"
|
||||
- "[[Soul Trap]]"
|
||||
---
|
||||
|
||||
# Anthropic и OpenAI признали: модель — недостаточно
|
||||
|
||||
## Главные тезисы
|
||||
|
||||
- **Конец эры «болтушки»**: Q2 2026 — структурный переломный момент. ИИ перестал быть автодополнением; он стал промышленной рабочей силой автономных агентов, встроенных в инфраструктуру предприятий.
|
||||
- **Суверенное предприятие зависит от [[Harness]]**: конкурентное преимущество сместилось с выбора «лучшей модели» на построение суверенной архитектуры — [[Harness]], — которая переводит институциональный замысел в машинно-исполняемые действия.
|
||||
- **Крах карьерной лестницы**: найм на позиции начального уровня в крупных tech-компаниях упал более чем на 50% с 2019 года. ИИ вытеснил «тренировочные ступени» — рутинные задачи, на которых учились джуниоры.
|
||||
- **[[Moat]] сместился в bottleneck-экономику**: ценность ИИ не распределяется равномерно. Она концентрируется вокруг физической инфраструктуры (энергия / земля), стоимости доверия и способности интегрировать модели в конкретный операционный контекст.
|
||||
- **Смерть посадочной модели SaaS**: тарификация за «место» (seat-based) разрушается — агенты заменяют человеческие «места». Ценовая логика мигрирует к единицам делегированной работы (delegated work units).
|
||||
- **Cybernetic Development vs Vibe Coding**: отрасль разделяется на [[Vibe Coding]] (интуиция + паттерн-матчинг LLM) и [[Cybernetic Development]] — System 2-инженерию с BDD/TDD, которая управляет генеративной мощью.
|
||||
- **[[Soul Trap]] — поведенческий lock-in**: в отличие от прежних форм зависимости (файлы, записи), постоянные агенты захватывают когнитивный отпечаток пользователя — паттерны мышления, приоритизации и принятия решений.
|
||||
|
||||
---
|
||||
|
||||
## Терминология
|
||||
|
||||
| RU | EN | Определение |
|
||||
|---|---|---|
|
||||
| [[Harness]] | Harness | Архитектура (пайплайны данных, конфигурация модели, воркфлоу, права на решения), через которую институциональный замысел становится машинно-исполняемым действием |
|
||||
| [[Anticipatory Influence]] | Anticipatory Influence | Структурирование среды принятия решений «выше по потоку» — через ранжирование, маршрутизацию, дефолты и пороги — до любого формального выбора или человеческого обдумывания |
|
||||
| [[Judge Layer]] | Judge Layer | Отдельный, независимый экземпляр LLM, действующий как «менеджер»: верифицирует действия агента на границе системы, предотвращая несанкционированное поведение |
|
||||
| [[Primitive Fluency]] | Primitive Fluency | Способность специалиста понимать и манипулировать базовыми артефактами системы (файлы, git-состояния, права доступа), а не только высокоуровневым синтаксисом |
|
||||
| [[Vibe Coding]] | Vibe Coding | Генеративный стиль разработки, опирающийся на интуицию LLM и паттерн-матчинг (System 1), чтобы «пожелать» код в существование |
|
||||
| [[J-Curve]] | J-Curve | Провал производительности, возникающий при «прикручивании» ИИ к нереформированным воркфлоу — до того, как воркфлоу перепроектирован под инструмент |
|
||||
| [[Abstraction Tax]] | Abstraction Tax | Скрытая стоимость слоёв удобства (GUI, визарды), которые блокируют агентам доступ к примитивам системы |
|
||||
| [[Agent Context Bundle]] | Agent Context Bundle | Предварительно собранный набор данных, необходимых агенту для работы; устраняет проблему «переоткрытия контекста», когда агент тратит вычисления на поиск истории заново |
|
||||
| [[Cybernetic Development]] | Cybernetic Development | Автоматизация в связке с квалифицированным управлением: агент генерирует, человек управляет через BDD/TDD, CI/CD и явные спецификации |
|
||||
| [[Soul Trap]] | Soul Trap / Behavioral Lock-in | Захват компанией когнитивного отпечатка пользователя — паттернов мышления и принятия решений — через взаимодействие с персистентным агентом |
|
||||
| [[Agentic Workflow]] | Agentic Workflow | Итеративные, многошаговые последовательности, в которых агенты рассуждают, действуют, наблюдают результат и откатываются для достижения высокоуровневой цели |
|
||||
|
||||
---
|
||||
|
||||
## Фреймворки
|
||||
|
||||
### [[Six Layers of Agentic Capability]] — Шесть слоёв агентной способности
|
||||
|
||||
Blueprint для продакшн-готовых агентов:
|
||||
|
||||
| Слой | Функция | Режим отказа |
|
||||
|---|---|---|
|
||||
| Intent Layer | Разбор и валидация высокоуровневых целей | Семантический дрейф — агент делает не то |
|
||||
| Context Layer | Персистентная память и состояние | Context rediscovery — агент «забывает» 85% истории |
|
||||
| Tool Layer | Интерфейс с внешним миром (API, MCP) | Агент «умный, но безрукий» в legacy-среде |
|
||||
| Control Layer | Управление циклом решений, backtracking | Бесконечные циклы или дублирующие действия |
|
||||
| [[Judge Layer]] | Независимая верификация на границе системы | Несанкционированные действия (письма, транзакции) |
|
||||
| Responsibility Layer | Финансовые и юридические [[Audit Trails]] | Неизвестные расходы, неотслеживаемая ответственность |
|
||||
|
||||
---
|
||||
|
||||
### [[Conversion Stack]] — Стек конверсии (7 шагов)
|
||||
|
||||
```
|
||||
Data & Access Rights → Engines → Agents → Workflows → Supercognition → Learning Loops → Outcomes
|
||||
```
|
||||
|
||||
Большинство AI-провалов — это сбой в одном из слоёв стека: нет прав доступа, слабая интеграция, неясные права на решения, отсутствие feedback loop.
|
||||
|
||||
---
|
||||
|
||||
### [[TCLD Framework]] — Аудит рабочего места
|
||||
|
||||
Метод категоризации работы на 4 ведра:
|
||||
|
||||
| Категория | EN | Описание |
|
||||
|---|---|---|
|
||||
| Театр | Theater | Видимая работа с низкой ценностью |
|
||||
| Товар | Commodity | Легко автоматизируется |
|
||||
| На линии | On-the-Line | Усиливается ИИ, но требует человека |
|
||||
| Долговечное | Durable | Суждение, не воспроизводимое машиной |
|
||||
|
||||
---
|
||||
|
||||
### [[Swiss Cheese Model of Defense]] — Модель слоистой защиты
|
||||
|
||||
Применительно к [[Cybernetic Development]]: безопасность — это слои фильтров, каждый несовершенен. Аварии происходят, когда «дыры» в слоях совпадают.
|
||||
|
||||
Слои (Governors): Tool → Merge → Release → Runtime → Learning.
|
||||
|
||||
---
|
||||
|
||||
### [[Five Managerial Disciplines]] — Пять управленческих дисциплин
|
||||
|
||||
Для governance AI-мощи: **Specify** (определить цель) → **Instrument** (измерить) → **Assign** (назначить права решений) → **Contest** (оспорить / откатить) → **Learn** (feedback loop).
|
||||
|
||||
---
|
||||
|
||||
### [[Access-Meaning-Authority Framework]]
|
||||
|
||||
Три обязательных слоя агентного продукта:
|
||||
- **Access** — доступ к системе
|
||||
- **Meaning** — семантическое понимание действий
|
||||
- **Authority** — разрешение действовать
|
||||
|
||||
Большинство агентов имеют только первый слой.
|
||||
|
||||
---
|
||||
|
||||
## Формулы и паттерны
|
||||
|
||||
**Compounding Reliability** (Надёжность с накоплением ошибок):
|
||||
> "Five primitives each at 99% uptime produce only 95% end-to-end reliability."
|
||||
> *Пять примитивов с 99% uptime каждый дают лишь 95% сквозной надёжности.*
|
||||
|
||||
**WIP Inversion** (Инверсия незавершённой работы):
|
||||
> "In the pre-AI world, high WIP killed velocity. In the AI world, low WIP kills velocity."
|
||||
> *В доагентном мире высокий WIP убивал скорость. В агентном мире скорость убивает низкий WIP.*
|
||||
|
||||
**Little's Law (Agentic Edition)**:
|
||||
> "Cycle Time = WIP / Throughput" — где WIP теперь = число фич под активным governance человека.
|
||||
> *Время цикла = число задач под управлением / пропускная способность агентов.*
|
||||
|
||||
**Tomorrow Test** (Тест завтрашнего дня):
|
||||
> "Is this going to make tomorrow harder?"
|
||||
> *Это сделает завтра труднее?* — заменяет жёсткий свод правил одним эвристическим вопросом.
|
||||
|
||||
**Say/Do Ratio** (Соотношение слов и действий):
|
||||
> Gap between saying you will do something and actually doing it.
|
||||
> *Разрыв между намерением и исполнением* — метрика высокого agency.
|
||||
|
||||
---
|
||||
|
||||
## Открытые вопросы
|
||||
|
||||
- **Кадровый обрыв**: где следующее поколение «экспертов» будет нарабатывать суждение и [[Primitive Fluency]], если ИИ убирает «тренировочные ступени» для джуниоров?
|
||||
- **Specification/Value Gap**: кто определяет, для чего система, и что происходит, когда спецификация кодирует неправильные ценности?
|
||||
- **Agentic Liability**: кто несёт ответственность, когда агент подаёт юридические документы или автономно переводит деньги?
|
||||
- **Context Portability**: появится ли право на «портативность интеллекта» — перенос когнитивного профиля при смене инструмента?
|
||||
- **Verification Bankruptcy**: как организации избегают долгового кризиса верификации, когда объём сгенерированного кода растёт экспоненциально, а пропускная способность человеческого review остаётся линейной?
|
||||
|
||||
---
|
||||
|
||||
## Что использовать для нашего портфеля
|
||||
|
||||
**Контекст:** AI-интегратор, [[Implementation Layer]], [[Business Object]], PE как канал.
|
||||
|
||||
1. **[[Harness]] как главный продуктовый нарратив.** Тезис «модель — не важна, важна архитектура» — это точное позиционирование AI-интегратора: мы не продаём доступ к GPT-5 или Claude, мы строим [[Harness]], который превращает операционный контекст клиента в machine-executable action. Использовать в pitch и в дифференциации от «просто API».
|
||||
|
||||
2. **[[Six Layers of Agentic Capability]] как чеклист delivery.** При оценке любого агентного проекта прогонять через шесть слоёв: где нет Intent-валидации, где нет [[Judge Layer]], где нет [[Audit Trails]] — там и будет провал в production. Интегрировать в pre-sale диагностику.
|
||||
|
||||
3. **[[TCLD Framework]] как инструмент продаж PE-каналу.** Помогает портфельной компании за 20 минут понять, какие 55-75% работы «висят на волоске». Открывает разговор о [[Workflow Completion]] без абстрактного AI-хайпа.
|
||||
|
||||
4. **[[Conversion Stack]] как карта точек входа.** Большинство клиентов стоят на дне J-кривой, потому что «прикрутили» ИИ к старому воркфлоу. Наша работа — диагностировать, на каком слое стека стоит провал (данные? права доступа? feedback loop?) и устранить именно его.
|
||||
|
||||
5. **[[Abstraction Tax]] как аргумент против no-code замены.** Клиент, выбирающий визуальный инструмент, платит налог на удобство — агент не может управлять тем, что нельзя версионировать. Аргумент в пользу «всё как код» (IaC, Agents as Code).
|
||||
|
||||
6. **[[Soul Trap]] — риск для enterprise-клиента.** При vendor-selection помогать клиенту задавать вопрос о поведенческой портируемости данных раньше, чем продукт уже запущен: «можем ли мы забрать когнитивный профиль при смене вендора?»
|
||||
+313
File diff suppressed because one or more lines are too long
Reference in New Issue
Block a user