ingest: executive-briefing-the-memory-gap
This commit is contained in:
@@ -0,0 +1,133 @@
|
||||
---
|
||||
title: "Executive Briefing: The Memory Gap Killing Your Enterprise Agent Investments"
|
||||
slug: executive-briefing-the-memory-gap
|
||||
source: https://natesnewsletter.substack.com/p/executive-briefing-the-memory-gap
|
||||
author: Nate Jones
|
||||
published: 2025-12-07
|
||||
processed: 2026-05-18
|
||||
type: video
|
||||
tags:
|
||||
- agent-architecture
|
||||
- enterprise-ai
|
||||
- memory
|
||||
themes:
|
||||
- "[[Agentic Workflow]]"
|
||||
- "[[Implementation Layer]]"
|
||||
- "[[Moat]]"
|
||||
- "[[Workflow Completion]]"
|
||||
frameworks:
|
||||
- "[[Domain Memory]]"
|
||||
- "[[Two-Agent Pattern]]"
|
||||
- "[[Agent Workflow Audit]]"
|
||||
terminology:
|
||||
- "[[Domain Memory]]"
|
||||
- "[[Memory Gap]]"
|
||||
- "[[Two-Agent Pattern]]"
|
||||
- "[[Implementation Fabric]]"
|
||||
- "[[Harness]]"
|
||||
---
|
||||
|
||||
# The Memory Gap Killing Your Enterprise Agent Investments
|
||||
|
||||
## Суть в одном абзаце
|
||||
|
||||
Предприятия инвестируют в агентов, но те регулярно проваливаются на задачах длиннее одной сессии. Причина — не слабость модели, а отсутствие памяти: каждая сессия стартует без контекста о состоянии работы. Gartner фиксирует рост запросов по AI-агентам на 750% в 2024 году, однако fantasy of drop-in universal agents is dead — *фантазия об универсальных «plug-and-play» агентах мертва*. Решение — [[Domain Memory]] как инфраструктура, а не как фича.
|
||||
|
||||
---
|
||||
|
||||
## Терминология
|
||||
|
||||
| Термин (RU) | EN | Определение |
|
||||
|---|---|---|
|
||||
| [[Memory Gap]] | Memory Gap | Провал между сессиями агента: отсутствие сохранённого состояния цели, прогресса и процедур |
|
||||
| [[Domain Memory]] | Domain Memory | Структурированная внешняя память агента: цели (goal artifacts), трекинг прогресса, операционные процедуры |
|
||||
| [[Two-Agent Pattern]] | Two-Agent Pattern | Архитектурный паттерн Anthropic: один агент выполняет работу, второй управляет состоянием и памятью |
|
||||
| Доменная память как инфраструктура | Domain Memory as Infrastructure | [[Domain Memory]] рассматривается не как опция, а как обязательный инфраструктурный слой — наравне с БД или очередью |
|
||||
| Тридж вендорских обещаний | Vendor Claim Triage | Методика отсева маркетинговых заявлений о «готовых» агентах по критерию: решена ли проблема памяти |
|
||||
| Агентный [[Harness]] | Agent Harness | Обёртка над frontier-моделью, которая сама по себе не решает проблему памяти — её нужно решать отдельно |
|
||||
|
||||
---
|
||||
|
||||
## Ключевые тезисы
|
||||
|
||||
### 1. Это проблема памяти, а не интеллекта
|
||||
|
||||
> "Agents don't fail because models are too dumb. They fail because every session starts with no grounded sense of where the work stands."
|
||||
> *Агенты не проваливаются потому, что модели тупые. Они проваливаются потому, что каждая сессия начинается без понимания, где находится работа.*
|
||||
|
||||
Anthropic подтвердил это в своей инженерной документации. Расширение контекстного окна до миллиона токенов **ухудшает** ситуацию, а не улучшает — академические исследования показывают деградацию внимания на больших контекстах («lost in the middle»).
|
||||
|
||||
### 2. [[Domain Memory]] — три обязательных компонента
|
||||
|
||||
| Компонент | Что хранит |
|
||||
|---|---|
|
||||
| Goal Artifacts | Явная формулировка цели + критерии завершения |
|
||||
| Progress Tracking | Что сделано, что в процессе, что заблокировано |
|
||||
| Operating Procedures | Правила, ограничения, процедуры эскалации |
|
||||
|
||||
Без всех трёх агент деградирует в «sophisticated amnesiac» — *изощрённый амнезиак*.
|
||||
|
||||
### 3. [[Two-Agent Pattern]] (архитектура Anthropic)
|
||||
|
||||
Элегантность паттерна в том, что он **не борется** с амнезиачной природой LLM, а принимает её:
|
||||
- **Agent A (executor)** — выполняет работу в рамках одной сессии
|
||||
- **Agent B (memory manager)** — читает и пишет [[Domain Memory]] между сессиями, передаёт контекст следующей сессии
|
||||
|
||||
### 4. Стратегический [[Moat]]
|
||||
|
||||
> "Your competitive advantage lies in memory design, not model selection."
|
||||
> *Ваше конкурентное преимущество — в дизайне памяти, а не в выборе модели.*
|
||||
|
||||
Все имеют доступ к одним и тем же frontier-моделям. [[Domain Memory]] специфична для домена и не копируется.
|
||||
|
||||
### 5. Пять дисциплин серьёзных агентов
|
||||
|
||||
TBD — полный контент за paywall. Известно, что разделяют агентов, которые **завершают работу**, от тех, которые **буксуют**.
|
||||
|
||||
> Открытый вопрос: какие именно пять дисциплин перечислены в полном тексте?
|
||||
|
||||
---
|
||||
|
||||
## Пять промптов из материала
|
||||
|
||||
| Промпт | Назначение |
|
||||
|---|---|
|
||||
| Domain Memory Designer | Универсальный фреймворк для любого [[Agentic Workflow]] |
|
||||
| Research Workflow Memory | Расследования: бэклог гипотез, лог свидетельств, журнал решений |
|
||||
| Operations Agent Memory | Инциденты, тикеты, SLA-трекинг, ранбуки |
|
||||
| Content Production Memory | Редакционные пайплайны, реестры черновиков, источники |
|
||||
| [[Agent Workflow Audit]] | Диагностика текущих агентных деплойментов — где ломается и почему |
|
||||
|
||||
---
|
||||
|
||||
## Что использовать для нашего портфеля
|
||||
|
||||
**Контекст:** AI-интегратор, [[Implementation Layer]] как продукт, [[Business Object]]-ориентированные агенты, PE как канал продаж.
|
||||
|
||||
### Прямое применение
|
||||
|
||||
- **[[Domain Memory]] = продаваемый артефакт.** Клиент покупает не агента — он покупает систему, которая не забывает. Это переформулирует ценностное предложение: мы строим не [[Harness]] над моделью, а [[Implementation Fabric]] с памятью.
|
||||
- **Тридж вендорских обещаний** — готовый инструмент для PE-аудиторий: помогает CIO/CTO отсеивать нереалистичные питчи на закупках. Можно упаковать как discovery-фреймворк.
|
||||
- **[[Two-Agent Pattern]]** применим к нашим агентным workflows прямо сейчас: выделить memory-агента как отдельный компонент [[Implementation Layer]].
|
||||
|
||||
### Для PE-канала
|
||||
|
||||
[[Workflow Completion]] как метрика ROI: агент, который завершает многосессионные задачи, напрямую конвертируется в FTE-экономию. Аргумент для LP-обоснования инвестиций в [[Implementation Fabric]].
|
||||
|
||||
### Что требует уточнения
|
||||
|
||||
TBD — пять дисциплин серьёзных агентов (за paywall). Нужно получить доступ или найти аналогичный источник.
|
||||
|
||||
> Открытый вопрос: как именно Anthropic предлагает валидировать [[Domain Memory]] — через [[Evals]] или через отдельный audit-слой?
|
||||
|
||||
---
|
||||
|
||||
## Связанные материалы в vault
|
||||
|
||||
- [[Agentic Workflow]]
|
||||
- [[Implementation Fabric]]
|
||||
- [[Workflow Completion]]
|
||||
- [[Harness]]
|
||||
- [[Moat]]
|
||||
- [[Evals]]
|
||||
- [[Forward Deployed Engineer]] — смежная роль: тот, кто строит [[Domain Memory]] для конкретного клиента
|
||||
File diff suppressed because one or more lines are too long
Reference in New Issue
Block a user