ingest: executive-briefing-the-memory-gap

2026-05-18 14:25:06 +03:00
parent f5857376e7
commit b0b3e7e05a
2 changed files with 331 additions and 0 deletions
@@ -0,0 +1,133 @@
+---
+title: "Executive Briefing: The Memory Gap Killing Your Enterprise Agent Investments"
+slug: executive-briefing-the-memory-gap
+source: https://natesnewsletter.substack.com/p/executive-briefing-the-memory-gap
+author: Nate Jones
+published: 2025-12-07
+processed: 2026-05-18
+type: video
+tags:
+  - agent-architecture
+  - enterprise-ai
+  - memory
+themes:
+  - "[[Agentic Workflow]]"
+  - "[[Implementation Layer]]"
+  - "[[Moat]]"
+  - "[[Workflow Completion]]"
+frameworks:
+  - "[[Domain Memory]]"
+  - "[[Two-Agent Pattern]]"
+  - "[[Agent Workflow Audit]]"
+terminology:
+  - "[[Domain Memory]]"
+  - "[[Memory Gap]]"
+  - "[[Two-Agent Pattern]]"
+  - "[[Implementation Fabric]]"
+  - "[[Harness]]"
+---
+
+# The Memory Gap Killing Your Enterprise Agent Investments
+
+## Суть в одном абзаце
+
+Предприятия инвестируют в агентов, но те регулярно проваливаются на задачах длиннее одной сессии. Причина — не слабость модели, а отсутствие памяти: каждая сессия стартует без контекста о состоянии работы. Gartner фиксирует рост запросов по AI-агентам на 750% в 2024 году, однако fantasy of drop-in universal agents is dead — *фантазия об универсальных «plug-and-play» агентах мертва*. Решение — [[Domain Memory]] как инфраструктура, а не как фича.
+
+---
+
+## Терминология
+
+| Термин (RU) | EN | Определение |
+|---|---|---|
+| [[Memory Gap]] | Memory Gap | Провал между сессиями агента: отсутствие сохранённого состояния цели, прогресса и процедур |
+| [[Domain Memory]] | Domain Memory | Структурированная внешняя память агента: цели (goal artifacts), трекинг прогресса, операционные процедуры |
+| [[Two-Agent Pattern]] | Two-Agent Pattern | Архитектурный паттерн Anthropic: один агент выполняет работу, второй управляет состоянием и памятью |
+| Доменная память как инфраструктура | Domain Memory as Infrastructure | [[Domain Memory]] рассматривается не как опция, а как обязательный инфраструктурный слой — наравне с БД или очередью |
+| Тридж вендорских обещаний | Vendor Claim Triage | Методика отсева маркетинговых заявлений о «готовых» агентах по критерию: решена ли проблема памяти |
+| Агентный [[Harness]] | Agent Harness | Обёртка над frontier-моделью, которая сама по себе не решает проблему памяти — её нужно решать отдельно |
+
+---
+
+## Ключевые тезисы
+
+### 1. Это проблема памяти, а не интеллекта
+
+> "Agents don't fail because models are too dumb. They fail because every session starts with no grounded sense of where the work stands."
+> *Агенты не проваливаются потому, что модели тупые. Они проваливаются потому, что каждая сессия начинается без понимания, где находится работа.*
+
+Anthropic подтвердил это в своей инженерной документации. Расширение контекстного окна до миллиона токенов **ухудшает** ситуацию, а не улучшает — академические исследования показывают деградацию внимания на больших контекстах («lost in the middle»).
+
+### 2. [[Domain Memory]] — три обязательных компонента
+
+| Компонент | Что хранит |
+|---|---|
+| Goal Artifacts | Явная формулировка цели + критерии завершения |
+| Progress Tracking | Что сделано, что в процессе, что заблокировано |
+| Operating Procedures | Правила, ограничения, процедуры эскалации |
+
+Без всех трёх агент деградирует в «sophisticated amnesiac» — *изощрённый амнезиак*.
+
+### 3. [[Two-Agent Pattern]] (архитектура Anthropic)
+
+Элегантность паттерна в том, что он **не борется** с амнезиачной природой LLM, а принимает её:
+- **Agent A (executor)** — выполняет работу в рамках одной сессии
+- **Agent B (memory manager)** — читает и пишет [[Domain Memory]] между сессиями, передаёт контекст следующей сессии
+
+### 4. Стратегический [[Moat]]
+
+> "Your competitive advantage lies in memory design, not model selection."
+> *Ваше конкурентное преимущество — в дизайне памяти, а не в выборе модели.*
+
+Все имеют доступ к одним и тем же frontier-моделям. [[Domain Memory]] специфична для домена и не копируется.
+
+### 5. Пять дисциплин серьёзных агентов
+
+TBD — полный контент за paywall. Известно, что разделяют агентов, которые **завершают работу**, от тех, которые **буксуют**.
+
+> Открытый вопрос: какие именно пять дисциплин перечислены в полном тексте?
+
+---
+
+## Пять промптов из материала
+
+| Промпт | Назначение |
+|---|---|
+| Domain Memory Designer | Универсальный фреймворк для любого [[Agentic Workflow]] |
+| Research Workflow Memory | Расследования: бэклог гипотез, лог свидетельств, журнал решений |
+| Operations Agent Memory | Инциденты, тикеты, SLA-трекинг, ранбуки |
+| Content Production Memory | Редакционные пайплайны, реестры черновиков, источники |
+| [[Agent Workflow Audit]] | Диагностика текущих агентных деплойментов — где ломается и почему |
+
+---
+
+## Что использовать для нашего портфеля
+
+**Контекст:** AI-интегратор, [[Implementation Layer]] как продукт, [[Business Object]]-ориентированные агенты, PE как канал продаж.
+
+### Прямое применение
+
+- **[[Domain Memory]] = продаваемый артефакт.** Клиент покупает не агента — он покупает систему, которая не забывает. Это переформулирует ценностное предложение: мы строим не [[Harness]] над моделью, а [[Implementation Fabric]] с памятью.
+- **Тридж вендорских обещаний** — готовый инструмент для PE-аудиторий: помогает CIO/CTO отсеивать нереалистичные питчи на закупках. Можно упаковать как discovery-фреймворк.
+- **[[Two-Agent Pattern]]** применим к нашим агентным workflows прямо сейчас: выделить memory-агента как отдельный компонент [[Implementation Layer]].
+
+### Для PE-канала
+
+[[Workflow Completion]] как метрика ROI: агент, который завершает многосессионные задачи, напрямую конвертируется в FTE-экономию. Аргумент для LP-обоснования инвестиций в [[Implementation Fabric]].
+
+### Что требует уточнения
+
+TBD — пять дисциплин серьёзных агентов (за paywall). Нужно получить доступ или найти аналогичный источник.
+
+> Открытый вопрос: как именно Anthropic предлагает валидировать [[Domain Memory]] — через [[Evals]] или через отдельный audit-слой?
+
+---
+
+## Связанные материалы в vault
+
+- [[Agentic Workflow]]
+- [[Implementation Fabric]]
+- [[Workflow Completion]]
+- [[Harness]]
+- [[Moat]]
+- [[Evals]]
+- [[Forward Deployed Engineer]] — смежная роль: тот, кто строит [[Domain Memory]] для конкретного клиента