ingest: rag-agents-knowledge-layer-architecture

This commit is contained in:
2026-05-18 14:34:03 +03:00
parent 5e5bcac820
commit 15d54f74a2
2 changed files with 292 additions and 0 deletions
@@ -0,0 +1,129 @@
---
title: "RAG for AI Agents — Knowledge Layer Architecture"
slug: rag-agents-knowledge-layer-architecture
type: video
source: "https://natesnewsletter.substack.com/p/rag-agents-knowledge-layer-architecture"
author: "Nate (Nate's Substack)"
published: 2026-05-13
processed: 2026-05-18
themes:
- "[[RAG]]"
- "[[Agentic Workflow]]"
- "[[Implementation Layer]]"
- "[[Audit Trails]]"
- "[[Systems of Record]]"
frameworks:
- "[[Knowledge Layer]]"
- "[[Retrieval Contract]]"
- "[[Context Assembly]]"
terminology:
- "[[Knowledge Layer]]"
- "[[Retrieval Contract]]"
- "[[Context Assembly]]"
- "[[Provenance]]"
- "[[Stack ADR]]"
- "[[Agentic Workflow]]"
- "[[Implementation Layer]]"
- "[[Audit Trails]]"
- "[[Systems of Record]]"
---
# RAG for AI Agents — Knowledge Layer Architecture
## Суть
Производственные AI-агенты проваливаются не из-за неверного метода ретривала (retrieval), а потому что система ретривала не способна **собрать** нужный контекст до начала работы агента. Проблема не в поиске — в сборке ([[Context Assembly]]). Векторный поиск деградирует с позиции «всей архитектуры» до одного компонента внутри более широкого [[Knowledge Layer]], который включает ретривал, структуру документов, семантические модели данных, контроль доступа, провенанс, память и write-back.
## Ключевой тезис
> "That's the new RAG problem — not a retrieval problem, an assembly problem."
> *Это новая проблема RAG — не проблема ретривала, а проблема сборки.*
Агент пересоздаёт 85% контекста при каждом запуске — это токены, время и уверенные ошибки. Уверенный неправильный ответ — самый дорогой вид ошибки.
## Почему классический RAG ломается
Векторная БД находит текст, семантически связанный с вопросом. Этого недостаточно.
Агент нуждается в:
- текущей записи аккаунта из [[Systems of Record]]
- правах пользователя (access control)
- актуальной политике
- нужном разделе длинного документа
- таблице за конкретной метрикой
- решении с прошлого совещания
- цепочке источников для [[Audit Trails]] — чтобы человек-ревьюер мог восстановить логику
Без этого модель **импровизирует** → неверные возвраты клиентам, устаревшие политики в ответах, устаревшие метрики в презентациях для совета директоров.
## Архитектура Knowledge Layer
[[Knowledge Layer]] = слой поверх векторного поиска:
| Компонент (RU) | EN | Роль |
|---|---|---|
| Ретривал | Retrieval | Векторный поиск как один из компонентов, не вся архитектура |
| Структура документов | Document Structure | Навигация по разделам длинных документов |
| Семантические модели данных | Semantic Data Models | Привязка чанков к бизнес-объектам |
| Контроль доступа | Access Control | Права пользователя как часть контекста до передачи в модель |
| [[Provenance\|Провенанс]] | Provenance | Цепочка источников для [[Audit Trails]] и объяснимости |
| Память | Memory | Сессионная и долгосрочная память агента |
| Write-back | Write-back | Возможность агента обновлять базу знаний |
## Retrieval Contract — 7 вопросов
[[Retrieval Contract]] — семь вопросов для проверки, способен ли [[Knowledge Layer]] поддержать производственного агента. Полный список — за paywall.
TBD — детали контракта недоступны без подписки.
> Открытый вопрос: какие именно 7 вопросов включает [[Retrieval Contract]] и есть ли у них публичный аналог в open-source литературе?
## Сигналы рынка
Четыре компании — Pinecone, PageIndex, SAP, Dremio — демонстрируют один и тот же сдвиг: «ретривал» для агентов больше не означает только поиск. Это сборка задаче-ориентированного контекста.
## Артефакты (paste-ready, за paywall)
| Артефакт | Назначение |
|---|---|
| Retrieval Contract Spec | Спецификация контракта ретривала для конкретного агента |
| Failure Triage | Диагностика отказов — где именно ломается сборка контекста |
| [[Stack ADR]] | Architecture Decision Record — обоснование выбора стека знаний |
## Терминология
| Термин (RU) | EN | Определение |
|---|---|---|
| [[Knowledge Layer]] | Knowledge Layer | Слой знаний поверх векторного поиска; включает ретривал + структуру + ACL + провенанс + память + write-back |
| [[Retrieval Contract]] | Retrieval Contract | 7 вопросов, определяющих готовность слоя знаний к производственному [[Agentic Workflow]] |
| [[Context Assembly]] | Context Assembly | Сборка задаче-ориентированного контекста до запуска агента — в отличие от поиска по запросу в реальном времени |
| [[Provenance]] | Provenance | Цепочка источников, позволяющая аудитору восстановить логику решения агента; часть [[Audit Trails]] |
| Write-back | Write-back | Возможность агента записывать результаты работы обратно в базу знаний |
| [[Stack ADR]] | Stack ADR | Architecture Decision Record — документ обоснования архитектурных решений по стеку |
## Что использовать для нашего портфеля
**Контекст: AI-интегратор, [[Implementation Layer]], бизнес-объекты как единица знания, PE как канал.**
**1. Переформулировать RAG в пресейле**
Не «векторный поиск», а «сборка контекста» ([[Context Assembly]]). Клиенту важно не то, чем ищем, а что агент получает до начала работы. Это точка дифференциации от коробочных RAG-решений.
**2. Бизнес-объект как единица ретривала**
Классический RAG режет документы на чанки без структуры. Правильный [[Knowledge Layer]] привязывает чанки к бизнес-объектам (аккаунт, политика, метрика, контракт). Это архитектурный принцип нашего [[Implementation Layer]].
**3. [[Audit Trails]] и [[Provenance]] — не опция**
Для enterprise-клиентов (финансы, страхование, юридика) объяснимость агента — регуляторное требование. Продаём [[Provenance]] как встроенную функцию, а не постфактум-дополнение.
**4. Контроль доступа внутри [[Knowledge Layer]]**
Права пользователя должны фильтровать ретривал до передачи контекста в модель. Это архитектурное требование, а не фильтр на выходе.
**5. PE-канал: апгрейд существующих RAG**
Портфельным компаниям PE, у которых уже есть базовый RAG (только вектор), предлагаем надстройку: структура документов + ACL + [[Provenance]] + память. Входная точка — [[Failure Triage]] по текущим сбоям агентов.
**6. Write-back как дорогостоящая фича следующего цикла**
Агенты, которые обновляют [[Systems of Record]] по результатам своей работы — следующий уровень [[Agentic Workflow]]. Стоит заложить в product roadmap для клиентов с высокой агентной зрелостью.
> Открытый вопрос: есть ли у текущих клиентов метрика доли контекста, пересобираемого при каждом запуске агента? Это готовый KPI для обоснования апгрейда с классического RAG до полноценного [[Knowledge Layer]].
---
*Источник: Nate's Substack, опубликовано 2026-05-13. Основной контент (7 вопросов, артефакты) — за платной подпиской; извлечённые данные — из публичного превью.*
File diff suppressed because one or more lines are too long