💻 Программирование [Дмитрий Антипов, balun.courses] Иженерия AI-агентов: с нуля до запуска в prod (2026)

  • ОФОРМИТЬ ПОДПИСКУ

Calvin Candie

Вечный

Calvin Candie

Вечный
2 Сен 2018
47,983
5,226
Автор: Дмитрий Антипов, balun.courses
Название: Иженерия AI-агентов: с нуля до запуска в prod (2026)

1781693360197.png

Преподает Lead разработки AI-агентов, Группа Сбер (АБТ)
Научимся с нуля создавать и внедрять в процессы сложных AI-агентов на примере pet-проекта — мультиагентной системы с production-архитектурой:
памятью, стейтом, автономностью и мониторингом. Без low-code решений.

Как это все будет пошагово:
Урок № 1 Введение в концепцию агентов:

AI-агенты — самая хайповая концепция, но именно поэтому этим словом
называют все подряд: и простого чат-бота с промптом, и любой скрипт с
 вызовами LLM.
Агенты гораздо глубже и сложнее.
В этом модуле разбираемся, что такое агент на самом деле, почему это не фреймворк и не SDK, и закладываем архитектурный фундамент,
на котором будет стоять все остальное

Урок № 2 Как агент думает и действует:
«Агент работает, но так себе» — мы не уверены, что задача вообще закончится успехом.
В этом уроке строим когнитивный и execution-слой как инженерные компоненты

Урок № 3 Автономность: память, стейт и контроль поведения:
Добавляем агенту все, чтобы отправить его в свободное плавание:
память, состояние и контроль. Здесь мы превращаем реактивную систему в
управляемую и автономную

Урок № 4 Катим в прод: надежность, безопасность и остановка:
Демо прощает все, а прод — нет. В этом уроке делаем агента, которому можно доверять: ошибки, безопасность, наблюдаемость, стоимость,
измеримость и обязательные stop conditions

Урок № 5 Сложные задачи: мультиагентность и координация
Урок №1. Введение в концепцию агентов

AI-агенты — самая хайповая концепция, но именно поэтому этим словом
называют все подряд: и простого чат-бота с промптом, и любой скрипт с вызовами LLM.
Агенты гораздо глубже и сложнее. В этом модуле разбираемся, что такое агент на самом деле, почему это не фреймворк и не SDK, и закладываем архитектурный фундамент, на котором будет стоять все остальное

Что такое агент и что им не является:
как мы вообще здесь оказались и почему перестало хватать просто LLM
агент vs чат-бот vs pipeline vs workflow
decision framework: когда агент действительно нужен, а когда это оверинжиниринг
анатомия агентов и agent loop

Паттерны:
ReAct, Plan→Execute (PlanSolve)
критерии выбора + антипаттерны

Бонусом:
кратко пройдемся по внутреннему устройству популярных агентов: Cursor, Claude Code, Deep Research
разберемся, что у них общего архитектурно

Практика:
разбираем архитектуру реального агента по слоям
собираем наивный прототип Projects Health Agent, который постарается навести порядок в вашем GitLab

Результат:
понимаешь, где кончается «чат» и начинается агент
есть рабочий и простой прототип, который будем прокачивать

Урок №2. Как агент думает и действует
«Агент работает, но так себе» — мы не уверены, что задача вообще закончится успехом. В этом уроке строим когнитивный и execution-слой как инженерные компоненты

Когнитивный слой:
основы инференса LLM как рычаги: на что мы можем влиять
как выбрать модель под задачу
context engineering: как не впихивать все, что у вас есть
structured outputs: заставляем модель ответить так, как нам надо

Execution-слой:
tools: разбираем из чего они состоят
проблемы дизайна инструментов: «слишком мало/слишком много»
коротко про MCP: как стандартизировать доступ к тулзам

Практика:
подключаем GitLab API как tools
вводим строгие схемы output + валидацию/repair loop
делаем стратегию чтения: агент сам решает, какие MR раскрывать глубже

Результат:
предсказуемые структурированные инсайты вместо безумной генерации
агент умеет выбирать контекст и инструменты, а не пихать все в промпт

Урок №3. Автономность: память, стейт и контроль поведения
Добавляем агенту все, чтобы отправить его в свободное плавание:
память, состояние и контроль. Здесь мы превращаем реактивную систему в
управляемую и автономную

Память:
краткосрочная / долгосрочная / эпизодическая
history management и компактизация: хранить / сжимать / забывать

State engineering & persistence:
жизненный цикл состояния
персистентность: падение / рестарт без потери
параллелизм и консистентность

Идемпотентность и детерминизм:
повторяемость действий и политики
идемпотентность операций
детерминизм, где возможно

Контроль автономности:
HITL (Human-in-the-Loop): когда действуем сами, а когда спрашиваем
confidence как уровни автономности
self-reflection как адаптация

Практика:
добавляем память и реализуем state-машину
вводим idempotency keys и учимся не повторяться
учимся адаптироваться к суровому окружению

Результат:
агент не забывает, не повторяется, ведет задачу как процесс
автономность становится более управляемой

Урок №4. Катим в прод: надежность, безопасность и остановка
Демо прощает все, а прод — нет. В этом уроке делаем агента, которому можно доверять: ошибки, безопасность, наблюдаемость, стоимость, измеримость и обязательные stop conditions

Error handling:
API 500 / таймауты: retry / backoff / fallback / graceful degradation
ошибки LLM: отказ, галлюцинации, невалидный output → repair / abort

Guardrails:
запрет деструктивных действий без подтверждения
политика алертов и настройка порогов
работа с prompt injection / adversarial inputs

Stop conditions или когда агент обязан остановиться:
cost / time / tool control
mistools и другие ошибки инструментов
низкая уверенность, отсутствие HITL … и другие

Observability & Evals:
строим трейсинг и health check
что такое evals, как их строить и почему в агентах это так важно

Практика:
добавляем guardrails + запреты + политики алертов
внедряем stop conditions (бюджеты, circuit breaker, abort правила)
пишем минимальный eval suite

Результат:
агент безопасно останавливается и сжигает бюджет маленькой страны
есть наблюдаемость и постоянная оценка качества

Урок №5. Сложные задачи: мультиагентность и координация
Когда один агент не тянет по широте своей души функциональности,
появляется мультиагентность (несколько агентов сразу). Как следствие — неизбежность координации и взаимодействия внутри команды агентов

Когда мультиагентность нужна / когда нет:
компетенции, параллелизм, сложность решений
цена координации

Топологии и роутинг:
supervisor / hierarchical, peer-to-peer
роутинг: статический / динамический / условный

Multi-agent state:
shared vs isolated
конфликтность состояний и findings + dedup / merge-политики

Практика:
финализируем нашу систему

Результат:
понимаешь, когда мультиагенты оправданы
умеешь проектировать их координацию и целеполагание

Из чего состоит курс:
5 онлайн-уроков в ZOOM. Живые созвоны — длятся по 1.5−2 часа и проходят раз в неделю в свободное от работы время. Есть запись.
Домашние задания:
Пишем агента самостоятельно, ошибаемся, пробуем еще раз и сравниваем свои действия с действиями преподавателя.
Обучение через ошибки — лучший способ обучаться и закреплять материал практике.
Q&A-сеccии:
Online-встречи для ответов на вопросы. Фидбек дает преподаватель — никаких кураторов и помощников.

Подробнее:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скачать:
 

Похожие темы