Calvin Candie
Вечный
Calvin Candie
Вечный
- 2 Сен 2018
- 36,695
- 1,736
- #1
Голосов: 0
Автор: maven
Название: Как оценивать ИИ-системы: курс для инженеров и PM-ов (2025)
[maven] AI Evals For Engineers & PMs (2025)

Научитесь проверенным методикам быстрого улучшения AI-приложений. Стройте системы искусственного интеллекта, которые работают лучше конкурентов - вне зависимости от конкретного сценария использования.
Если при работе с AI у вас возникают вопросы вроде:
Это практический курс для инженеров и технических продакт-менеджеров. Идеален для тех, кто умеет программировать или «любит кодинг на ощущениях».
Чего ожидать
Вас ждёт интенсивная практика: упражнения, работа с кодом и данными. Мы встречаемся дважды в неделю в течение четырёх недель + выделяем щедрые office hours. Все занятия записываются и будут доступны в асинхронном формате.
Содержание курса
Скачать:
Название: Как оценивать ИИ-системы: курс для инженеров и PM-ов (2025)
[maven] AI Evals For Engineers & PMs (2025)

Научитесь проверенным методикам быстрого улучшения AI-приложений. Стройте системы искусственного интеллекта, которые работают лучше конкурентов - вне зависимости от конкретного сценария использования.
Если при работе с AI у вас возникают вопросы вроде:
- Как тестировать приложения, где результаты вероятностные и требуют субъективной оценки?
- Если я меняю промпт, как убедиться, что ничего другого не сломал?
- На что направить инженерные усилия? Нужно ли тестировать всё?
- Что делать, если нет данных или пользователей - с чего начать?
- Какие метрики отслеживать? Какие инструменты использовать? Какие модели выбрать?
- Можно ли автоматизировать тестирование и оценку? И если да - как этому доверять?
Это практический курс для инженеров и технических продакт-менеджеров. Идеален для тех, кто умеет программировать или «любит кодинг на ощущениях».
Чего ожидать
Вас ждёт интенсивная практика: упражнения, работа с кодом и данными. Мы встречаемся дважды в неделю в течение четырёх недель + выделяем щедрые office hours. Все занятия записываются и будут доступны в асинхронном формате.
Содержание курса
- Основы и жизненный цикл оценки LLM-приложений
- Систематический анализ ошибок
- Построение эффективных метрик и пайплайнов автоматизированной оценки
- Коллаборативные практики и согласование критериев оценки
- Стратегии тестирования для разных архитектур (RAG, пайплайны, мультимодальные системы и др.)
- Мониторинг в продакшене и непрерывная оценка качества
- Организация эффективного процесса human-in-the-loop ревью
- Оптимизация затрат и маршрутизация запросов
- Освоите лучшие инструменты для поиска, диагностики и приоритизации ошибок в AI.
- Узнаете, как использовать синтетические данные до появления пользователей и как максимально эффективно задействовать реальные данные.
- Построите «data flywheel», который гарантирует улучшение вашего AI со временем.
- Научитесь автоматизировать часть процессов оценки и доверять им.
- Сможете настроить AI под ваши предпочтения и требования.
- Избежите распространённых ошибок, накопленных на опыте более 35 AI-проектов.
- Получите практику через end-to-end упражнения, код и разбор реальных кейсов.
Скрытое содержимое доступно для зарегистрированных пользователей!
Скачать:
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.