💻 Программирование [balun.courses - Виталий Лихачев] Observability, как в BigTech (2025)

  • ОФОРМИТЬ ПОДПИСКУ

Calvin Candie

Вечный

Calvin Candie

Вечный
2 Сен 2018
36,565
1,719
Автор: balun.courses - Виталий Лихачев
Название: Observability, как в BigTech (2025)

1748343023321.png

Глубокий курс о том, как поставлять логи, метрики, трейсы, делать информативные дашборды, быстро устранять инциденты и правильно интерпретировать данные

Вопросы, на которые ответит курс
  • Как правильно строить дашборды, алерты и как интерпретировать данные на уровне Senior’ов и TeamLead'ов
  • Как строить полезные метрики, которые не расходуют лишние ресурсы на хранение
  • Как писать логи, в которых потом легко разобраться
  • Как правильно оценить нагрузку для новой фичи или сервиса и уменьшить количество инцидентов
  • Как найти причину инцидента за пару минут и всегда держать руку на пульсе
  • Как с помощью Observability экономить деньги работодателю, показывать бизнес-метрики и повышать себе ЗП на perfomance review
За 2,5 месяца изучаем best practices, которые используют в BigTech
Глубоко изучишь основы и лучшие практики Observability: метрики, логи, трейсы и многое другое
Научишься инструментировать любые сервисы для достижения хорошего observability
Научишься эксплуатировать сервисы: настройка, масштабирование и оптимизация инфраструктуры для сбора метрик, настройка хранилищ и систем алертинга
Построишь эффективные и не перегруженные дашборды для мониторинга состояния системы и приложений
Научишься управлять стабильностью системы и предсказывать ее поведение
Изучишь все плюсы и минусы Prometheus, Grafana Loki, Jaeger и поймешь, что и когда нужно использовать

Программа курса
  • Урок 1. Введение в Observability
  • Урок 2. Метрики: основные концепции и работа с ними
  • Урок 3. Хранилища метрик и их выбор
  • Урок 4. Визуализация и управление метриками
  • Урок 5. Логирование и структурированные логи
  • Урок 6. Трейсинг
  • Урок 7. Оптимизация наблюдаемости и оптимизация сервисов
  • Урок 8. Управление алертингом
  • Урок 9. Использование метрик для управления поведением приложения
  • Урок 10. Observability как часть SRE — практики и проблемы эксплуатации
  • Урок 11. Стратегии для больших систем
Внимание: материал неполный. Обновления будут добавляться по мере выхода.
Подробнее:

Скрытое содержимое доступно для зарегистрированных пользователей!

Скачать:
 
Последнее редактирование:

Похожие темы