Calvin Candie
Вечный
Calvin Candie
Вечный
- 2 Сен 2018
- 36,544
- 1,718
- #1
Голосов: 0
Автор: learndataengineering
Название: Современные хранилища данных и Data Lakes (2025)
[learndataengineering] Modern Data Warehouses & Data Lakes (2025)
В роли инженера данных вы будете регулярно работать с аналитическими платформами, где компании хранят данные в Data Lakes и Data Warehouses для построения визуализаций и создания моделей машинного обучения.
Современные хранилища данных, такие как AWS Redshift, Google BigQuery и Snowflake, позволяют загружать данные напрямую из файлов в Data Lake. Эта интеграция делает работу с хранилищами гибкой и удобной для аналитических задач.
В этом курсе вы научитесь:
Этот курс поможет вам освоить современные подходы к построению систем хранения и обработки данных и научиться эффективно использовать возможности Data Lakes и Data Warehouses для аналитики.
Материал на английском языке
Подробнее:
Скачать:
Название: Современные хранилища данных и Data Lakes (2025)
[learndataengineering] Modern Data Warehouses & Data Lakes (2025)
В роли инженера данных вы будете регулярно работать с аналитическими платформами, где компании хранят данные в Data Lakes и Data Warehouses для построения визуализаций и создания моделей машинного обучения.
Современные хранилища данных, такие как AWS Redshift, Google BigQuery и Snowflake, позволяют загружать данные напрямую из файлов в Data Lake. Эта интеграция делает работу с хранилищами гибкой и удобной для аналитических задач.
В этом курсе вы научитесь:
- Как использовать Data Lakes, Data Warehouses и BI-инструменты в единой системе
- Как загружать данные в Data Lakes и визуализировать их в отчётах
- Как строить интеграции в Google Cloud Platform и AWS
- Как работает архитектура ETL/ELT и как её применять в современных хранилищах данных
- Роль хранилищ данных в аналитических платформах
- Как данные загружаются в Data Warehouse через ETL/ELT
- Что такое Data Lakes и как их использовать
- Как работать с файлами напрямую в озере данных
- Настройка Cloud Storage, создание таблицы в BigQuery
- Визуализация данных в Data Studio
- Понимание общих принципов работы облачных платформ
- Создание интеграции данных через S3, Athena и Quicksight
- Настройка Glue Data Catalog для управления данными
- Подробная настройка и интеграция Glue
- Подведение итогов курса
- Дополнительный модуль по работе с Redshift Spectrum, используя подготовленный Data Catalog из AWS-проекта
- Основы работы с Data Warehouses (рекомендуется пройти курс «Хранилища данных» в академии)
- Базовые знания AWS Athena и Redshift (для блока с Redshift Spectrum используется подготовленный Data Catalog из проекта AWS)
Этот курс поможет вам освоить современные подходы к построению систем хранения и обработки данных и научиться эффективно использовать возможности Data Lakes и Data Warehouses для аналитики.
Материал на английском языке
Подробнее:
Скрытое содержимое доступно для зарегистрированных пользователей!
Скачать:
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.