Calvin Candie
Вечный
Calvin Candie
Вечный
- 2 Сен 2018
- 36,544
- 1,718
- #1
Голосов: 0
Автор: learndataengineering
Название: Инженерия данных с Hadoop (2025)
[learndataengineering] Data Engineering with Hadoop (2025)
Big Data - это не просто модное слово, а реальное явление. Каждый день компании по всему миру собирают и обрабатывают огромные объёмы данных на высокой скорости. Эти данные часто неструктурированы и несогласованы, что делает их обработку с помощью традиционных методов практически невозможной.
Одной из платформ, зарекомендовавших себя для работы с большими данными, является Apache Hadoop. Это фреймворк с открытым исходным кодом на Java, позволяющий обрабатывать и хранить большие объёмы данных в кластерах, используя простые программные модели. Hadoop - это гибкая, быстрая и доступная архитектура, способная обнаруживать и обрабатывать сбои на уровне приложений.
Что вы изучите
В этом курсе под руководством Суйога Нагаокара вы получите всестороннее понимание архитектуры Hadoop и её компонентов:
Курс подойдёт как новичкам, так и тем, кто хочет углубить свои знания в области Big Data и научиться работать с одним из самых популярных фреймворков в индустрии.
Материал на английском языке
Подробнее:
Скачать:
Название: Инженерия данных с Hadoop (2025)
[learndataengineering] Data Engineering with Hadoop (2025)
Big Data - это не просто модное слово, а реальное явление. Каждый день компании по всему миру собирают и обрабатывают огромные объёмы данных на высокой скорости. Эти данные часто неструктурированы и несогласованы, что делает их обработку с помощью традиционных методов практически невозможной.
Одной из платформ, зарекомендовавших себя для работы с большими данными, является Apache Hadoop. Это фреймворк с открытым исходным кодом на Java, позволяющий обрабатывать и хранить большие объёмы данных в кластерах, используя простые программные модели. Hadoop - это гибкая, быстрая и доступная архитектура, способная обнаруживать и обрабатывать сбои на уровне приложений.
Что вы изучите
В этом курсе под руководством Суйога Нагаокара вы получите всестороннее понимание архитектуры Hadoop и её компонентов:
- HDFS
- YARN
- MapReduce
- Hive
- Sqoop
- Понимать концепцию экосистемы Hadoop
- Использовать основные команды Hadoop
- Реализовывать решения на основе каждого компонента Hadoop для решения реальных бизнес-задач
- Сохранять и запрашивать данные с помощью Sqoop, Hive и MySQL
- Писать запросы Hive для анализа данных на Hadoop
- Работать с кластерами данных с использованием HDFS, MapReduce и YARN
- Управлять кластерами с помощью Hue
- ПК с 64-битной версией Windows или Linux и доступом в интернет
- Не менее 8 ГБ свободной (не общей) оперативной памяти для выполнения практических заданий (если памяти меньше, вы сможете следить за обучением, но без практики)
- Базовые навыки программирования, предпочтительно на Python
- Знакомство с командной строкой Linux будет большим плюсом
Курс подойдёт как новичкам, так и тем, кто хочет углубить свои знания в области Big Data и научиться работать с одним из самых популярных фреймворков в индустрии.
Материал на английском языке
Подробнее:
Скрытое содержимое доступно для зарегистрированных пользователей!
Скачать:
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.