💻 Программирование [learndataengineering] Инженерия данных с Hadoop (2025)

  • ОФОРМИТЬ ПОДПИСКУ

Calvin Candie

Вечный

Calvin Candie

Вечный
2 Сен 2018
36,558
1,718
Автор: learndataengineering
Название: Инженерия данных с Hadoop (2025)

[learndataengineering] Data Engineering with Hadoop (2025)

Big Data - это не просто модное слово, а реальное явление. Каждый день компании по всему миру собирают и обрабатывают огромные объёмы данных на высокой скорости. Эти данные часто неструктурированы и несогласованы, что делает их обработку с помощью традиционных методов практически невозможной.
Одной из платформ, зарекомендовавших себя для работы с большими данными, является Apache Hadoop. Это фреймворк с открытым исходным кодом на Java, позволяющий обрабатывать и хранить большие объёмы данных в кластерах, используя простые программные модели. Hadoop - это гибкая, быстрая и доступная архитектура, способная обнаруживать и обрабатывать сбои на уровне приложений.
Что вы изучите
В этом курсе под руководством Суйога Нагаокара вы получите всестороннее понимание архитектуры Hadoop и её компонентов:
  • HDFS
  • YARN
  • MapReduce
  • Hive
  • Sqoop
Курс включает теоретическую базу и практические лабораторные занятия. Вы научитесь:
  • Понимать концепцию экосистемы Hadoop
  • Использовать основные команды Hadoop
  • Реализовывать решения на основе каждого компонента Hadoop для решения реальных бизнес-задач
Вы установите и настроите полноценную среду Hadoop с помощью Cloudera Quickstart VM прямо на своём компьютере. На практике вы научитесь:
  • Сохранять и запрашивать данные с помощью Sqoop, Hive и MySQL
  • Писать запросы Hive для анализа данных на Hadoop
  • Работать с кластерами данных с использованием HDFS, MapReduce и YARN
  • Управлять кластерами с помощью Hue
Требования
  • ПК с 64-битной версией Windows или Linux и доступом в интернет
  • Не менее 8 ГБ свободной (не общей) оперативной памяти для выполнения практических заданий (если памяти меньше, вы сможете следить за обучением, но без практики)
  • Базовые навыки программирования, предпочтительно на Python
  • Знакомство с командной строкой Linux будет большим плюсом

Курс подойдёт как новичкам, так и тем, кто хочет углубить свои знания в области Big Data и научиться работать с одним из самых популярных фреймворков в индустрии.

Материал на английском языке

Подробнее:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скачать:
 

Похожие темы