💻 Программирование [linkedin] Программирование R в науке о данных: разнообразные данные (2022)

  • ОФОРМИТЬ ПОДПИСКУ

Calvin Candie

Вечный

Calvin Candie

Вечный
2 Сен 2018
36,565
1,718
Автор: linkedin
Название: Программирование R в науке о данных: разнообразные данные (2022)

[linkedin] R Programming in Data Science: High Variety Data (2022)

1758024743491.png

В идеальном мире каждый набор данных должен храниться в виде XML-текста с контекстом для каждой части информации. Числа никогда не будут храниться в виде строк. Десятичные значения никогда не будут храниться в экспоненциальном представлении. Строки никогда не будут длиннее 500 символов. Но очевидно, что мы не живем в идеальном мире данных. А большие данные только усугубляют эту проблему. Это проблема разнообразия; данные, поступающие в нескольких форматах. Исследователи данных тратят чрезмерное количество времени на решение этой проблемы, используя умственные способности, которые лучше было бы потратить на важные аналитические задачи. В этом курсе Марк Ниманн-Росс знакомит с проблемой разнообразия данных и демонстрирует, как использовать уникальные возможности R для их решения. Узнайте, как импортировать самые разные данные из Excel в файлы ODS.

Материал на английском языке

Подробнее:
Скрытое содержимое доступно для зарегистрированных пользователей!

Скачать:
 

Похожие темы