Об этом курсе

Недавно просмотрено: 44,433
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Средний уровень
Прибл. 13 часов на выполнение
Английский

Чему вы научитесь

  • U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines

  • Use Spark UI to analyze performance and identify bottlenecks

  • Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • B​uild a linear regression model and make predictions using SparkSQL

Приобретаемые навыки

Data ScienceApache SparkSQL
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Средний уровень
Прибл. 13 часов на выполнение
Английский

от партнера

Placeholder

Калифорнийский университет в Девисе

Программа курса: что вы изучите

Неделя
1

Неделя 1

3 ч. на завершение

Introduction to Spark

3 ч. на завершение
6 видео ((всего 32 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
6 видео
Why Distributed Computing?7мин
Spark DataFrames6мин
The Databricks Environment8мин
SQL in Notebooks3мин
Import Data2мин
3 материала для самостоятельного изучения
A Note From UC Davis10мин
Readings and Resources40мин
Assignment #1 - Queries in Spark SQL30мин
2 практических упражнения
Assignment #1 Quiz - Queries in Spark SQL30мин
Module 1 Quiz30мин
Неделя
2

Неделя 2

2 ч. на завершение

Spark Core Concepts

2 ч. на завершение
6 видео ((всего 25 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
6 видео
Spark Terminology3мин
Caching5мин
Shuffle Partitions7мин
Spark UI3мин
Broadcast Joins3мин
2 материала для самостоятельного изучения
Readings30мин
Assignment #2 - Spark Internals30мин
2 практических упражнения
Assignment #2 Quiz - Spark Internals30мин
Module 2 Quiz30мин
Неделя
3

Неделя 3

3 ч. на завершение

Engineering Data Pipelines

3 ч. на завершение
7 видео ((всего 43 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
7 видео
Spark as a Connector6мин
Accessing Data10мин
File Formats8мин
Schemas and Types4мин
Writing Data6мин
Managed and Unmanaged Tables4мин
2 материала для самостоятельного изучения
Readings
Assignment #3 - Engineering Data Pipelines30мин
2 практических упражнения
Assignment #3 Quiz - Engineering Data Pipelines30мин
Module 3 Quiz30мин
Неделя
4

Неделя 4

4 ч. на завершение

Machine Learning Applications of Spark

4 ч. на завершение
7 видео ((всего 35 мин.)), 2 материалов для самостоятельного изучения, 3 тестов
7 видео
Applications of Machine Learning4мин
Machine Learning Fundamentals6мин
Linear Regression6мин
Training Linear Regression Model8мин
Applying Machine Learning with UDFs4мин
Course Summary3мин
2 материала для самостоятельного изучения
Readings
Assignment #4 - Logistic Regression Classifier10мин
2 практических упражнения
Assignment #4 Quiz - Logistic Regression Classifier30мин
Module 4 Quiz30мин

Рецензии

Лучшие отзывы о курсе DISTRIBUTED COMPUTING WITH SPARK SQL

Посмотреть все отзывы

Специализация Learn SQL Basics for Data Science: общие сведения

Learn SQL Basics for Data Science

Часто задаваемые вопросы

Остались вопросы? Посетите Центр поддержки учащихся.