Об этом курсе

Недавно просмотрено: 19,951

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: 4 weeks of study, 2-5 hours/week...

Английский

Субтитры: Английский

Чему вы научитесь

  • Check
    U​se the collaborative Databricks workspace and write SQL code that executes against a cluster of machines
  • Check
    Use Spark UI to analyze performance and identify bottlenecks
  • Check
    Create an end-to-end pipeline that reads data, transforms it, and saves the result
  • Check
    B​uild a linear regression model and make predictions using SparkSQL

Приобретаемые навыки

Data ScienceApache SparkSQL

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: 4 weeks of study, 2-5 hours/week...

Английский

Субтитры: Английский

Программа курса: что вы изучите

Неделя
1

Неделя 1

3 ч. на завершение

Introduction to Spark

3 ч. на завершение
6 видео ((всего 32 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
6 видео
Why Distributed Computing?7мин
Spark DataFrames6мин
The Databricks Environment8мин
SQL in Notebooks3мин
Import Data2мин
3 материала для самостоятельного изучения
A Note From UC Davis10мин
Readings and Resources40мин
Assignment #1 - Queries in Spark SQL30мин
2 практического упражнения
Assignment #1 Quiz - Queries in Spark SQL30мин
Module 1 Quiz30мин
Неделя
2

Неделя 2

2 ч. на завершение

Spark Core Concepts

2 ч. на завершение
6 видео ((всего 25 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
6 видео
Spark Terminology3мин
Caching5мин
Shuffle Partitions7мин
Spark UI3мин
Broadcast Joins3мин
2 материала для самостоятельного изучения
Readings30мин
Assignment #2 - Spark Internals30мин
2 практического упражнения
Assignment #2 Quiz - Spark Internals30мин
Module 2 Quiz30мин
Неделя
3

Неделя 3

3 ч. на завершение

Engineering Data Pipelines

3 ч. на завершение
7 видео ((всего 43 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
7 видео
Spark as a Connector6мин
Accessing Data10мин
File Formats8мин
Schemas and Types4мин
Writing Data6мин
Managed and Unmanaged Tables4мин
2 материала для самостоятельного изучения
Readings
Assignment #3 - Engineering Data Pipelines30мин
2 практического упражнения
Assignment #3 Quiz - Engineering Data Pipelines30мин
Module 3 Quiz30мин
Неделя
4

Неделя 4

5 ч. на завершение

Machine Learning Applications of Spark

5 ч. на завершение
7 видео ((всего 35 мин.)), 2 материалов для самостоятельного изучения, 3 тестов
7 видео
Applications of Machine Learning4мин
Machine Learning Fundamentals6мин
Linear Regression6мин
Training Linear Regression Model8мин
Applying Machine Learning with UDFs4мин
Course Summary3мин
2 материала для самостоятельного изучения
Readings
Assignment #4 - Logistic Regression Classifier10мин
2 практического упражнения
Assignment #4 Quiz - Logistic Regression Classifier30мин
Module 4 Quiz30мин
4.6
Рецензии: 3Chevron Right

Лучшие отзывы о курсе Distributed Computing with Spark SQL

автор: DFeb 12th 2020

This has been an amazing course. What is worth mentioning is how the content was delivered. Nice hands on. Highly recommended for anyone who is new to Spark

автор: JBJan 6th 2020

Extremely informative for those who are seeking to learn the fundamentals for distributed computing using Spark SQL.

Преподаватели

Изображение преподавателя Brooke Wenig

Brooke Wenig 

Machine Learning Practice Lead at Databricks
Continuing and Professional Education
1,334 учащегося
1 курс
Изображение преподавателя Conor Murphy

Conor Murphy 

Data Scientist at Databricks
Continuing and Professional Education
1,334 учащегося
1 курс

от партнера

Логотип Калифорнийский университет в Девисе

Калифорнийский университет в Девисе

Специализация Learn SQL Basics for Data Science: общие сведения

This Specialization is intended for a learner with no previous coding experience seeking to develop SQL query fluency. Through four progressively more difficult SQL projects with data science applications, you will cover topics such as SQL basics, data wrangling, SQL analysis, AB testing, distributed computing using Apache Spark, and more. These topics will prepare you to apply SQL creatively to analyze and explore data; demonstrate efficiency in writing queries; create data analysis datasets; conduct feature engineering, use SQL with other data analysis and machine learning toolsets; and use SQL with unstructured data sets....
Learn SQL Basics for Data Science

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.