Об этом курсе
3.9
Оценки: 48
Рецензии: 12
Специализация

Курс 3 из 5 в программе

100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Продвинутый уровень

Продвинутый уровень

Часов на завершение

Прибл. 24 часа на выполнение

Предполагаемая нагрузка: 5 weeks of study, 6-8 hours/week...
Доступные языки

Английский

Субтитры: Английский
Специализация

Курс 3 из 5 в программе

100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Продвинутый уровень

Продвинутый уровень

Часов на завершение

Прибл. 24 часа на выполнение

Предполагаемая нагрузка: 5 weeks of study, 6-8 hours/week...
Доступные языки

Английский

Субтитры: Английский

Программа курса: что вы изучите

Неделя
1
Часов на завершение
7 минуты на завершение

Welcome

...
Reading
5 видео ((всего 7 мин.))
Video5 видео
Course Structure1мин
Meet Alexey2мин
Meet Pavel37s
Meet Ilya1мин
Часов на завершение
1 ч. на завершение

(Optional) Machine Learning: Introduction

...
Reading
6 видео ((всего 43 мин.)), 1 материал для самостоятельного изучения
Video6 видео
(Optional) Basic concepts11мин
(Optional) Types of problems and tasks5мин
(Optional) Supervised learning7мин
(Optional) Unsupervised learning6мин
(Optional) Business applications of the machine learning4мин
Reading1 материал для самостоятельного изучения
Slack Channel is the quickest way to get answer to your question10мин
Часов на завершение
5 ч. на завершение

Spark MLLib and Linear Models

...
Reading
11 видео ((всего 94 мин.)), 3 материалов для самостоятельного изучения, 5 тестов
Video11 видео
First example. Linear regression10мин
How MLlib library is arranged10мин
How to train algorithms. Gradient descent method9мин
How to train algorithms. Second order methods8мин
Large scale classification. Logistic regression12мин
Regularization8мин
PCA decomposition9мин
K-means clustering7мин
How to submit your first assignment3мин
How to Install Docker on Windows 7, 8, 104мин
Reading3 материала для самостоятельного изучения
Grading System: Instructions and Common Problems10мин
Docker Installation Guide10мин
Assignments. General requirements10мин
Quiz4 практического упражнения
Large scale machine learning. The beginning14мин
Large scale regression and classification. Detailed analysis10мин
Regularization and Unsupervised Techniques10мин
Spark MLLib and Linear Models18мин
Неделя
2
Часов на завершение
2 ч. на завершение

Machine Learning with Texts & Feature Engineering

...
Reading
12 видео ((всего 70 мин.)), 5 тестов
Video12 видео
Welcome1мин
Feature Engineering for Texts, part 17мин
Feature Engineering for Texts, part 25мин
N-grams4мин
Hashing trick6мин
Categorical Features6мин
Feature Interactions2мин
Spark ML. Feature Engineering for Texts, part 17мин
Spark ML. Feature Engineering for Texts, part 25мин
Spark ML. Categorical Features3мин
Topic Modeling. LDA.7мин
Word2Vec11мин
Quiz5 практического упражнения
Feature Enginering for Texts16мин
Categorical Features & Feature Interactions6мин
Spark ML Tutorial: Text Processing6мин
Advanced Machine Learning with Texts8мин
Machine Learning with Texts & Feature Engineering20мин
Неделя
3
Часов на завершение
6 ч. на завершение

Decision Trees & Ensemble Learning

...
Reading
13 видео ((всего 64 мин.)), 6 тестов
Video13 видео
Welcome1мин
Decision Trees Basics4мин
Decision Trees for Regression6мин
Decision Trees for Classification3мин
Decision Trees: Summary1мин
Bootstrap & Bagging8мин
Random Forest6мин
Gradient Boosted Decision Trees: Intro & Regression7мин
Gradient Boosted Decision Trees: Classification6мин
Stochastic Boosting1мин
Gradient Boosted Decision Trees: Usage Tips & Summary3мин
Spark ML. Decision Trees & Ensembles6мин
Spark ML. Cross-validation3мин
Quiz5 практического упражнения
Decision Trees16мин
Bootstrap, Bagging and Random Forest6мин
Gradient Boosted Decision Trees10мин
Spark ML Programming Tutorial: Decision Trees & CV6мин
Decision Trees & Ensemble Learning16мин
Неделя
4
Часов на завершение
3 ч. на завершение

Recommender Systems

...
Reading
15 видео ((всего 118 мин.)), 1 материал для самостоятельного изучения, 4 тестов
Video15 видео
Recommender Systems, Introduction. Part II4мин
Non-Personalized Recommender Systems9мин
Content-Based Recommender Systems8мин
Recommender System Evaluation10мин
Collaborative Filtering RecSys: User-User and Item-Item10мин
RecSys: SVD I7мин
RecSys: SVD II8мин
RecSys: SVD III5мин
RecSys: MF I7мин
RecSys: MF II6мин
RecSys: iALS I6мин
RecSys: iALS II11мин
RecSys: Hybrid I7мин
RecSys: Hybrid II7мин
Reading1 материал для самостоятельного изучения
Recommender Systems. Spark Assignment10мин
Quiz4 практического упражнения
Basic RecSys for Data Engineers14мин
Moderate RecSys for Data Engineers10мин
Advanced RecSys for Data Engineers4мин
Recommender Systems16мин

Преподавателя

Avatar

Pavel Mezentsev

Senior Data Scientist
PulsePoint inc
Avatar

Alexey A. Dral

Founder and Chief Executive Officer
BigData Team
Avatar

Ilya Trofimov

Principal Data Scientist
Yandex
Avatar

Evgeny Frolov

Data Scientist, PhD Student @Skoltech
Computational and Data Intensive Science and Engineering

О Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

О специализации ''Big Data for Data Engineers'

This specialization is made for people working with data (either small or big). If you are a Data Analyst, Data Scientist, Data Engineer or Data Architect (or you want to become one) — don’t miss the opportunity to expand your knowledge and skills in the field of data engineering and data analysis on the large scale. In four concise courses you will learn the basics of Hadoop, MapReduce, Spark, methods of offline data processing for warehousing, real-time data processing and large-scale machine learning. And Capstone project for you to build and deploy your own Big Data Service (make your portfolio even more competitive). Over the course of the specialization, you will complete progressively harder programming assignments (mostly in Python). Make sure, you have some experience in it. This course will master your skills in designing solutions for common Big Data tasks: - creating batch and real-time data processing pipelines, - doing machine learning at scale, - deploying machine learning models into a production environment — and much more! Join some of best hands-on big data professionals, who know, their job inside-out, to learn the basics, as well as some tricks of the trade, from them. Special thanks to Prof. Mikhail Roytberg (APT dept., MIPT), Oleg Sukhoroslov (PhD, Senior Researcher, IITP RAS), Oleg Ivchenko (APT dept., MIPT), Pavel Akhtyamov (APT dept., MIPT), Vladimir Kuznetsov, Asya Roitberg, Eugene Baulin, Marina Sudarikova....
Big Data for Data Engineers

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.