Об этом курсе
Недавно просмотрено: 188,008

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Продвинутый уровень

Английский

Субтитры: Английский, Корейский

Приобретаемые навыки

Data AnalysisFeature ExtractionFeature EngineeringXgboost

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Продвинутый уровень

Английский

Субтитры: Английский, Корейский

Программа курса: что вы изучите

Неделя
1
6 ч. на завершение

Introduction & Recap

This week we will introduce you to competitive data science. You will learn about competitions' mechanics, the difference between competitions and a real life data science, hardware and software that people usually use in competitions. We will also briefly recap major ML models frequently used in competitions.

...
8 видео ((всего 46 мин.)), 7 материалов для самостоятельного изучения, 6 тестов
8 видео
Meet your lecturers2мин
Course overview7мин
Competition Mechanics6мин
Kaggle Overview [screencast]7мин
Real World Application vs Competitions5мин
Recap of main ML algorithms9мин
Software/Hardware Requirements5мин
7 материала для самостоятельного изучения
Welcome!10мин
Week 1 overview10мин
Disclaimer10мин
Explanation for quiz questions10мин
Additional Materials and Links10мин
Explanation for quiz questions10мин
Additional Material and Links10мин
5 практического упражнения
Practice Quiz8мин
Recap8мин
Recap12мин
Software/Hardware6мин
Graded Soft/Hard Quiz8мин
2 ч. на завершение

Feature Preprocessing and Generation with Respect to Models

In this module we will summarize approaches to work with features: preprocessing, generation and extraction. We will see, that the choice of the machine learning model impacts both preprocessing we apply to the features and our approach to generation of new ones. We will also discuss feature extraction from text with Bag Of Words and Word2vec, and feature extraction from images with Convolution Neural Networks.

...
7 видео ((всего 73 мин.)), 4 материалов для самостоятельного изучения, 4 тестов
7 видео
Overview6мин
Numeric features13мин
Categorical and ordinal features10мин
Datetime and coordinates8мин
Handling missing values10мин
Bag of words10мин
Word2vec, CNN13мин
4 материала для самостоятельного изучения
Explanation for quiz questions10мин
Additional Material and Links10мин
Explanation for quiz questions10мин
Additional Material and Links10мин
4 практического упражнения
Feature preprocessing and generation with respect to models8мин
Feature preprocessing and generation with respect to models8мин
Feature extraction from text and images8мин
Feature extraction from text and images8мин
1 ч. на завершение

Final Project Description

This is just a reminder, that the final project in this course is better to start soon! The final project is in fact a competition, in this module you can find an information about it.

...
1 видео ((всего 4 мин.)), 2 материалов для самостоятельного изучения
1 видео
2 материала для самостоятельного изучения
Final project10мин
Final project advice #110мин
Неделя
2
2 ч. на завершение

Exploratory Data Analysis

We will start this week with Exploratory Data Analysis (EDA). It is a very broad and exciting topic and an essential component of solving process. Besides regular videos you will find a walk through EDA process for Springleaf competition data and an example of prolific EDA for NumerAI competition with extraordinary findings.

...
8 видео ((всего 80 мин.)), 2 материалов для самостоятельного изучения, 1 тест
8 видео
Building intuition about the data6мин
Exploring anonymized data15мин
Visualizations11мин
Dataset cleaning and other things to check7мин
Springleaf competition EDA I8мин
Springleaf competition EDA II16мин
Numerai competition EDA6мин
2 материала для самостоятельного изучения
Week 2 overview10мин
Additional material and links10мин
1 практическое упражнение
Exploratory data analysis12мин
2 ч. на завершение

Validation

In this module we will discuss various validation strategies. We will see that the strategy we choose depends on the competition setup and that correct validation scheme is one of the bricks for any winning solution.

...
4 видео ((всего 51 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
4 видео
Validation strategies7мин
Data splitting strategies14мин
Problems occurring during validation20мин
3 материала для самостоятельного изучения
Validation strategies10мин
Comments on quiz10мин
Additional material and links10мин
2 практического упражнения
Validation8мин
Validation8мин
5 ч. на завершение

Data Leakages

Finally, in this module we will cover something very unique to data science competitions. That is, we will see examples how it is sometimes possible to get a top position in a competition with a very little machine learning, just by exploiting a data leakage.

...
3 видео ((всего 26 мин.)), 3 материалов для самостоятельного изучения, 3 тестов
3 видео
Leaderboard probing and examples of rare data leaks9мин
Expedia challenge9мин
3 материала для самостоятельного изучения
Comments on quiz10мин
Additional material and links10мин
Final project advice #210мин
1 практическое упражнение
Data leakages8мин
Неделя
3
3 ч. на завершение

Metrics Optimization

This week we will first study another component of the competitions: the evaluation metrics. We will recap the most prominent ones and then see, how we can efficiently optimize a metric given in a competition.

...
8 видео ((всего 83 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
8 видео
Motivation8мин
Regression metrics review I14мин
Regression metrics review II8мин
Classification metrics review20мин
General approaches for metrics optimization6мин
Regression metrics optimization10мин
Classification metrics optimization I7мин
Classification metrics optimization II6мин
3 материала для самостоятельного изучения
Week 3 overview10мин
Comments on quiz10мин
Additional material and links10мин
2 практического упражнения
Metrics12мин
Metrics12мин
4 ч. на завершение

Advanced Feature Engineering I

In this module we will study a very powerful technique for feature generation. It has a lot of names, but here we call it "mean encodings". We will see the intuition behind them, how to construct them, regularize and extend them.

...
3 видео ((всего 27 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
3 видео
Regularization7мин
Extensions and generalizations10мин
2 материала для самостоятельного изучения
Comments on quiz10мин
Final project advice #310мин
1 практическое упражнение
Mean encodings8мин
Неделя
4
3 ч. на завершение

Hyperparameter Optimization

In this module we will talk about hyperparameter optimization process. We will also have a special video with practical tips and tricks, recorded by four instructors.

...
6 видео ((всего 86 мин.)), 4 материалов для самостоятельного изучения, 2 тестов
6 видео
Hyperparameter tuning II12мин
Hyperparameter tuning III13мин
Practical guide16мин
KazAnova's competition pipeline, part 118мин
KazAnova's competition pipeline, part 217мин
4 материала для самостоятельного изучения
Week 4 overview10мин
Comments on quiz10мин
Additional material and links10мин
Additional materials and links10мин
2 практического упражнения
Practice quiz6мин
Graded quiz8мин
4 ч. на завершение

Advanced feature engineering II

In this module we will learn about a few more advanced feature engineering techniques.

...
4 видео ((всего 22 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
4 видео
Matrix factorizations6мин
Feature Interactions5мин
t-SNE5мин
2 материала для самостоятельного изучения
Comments on quiz10мин
Additional Materials and Links10мин
1 практическое упражнение
Graded Advanced Features II Quiz12мин
10 ч. на завершение

Ensembling

Nowadays it is hard to find a competition won by a single model! Every winning solution incorporates ensembles of models. In this module we will talk about the main ensembling techniques in general, and, of course, how it is better to ensemble the models in practice.

...
8 видео ((всего 92 мин.)), 4 материалов для самостоятельного изучения, 4 тестов
8 видео
Bagging9мин
Boosting16мин
Stacking16мин
StackNet14мин
Ensembling Tips and Tricks14мин
CatBoost 17мин
CatBoost 27мин
4 материала для самостоятельного изучения
Validation schemes for 2-nd level models10мин
Comments on quiz10мин
Additional materials and links10мин
Final project advice #410мин
2 практического упражнения
Ensembling8мин
Ensembling12мин
4.7
Рецензии: 132Chevron Right

17%

начал новую карьеру, пройдя эти курсы

25%

получил значимые преимущества в карьере благодаря этому курсу

20%

стал больше зарабатывать или получил повышение

Лучшие отзывы о курсе How to Win a Data Science Competition: Learn from Top Kagglers

автор: MSMar 29th 2018

Top Kagglers gently introduce one to Data Science Competitions. One will have a great chance to learn various tips and tricks and apply them in practice throughout the course. Highly recommended!

автор: GWFeb 19th 2019

Really excellent. Very practical advice from top competitors. This specialization is much more information-dense than most machine learning MOOCs. You really get your money's worth.

Преподаватели

Avatar

Dmitry Ulyanov

Visiting lecturer
HSE Faculty of Computer Science
Avatar

Alexander Guschin

Visiting lecturer at HSE, Lecturer at MIPT
HSE Faculty of Computer Science
Avatar

Mikhail Trofimov

Visiting lecturer
HSE Faculty of Computer Science
Avatar

Dmitry Altukhov

Visiting lecturer
HSE Faculty of Computer Science
Avatar

Marios Michailidis

Research Data Scientist
H2O.ai

О Национальный исследовательский университет "Высшая школа экономики"

National Research University - Higher School of Economics (HSE) is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communicamathematics, engineering, and more. Learn more on www.hse.ru...

О специализации ''Продвинутое машинное обучение'

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
Продвинутое машинное обучение

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.