Об этом курсе
4.7
Оценки: 408
Рецензии: 88
Специализация

Курс 2 из 7 в программе

100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Продвинутый уровень

Продвинутый уровень

Часов на завершение

Прибл. 47 часа на выполнение

Предполагаемая нагрузка: 6-10 hours/week...
Доступные языки

Английский

Субтитры: Английский

Приобретаемые навыки

Data AnalysisFeature ExtractionFeature EngineeringXgboost
Специализация

Курс 2 из 7 в программе

100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Продвинутый уровень

Продвинутый уровень

Часов на завершение

Прибл. 47 часа на выполнение

Предполагаемая нагрузка: 6-10 hours/week...
Доступные языки

Английский

Субтитры: Английский

Программа курса: что вы изучите

Неделя
1
Часов на завершение
6 ч. на завершение

Introduction & Recap

This week we will introduce you to competitive data science. You will learn about competitions' mechanics, the difference between competitions and a real life data science, hardware and software that people usually use in competitions. We will also briefly recap major ML models frequently used in competitions....
Reading
8 видео ((всего 46 мин.)), 7 материалов для самостоятельного изучения, 6 тестов
Video8 видео
Meet your lecturers2мин
Course overview7мин
Competition Mechanics6мин
Kaggle Overview [screencast]7мин
Real World Application vs Competitions5мин
Recap of main ML algorithms9мин
Software/Hardware Requirements5мин
Reading7 материала для самостоятельного изучения
Welcome!10мин
Week 1 overview10мин
Disclaimer10мин
Explanation for quiz questions10мин
Additional Materials and Links10мин
Explanation for quiz questions10мин
Additional Material and Links10мин
Quiz5 практического упражнения
Practice Quiz8мин
Recap8мин
Recap12мин
Software/Hardware6мин
Graded Soft/Hard Quiz8мин
Часов на завершение
2 ч. на завершение

Feature Preprocessing and Generation with Respect to Models

In this module we will summarize approaches to work with features: preprocessing, generation and extraction. We will see, that the choice of the machine learning model impacts both preprocessing we apply to the features and our approach to generation of new ones. We will also discuss feature extraction from text with Bag Of Words and Word2vec, and feature extraction from images with Convolution Neural Networks....
Reading
7 видео ((всего 73 мин.)), 4 материалов для самостоятельного изучения, 4 тестов
Video7 видео
Overview6мин
Numeric features13мин
Categorical and ordinal features10мин
Datetime and coordinates8мин
Handling missing values10мин
Bag of words10мин
Word2vec, CNN13мин
Reading4 материала для самостоятельного изучения
Explanation for quiz questions10мин
Additional Material and Links10мин
Explanation for quiz questions10мин
Additional Material and Links10мин
Quiz4 практического упражнения
Feature preprocessing and generation with respect to models8мин
Feature preprocessing and generation with respect to models8мин
Feature extraction from text and images8мин
Feature extraction from text and images8мин
Часов на завершение
29 минуты на завершение

Final Project Description

This is just a reminder, that the final project in this course is better to start soon! The final project is in fact a competition, in this module you can find an information about it....
Reading
1 видео ((всего 4 мин.)), 2 материалов для самостоятельного изучения
Video1 видео
Reading2 материала для самостоятельного изучения
Final project10мин
Final project advice #110мин
Неделя
2
Часов на завершение
2 ч. на завершение

Exploratory Data Analysis

We will start this week with Exploratory Data Analysis (EDA). It is a very broad and exciting topic and an essential component of solving process. Besides regular videos you will find a walk through EDA process for Springleaf competition data and an example of prolific EDA for NumerAI competition with extraordinary findings....
Reading
8 видео ((всего 80 мин.)), 2 материалов для самостоятельного изучения, 1 тест
Video8 видео
Building intuition about the data6мин
Exploring anonymized data15мин
Visualizations11мин
Dataset cleaning and other things to check7мин
Springleaf competition EDA I8мин
Springleaf competition EDA II16мин
Numerai competition EDA6мин
Reading2 материала для самостоятельного изучения
Week 2 overview10мин
Additional material and links10мин
Quiz1 практическое упражнение
Exploratory data analysis12мин
Часов на завершение
2 ч. на завершение

Validation

In this module we will discuss various validation strategies. We will see that the strategy we choose depends on the competition setup and that correct validation scheme is one of the bricks for any winning solution. ...
Reading
4 видео ((всего 51 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
Video4 видео
Validation strategies7мин
Data splitting strategies14мин
Problems occurring during validation20мин
Reading3 материала для самостоятельного изучения
Validation strategies10мин
Comments on quiz10мин
Additional material and links10мин
Quiz2 практического упражнения
Validation8мин
Validation8мин
Часов на завершение
5 ч. на завершение

Data Leakages

Finally, in this module we will cover something very unique to data science competitions. That is, we will see examples how it is sometimes possible to get a top position in a competition with a very little machine learning, just by exploiting a data leakage. ...
Reading
3 видео ((всего 26 мин.)), 3 материалов для самостоятельного изучения, 3 тестов
Video3 видео
Leaderboard probing and examples of rare data leaks9мин
Expedia challenge9мин
Reading3 материала для самостоятельного изучения
Comments on quiz10мин
Additional material and links10мин
Final project advice #210мин
Quiz1 практическое упражнение
Data leakages8мин
Неделя
3
Часов на завершение
3 ч. на завершение

Metrics Optimization

This week we will first study another component of the competitions: the evaluation metrics. We will recap the most prominent ones and then see, how we can efficiently optimize a metric given in a competition....
Reading
8 видео ((всего 83 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
Video8 видео
Motivation8мин
Regression metrics review I14мин
Regression metrics review II8мин
Classification metrics review20мин
General approaches for metrics optimization6мин
Regression metrics optimization10мин
Classification metrics optimization I7мин
Classification metrics optimization II6мин
Reading3 материала для самостоятельного изучения
Week 3 overview10мин
Comments on quiz10мин
Additional material and links10мин
Quiz2 практического упражнения
Metrics12мин
Metrics12мин
Часов на завершение
4 ч. на завершение

Advanced Feature Engineering I

In this module we will study a very powerful technique for feature generation. It has a lot of names, but here we call it "mean encodings". We will see the intuition behind them, how to construct them, regularize and extend them. ...
Reading
3 видео ((всего 27 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
Video3 видео
Regularization7мин
Extensions and generalizations10мин
Reading2 материала для самостоятельного изучения
Comments on quiz10мин
Final project advice #310мин
Quiz1 практическое упражнение
Mean encodings8мин
Неделя
4
Часов на завершение
3 ч. на завершение

Hyperparameter Optimization

In this module we will talk about hyperparameter optimization process. We will also have a special video with practical tips and tricks, recorded by four instructors....
Reading
6 видео ((всего 86 мин.)), 4 материалов для самостоятельного изучения, 2 тестов
Video6 видео
Hyperparameter tuning II12мин
Hyperparameter tuning III13мин
Practical guide16мин
KazAnova's competition pipeline, part 118мин
KazAnova's competition pipeline, part 217мин
Reading4 материала для самостоятельного изучения
Week 4 overview10мин
Comments on quiz10мин
Additional material and links10мин
Additional materials and links10мин
Quiz2 практического упражнения
Practice quiz6мин
Graded quiz8мин
Часов на завершение
4 ч. на завершение

Advanced feature engineering II

In this module we will learn about a few more advanced feature engineering techniques....
Reading
4 видео ((всего 22 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
Video4 видео
Matrix factorizations6мин
Feature Interactions5мин
t-SNE5мин
Reading2 материала для самостоятельного изучения
Comments on quiz10мин
Additional Materials and Links10мин
Quiz1 практическое упражнение
Graded Advanced Features II Quiz12мин
Часов на завершение
10 ч. на завершение

Ensembling

Nowadays it is hard to find a competition won by a single model! Every winning solution incorporates ensembles of models. In this module we will talk about the main ensembling techniques in general, and, of course, how it is better to ensemble the models in practice. ...
Reading
8 видео ((всего 92 мин.)), 4 материалов для самостоятельного изучения, 4 тестов
Video8 видео
Bagging9мин
Boosting16мин
Stacking16мин
StackNet14мин
Ensembling Tips and Tricks14мин
CatBoost 17мин
CatBoost 27мин
Reading4 материала для самостоятельного изучения
Validation schemes for 2-nd level models10мин
Comments on quiz10мин
Additional materials and links10мин
Final project advice #410мин
Quiz2 практического упражнения
Ensembling8мин
Ensembling12мин
4.7
Рецензии: 88Chevron Right
Формирование карьерного пути

33%

начал новую карьеру, пройдя эти курсы
Карьерные преимущества

25%

получил значимые преимущества в карьере благодаря этому курсу

Лучшие рецензии

автор: MSMar 29th 2018

Top Kagglers gently introduce one to Data Science Competitions. One will have a great chance to learn various tips and tricks and apply them in practice throughout the course. Highly recommended!

автор: MMNov 10th 2017

This course is fantastic. It's chock full of practical information that is presented clearly and concisely. I would like to thank the team for sharing their knowledge so generously.

Преподавателя

Avatar

Dmitry Ulyanov

Visiting lecturer
HSE Faculty of Computer Science
Avatar

Alexander Guschin

Visiting lecturer at HSE, Lecturer at MIPT
HSE Faculty of Computer Science
Avatar

Mikhail Trofimov

Visiting lecturer
HSE Faculty of Computer Science
Avatar

Dmitry Altukhov

Visiting lecturer
HSE Faculty of Computer Science
Avatar

Marios Michailidis

Research Data Scientist
H2O.ai

О National Research University Higher School of Economics

National Research University - Higher School of Economics (HSE) is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communications, IT, mathematics, engineering, and more. Learn more on www.hse.ru...

О специализации ''Advanced Machine Learning'

This specialization gives an introduction to deep learning, reinforcement learning, natural language understanding, computer vision and Bayesian methods. Top Kaggle machine learning practitioners and CERN scientists will share their experience of solving real-world problems and help you to fill the gaps between theory and practice. Upon completion of 7 courses you will be able to apply modern machine learning methods in enterprise and understand the caveats of real-world data and settings....
Advanced Machine Learning

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.