Об этом курсе
4.8
Оценки: 1,471
Рецензии: 215
100% online

100% online

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Промежуточный уровень

Часов на завершение

Прибл. 44 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...
Доступные языки

Русский

Субтитры: Русский...

Приобретаемые навыки

Random ForestPython ProgrammingMachine LearningSupervised Learning
100% online

100% online

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Промежуточный уровень

Часов на завершение

Прибл. 44 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...
Доступные языки

Русский

Субтитры: Русский...

Программа курса: что вы изучите

Неделя
1
Часов на завершение
9 ч. на завершение

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
Reading
13 видео (всего 82 мин.), 8 материалов для самостоятельного изучения, 8 тестов
Video13 видео
Как устроена специализация, и зачем ее проходить3мин
МФТИ1мин
Знакомство с машинным обучением11мин
Обучение на размеченных данных5мин
Обучение без учителя5мин
Признаки в машинном обучении8мин
Линейные модели в задачах регрессии9мин
Обучение линейной регрессии6мин
Градиентный спуск для линейной регрессии7мин
Стохастический градиентный спуск4мин
Линейная классификация6мин
Функции потерь в задачах классификации6мин
Reading8 материала для самостоятельного изучения
Формат специализации и получение сертификата10мин
Немного о Yandex10мин
МФТИ10мин
Forum&Chat10мин
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
Quiz6 практического упражнения
Основные термины в машинном обучении6мин
Типы задач в машинном обучении6мин
Машинное обучение: задачи и признаки12мин
Линейная регрессия4мин
Градиентный спуск4мин
Линейные модели8мин
Неделя
2
Часов на завершение
9 ч. на завершение

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
Reading
14 видео (всего 126 мин.), 9 материалов для самостоятельного изучения, 8 тестов
Video14 видео
Регуляризация7мин
Оценивание качества алгоритмов7мин
Сравнение алгоритмов и выбор гиперпараметров4мин
Метрики качества в задачах регрессии10мин
Метрики качества классификации4мин
Точность и полнота8мин
Объединение точности и полноты5мин
Качество оценок принадлежности классу12мин
Встроенные датасеты. Sklearn.datasets15мин
Кросс-валидация. Sklearn.cross_validation9мин
Линейные модели. Sklearn.linear_model. Классификация10мин
Линейные модели. Sklearn.linear_model. Регрессия7мин
Метрики качества. Sklearn.metrics13мин
Reading9 материала для самостоятельного изучения
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
Встроенные датасеты. Sklearn.datasets (ipython notebook)10мин
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10мин
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10мин
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10мин
Метрики качества. Sklearn.metrics (ipython notebook)10мин
Quiz6 практического упражнения
Проблема переобучения6мин
Проблема переобучения и борьба с ней10мин
Как измерить качество алгоритма?6мин
Метрики качества10мин
Встроенные датасеты и кросс-валидация8мин
Введение в scikit-learn10мин
Неделя
3
Часов на завершение
7 ч. на завершение

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
Reading
14 видео (всего 97 мин.), 8 материалов для самостоятельного изучения, 7 тестов
Video14 видео
Метод максимального правдоподобия4мин
Регрессия как максимизация правдоподобия2мин
Регрессия как оценка среднего4мин
Регуляризация8мин
Задача оценивания вероятностей и логистическая регрессия8мин
Масштабирование признаков6мин
Спрямляющие пространства5мин
Работа с категориальными признаками4мин
Несбалансированные данные5мин
Многоклассовая классификация4мин
Подбор параметров по сетке. Sklearn.grid_search9мин
Задача: bike sharing demand15мин
Задача: bike sharing demand. Продолжение13мин
Reading8 материала для самостоятельного изучения
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10мин
Задача Bike Sharing Demand (ipython notebook)10мин
Задача Bike Sharing Demand. Продолжение (ipython notebook)10мин
Практика Machine Learning10мин
Quiz6 практического упражнения
Метод максимального правдоподобия6мин
Линейные модели: статистический взгляд14мин
Линейные модели: подготовка признаков6мин
Линейные модели: практические аспекты6мин
Подбор параметров по сетке6мин
Анализ данных в scikit-learn12мин
Неделя
4
Часов на завершение
10 ч. на завершение

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
Reading
17 видео (всего 114 мин.), 10 материалов для самостоятельного изучения, 8 тестов
Video17 видео
Обучение решающих деревьев6мин
Критерии информативности7мин
Критерии останова и стрижка деревьев4мин
Решающие деревья и категориальные признаки8мин
Решающие деревья в sklearn10мин
Композиции деревьев6мин
Смещение и разброс9мин
Случайные леса6мин
Трюки со случайными лесами4мин
Случайные леса в sklearn7мин
Композиции простых алгоритмов5мин
Градиентный бустинг7мин
Борьба с переобучением в градиентном бустинге6мин
Градиентный бустинг для регрессии и классификации4мин
Градиентный бустинг над решающими деревьями5мин
Градиентный бустинг в XGBoost5мин
Reading10 материала для самостоятельного изучения
Решающие деревья в sklearn (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
Случайные леса в sklearn (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
XGBoost10мин
Градиентный бустинг в XGBoost (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
Quiz6 практического упражнения
Построение решающих деревьев8мин
Решающие деревья14мин
Бэггинг6мин
Композиции и случайные леса8мин
Обучение композиций и градиентный бустинг4мин
Градиентный бустинг: обучение и практические аспекты8мин
4.8
Формирование карьерного пути

71%

начал новую карьеру, пройдя эти курсы
Карьерные преимущества

83%

получил значимые преимущества в карьере благодаря этому курсу
Продвижение по карьерной лестнице

33%

стал больше зарабатывать или получил повышение

Лучшие рецензии

автор: ADApr 29th 2018

Хороший курс, много времени уделено объяснению теории. На мой взгляд - лучше параллельно читать с "The elements of statistical learning", там некоторые моменты подробнее объясняются.

автор: STJul 23rd 2017

Relatively good course with diversity of material, almost all easy to understand(except into bayes theory for those who haven't got some theory at uni), best regards to tutors.

Преподавателя

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

О Moscow Institute of Physics and Technology

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

О Yandex

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

О специализации ''Машинное обучение и анализ данных'

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.