Об этом курсе
4.8
Оценки: 1,809
Рецензии: 249

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 43 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...

Русский

Субтитры: Русский

Приобретаемые навыки

Random ForestPython ProgrammingMachine LearningSupervised Learning

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 43 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...

Русский

Субтитры: Русский

Программа курса: что вы изучите

Неделя
1
9 ч. на завершение

Машинное обучение и линейные модели

Добро пожаловать на курс "Обучение на размеченных данных"! В этом модуле вы узнаете, что такое машинное обучение, какие в нём бывают постановки задачи, и что особенного в обучении на размеченных данных. Затем вы изучите один из основных способов решения задач обучения на размеченных данных — предсказание с помощью линейных моделей. Мы обсудим, как их настраивать и применять в задачах регрессии и классификации. В практических заданиях вы поработаете с настоящими данными и узнаете, какие проблемы в них можно обнаружить, а также попробуете делать прогнозы при помощи линейных моделей....
13 видео ((всего 82 мин.)), 8 материалов для самостоятельного изучения, 8 тестов
13 видео
Как устроена специализация, и зачем ее проходить3мин
МФТИ1мин
Знакомство с машинным обучением11мин
Обучение на размеченных данных5мин
Обучение без учителя5мин
Признаки в машинном обучении8мин
Линейные модели в задачах регрессии9мин
Обучение линейной регрессии6мин
Градиентный спуск для линейной регрессии7мин
Стохастический градиентный спуск4мин
Линейная классификация6мин
Функции потерь в задачах классификации6мин
8 материала для самостоятельного изучения
Формат специализации и получение сертификата10мин
Немного о Yandex10мин
МФТИ10мин
Forum&Chat10мин
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
6 практического упражнения
Основные термины в машинном обучении6мин
Типы задач в машинном обучении6мин
Машинное обучение: задачи и признаки12мин
Линейная регрессия4мин
Градиентный спуск4мин
Линейные модели8мин
Неделя
2
9 ч. на завершение

Борьба с переобучением и оценивание качества

Вторая неделя нашего курса будет посвящена общим вопросам, с которыми приходится столкнуться в любой задаче анализа данных. Вы узнаете, что такое проблема переобучения, из-за чего она возникает, как её можно обнаружить и как с ней бороться — в частности, вы познакомитесь с кросс-валидацией, с помощью которой можно оценить способность алгоритма давать хорошие предсказания на новых данных. Далее речь пойдёт о метриках качества — без них невозможно понять, подходит ли алгоритм для решения той или иной задачи. Наконец, вы познакомитесь с библиотекой scikit-learn, которая является одним из основных инструментов современных специалистов по анализу данных....
14 видео ((всего 126 мин.)), 9 материалов для самостоятельного изучения, 8 тестов
14 видео
Регуляризация7мин
Оценивание качества алгоритмов7мин
Сравнение алгоритмов и выбор гиперпараметров4мин
Метрики качества в задачах регрессии10мин
Метрики качества классификации4мин
Точность и полнота8мин
Объединение точности и полноты5мин
Качество оценок принадлежности классу12мин
Встроенные датасеты. Sklearn.datasets15мин
Кросс-валидация. Sklearn.cross_validation9мин
Линейные модели. Sklearn.linear_model. Классификация10мин
Линейные модели. Sklearn.linear_model. Регрессия7мин
Метрики качества. Sklearn.metrics13мин
9 материала для самостоятельного изучения
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
Встроенные датасеты. Sklearn.datasets (ipython notebook)10мин
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10мин
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10мин
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10мин
Метрики качества. Sklearn.metrics (ipython notebook)10мин
6 практического упражнения
Проблема переобучения6мин
Проблема переобучения и борьба с ней10мин
Как измерить качество алгоритма?6мин
Метрики качества10мин
Встроенные датасеты и кросс-валидация8мин
Введение в scikit-learn10мин
Неделя
3
7 ч. на завершение

Линейные модели: классификация и практические аспекты

Добро пожаловать на третью неделю курса! Вы уже поработали с линейными моделями, научились измерять их качество и устранять переобучение с помощью регуляризации. Пришло время разобраться, почему регуляризация действительно помогает уменьшить сложность модели или произвести отбор признаков — об этом пойдёт речь в первом уроке. Там же вы познакомитесь с логистической регрессией, которая является одним из наиболее популярных методов для решения задач классификации. Далее вы узнаете о некоторых важных нюансах работы с линейными моделями: масштабировании признаков, переходе в новые признаковые пространства и т.д. Мы не только расскажем обо всём этом, но и покажем, как оно работает в Python и библиотеке scikit-learn....
14 видео ((всего 97 мин.)), 7 материалов для самостоятельного изучения, 7 тестов
14 видео
Метод максимального правдоподобия4мин
Регрессия как максимизация правдоподобия2мин
Регрессия как оценка среднего4мин
Регуляризация8мин
Задача оценивания вероятностей и логистическая регрессия8мин
Масштабирование признаков6мин
Спрямляющие пространства5мин
Работа с категориальными признаками4мин
Несбалансированные данные5мин
Многоклассовая классификация4мин
Подбор параметров по сетке. Sklearn.grid_search9мин
Задача: bike sharing demand15мин
Задача: bike sharing demand. Продолжение13мин
7 материала для самостоятельного изучения
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10мин
Задача Bike Sharing Demand (ipython notebook)10мин
Задача Bike Sharing Demand. Продолжение (ipython notebook)10мин
6 практического упражнения
Метод максимального правдоподобия6мин
Линейные модели: статистический взгляд14мин
Линейные модели: подготовка признаков6мин
Линейные модели: практические аспекты6мин
Подбор параметров по сетке6мин
Анализ данных в scikit-learn12мин
Неделя
4
10 ч. на завершение

Решающие деревья и композиции алгоритмов

Линейные модели — очень важный и полезный, но слишком простой класс алгоритмов в машинном обучении; не во всех задачах они позволяют добиться желаемого качества. В этом модуле вы познакомитесь с новым семейством алгоритмов — решающими деревьями. Они во многом являются полной противоположностью линейных моделей. В частности, сами по себе они очень сложны и подвержены переобучению. При этом оказывается, что если объединить много деревьев в одну сложную модель, то можно получить очень качественное решение. Об этом крайне важном подходе — построении композиций решающих деревьев — мы в основном и будем говорить на этой неделе....
17 видео ((всего 114 мин.)), 10 материалов для самостоятельного изучения, 8 тестов
17 видео
Обучение решающих деревьев6мин
Критерии информативности7мин
Критерии останова и стрижка деревьев4мин
Решающие деревья и категориальные признаки8мин
Решающие деревья в sklearn10мин
Композиции деревьев6мин
Смещение и разброс9мин
Случайные леса6мин
Трюки со случайными лесами4мин
Случайные леса в sklearn7мин
Композиции простых алгоритмов5мин
Градиентный бустинг7мин
Борьба с переобучением в градиентном бустинге6мин
Градиентный бустинг для регрессии и классификации4мин
Градиентный бустинг над решающими деревьями5мин
Градиентный бустинг в XGBoost5мин
10 материала для самостоятельного изучения
Решающие деревья в sklearn (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
Случайные леса в sklearn (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
XGBoost10мин
Градиентный бустинг в XGBoost (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
6 практического упражнения
Построение решающих деревьев8мин
Решающие деревья14мин
Бэггинг6мин
Композиции и случайные леса8мин
Обучение композиций и градиентный бустинг4мин
Градиентный бустинг: обучение и практические аспекты8мин
4.8
Рецензии: 249Chevron Right

50%

начал новую карьеру, пройдя эти курсы

58%

получил значимые преимущества в карьере благодаря этому курсу

33%

стал больше зарабатывать или получил повышение

Лучшие рецензии

автор: RNJan 21st 2017

Один из лучших курсов по обучению на размеченных данных. Немного расстраивали несбалансированность сложности домашних заданий и промежуточных проверок правильности подготовки данных в заданиях.

автор: YDAug 8th 2018

Отличный курс. Меньше чем за месяц появилось базовое понимание обучения на размеченных данных и принципов ML.\n\nМного практики, грамотные преподаватели и качественные pdf сделали своё дело.

Преподаватели

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

О Московский физико-технический институт

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

О Яндекс

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

О специализации ''Машинное обучение и анализ данных'

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.