Об этом курсе
Недавно просмотрено: 165,615

Learner Career Outcomes

47%

начал новую карьеру, пройдя эти курсы

60%

получил значимые преимущества в карьере благодаря этому курсу

40%

стал больше зарабатывать или получил повышение

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 43 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...

Русский

Субтитры: Русский

Приобретаемые навыки

Random ForestPython ProgrammingMachine LearningSupervised Learning

Learner Career Outcomes

47%

начал новую карьеру, пройдя эти курсы

60%

получил значимые преимущества в карьере благодаря этому курсу

40%

стал больше зарабатывать или получил повышение

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 43 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...

Русский

Субтитры: Русский

Программа курса: что вы изучите

Неделя
1
9 ч. на завершение

Машинное обучение и линейные модели

13 видео ((всего 82 мин.)), 8 материалов для самостоятельного изучения, 8 тестов
13 видео
Как устроена специализация, и зачем ее проходить3мин
МФТИ1мин
Знакомство с машинным обучением11мин
Обучение на размеченных данных5мин
Обучение без учителя5мин
Признаки в машинном обучении8мин
Линейные модели в задачах регрессии9мин
Обучение линейной регрессии6мин
Градиентный спуск для линейной регрессии7мин
Стохастический градиентный спуск4мин
Линейная классификация6мин
Функции потерь в задачах классификации6мин
8 материала для самостоятельного изучения
Формат специализации и получение сертификата10мин
Немного о Yandex10мин
МФТИ10мин
Forum&Chat10мин
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
6 практического упражнения
Основные термины в машинном обучении6мин
Типы задач в машинном обучении6мин
Машинное обучение: задачи и признаки12мин
Линейная регрессия4мин
Градиентный спуск4мин
Линейные модели8мин
Неделя
2
9 ч. на завершение

Борьба с переобучением и оценивание качества

14 видео ((всего 126 мин.)), 9 материалов для самостоятельного изучения, 8 тестов
14 видео
Регуляризация7мин
Оценивание качества алгоритмов7мин
Сравнение алгоритмов и выбор гиперпараметров4мин
Метрики качества в задачах регрессии10мин
Метрики качества классификации4мин
Точность и полнота8мин
Объединение точности и полноты5мин
Качество оценок принадлежности классу12мин
Встроенные датасеты. Sklearn.datasets15мин
Кросс-валидация. Sklearn.cross_validation9мин
Линейные модели. Sklearn.linear_model. Классификация10мин
Линейные модели. Sklearn.linear_model. Регрессия7мин
Метрики качества. Sklearn.metrics13мин
9 материала для самостоятельного изучения
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
Встроенные датасеты. Sklearn.datasets (ipython notebook)10мин
Кросс-валидация. Sklearn.cross_validation (ipython notebook)10мин
Линейные модели. Sklearn.linear_model. Классификация (ipython notebook)10мин
Линейные модели. Sklearn.linear_model. Регрессия (ipython notebook)10мин
Метрики качества. Sklearn.metrics (ipython notebook)10мин
6 практического упражнения
Проблема переобучения6мин
Проблема переобучения и борьба с ней10мин
Как измерить качество алгоритма?6мин
Метрики качества10мин
Встроенные датасеты и кросс-валидация8мин
Введение в scikit-learn10мин
Неделя
3
7 ч. на завершение

Линейные модели: классификация и практические аспекты

14 видео ((всего 97 мин.)), 7 материалов для самостоятельного изучения, 7 тестов
14 видео
Метод максимального правдоподобия4мин
Регрессия как максимизация правдоподобия2мин
Регрессия как оценка среднего4мин
Регуляризация8мин
Задача оценивания вероятностей и логистическая регрессия8мин
Масштабирование признаков6мин
Спрямляющие пространства5мин
Работа с категориальными признаками4мин
Несбалансированные данные5мин
Многоклассовая классификация4мин
Подбор параметров по сетке. Sklearn.grid_search9мин
Задача: bike sharing demand15мин
Задача: bike sharing demand. Продолжение13мин
7 материала для самостоятельного изучения
Слайды к лекциям10мин
Конспект10мин
Слайды к лекциям10мин
Конспект10мин
Подбор параметров по сетке. Sklearn.grid_search (ipython notebook)10мин
Задача Bike Sharing Demand (ipython notebook)10мин
Задача Bike Sharing Demand. Продолжение (ipython notebook)10мин
6 практического упражнения
Метод максимального правдоподобия6мин
Линейные модели: статистический взгляд14мин
Линейные модели: подготовка признаков6мин
Линейные модели: практические аспекты6мин
Подбор параметров по сетке6мин
Анализ данных в scikit-learn12мин
Неделя
4
10 ч. на завершение

Решающие деревья и композиции алгоритмов

17 видео ((всего 114 мин.)), 10 материалов для самостоятельного изучения, 8 тестов
17 видео
Обучение решающих деревьев6мин
Критерии информативности7мин
Критерии останова и стрижка деревьев4мин
Решающие деревья и категориальные признаки8мин
Решающие деревья в sklearn10мин
Композиции деревьев6мин
Смещение и разброс9мин
Случайные леса6мин
Трюки со случайными лесами4мин
Случайные леса в sklearn7мин
Композиции простых алгоритмов5мин
Градиентный бустинг7мин
Борьба с переобучением в градиентном бустинге6мин
Градиентный бустинг для регрессии и классификации4мин
Градиентный бустинг над решающими деревьями5мин
Градиентный бустинг в XGBoost5мин
10 материала для самостоятельного изучения
Решающие деревья в sklearn (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
Случайные леса в sklearn (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
XGBoost10мин
Градиентный бустинг в XGBoost (ipython notebook)10мин
Слайды к лекциям10мин
Конспект10мин
6 практического упражнения
Построение решающих деревьев8мин
Решающие деревья14мин
Бэггинг6мин
Композиции и случайные леса8мин
Обучение композиций и градиентный бустинг4мин
Градиентный бустинг: обучение и практические аспекты8мин
4.8
Рецензии: 274Chevron Right

Лучшие отзывы о курсе Обучение на размеченных данных

автор: RNJan 21st 2017

Один из лучших курсов по обучению на размеченных данных. Немного расстраивали несбалансированность сложности домашних заданий и промежуточных проверок правильности подготовки данных в заданиях.

автор: AGNov 15th 2019

Очень интересный и более сложный курс по сравнению с предыдущим! Но!! Хотелось бы обновлений и дополнений по нейросетям (мало информации), а также не затронут TensorFlow, что не очень хорошо!

Преподаватели

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

О Московский физико-технический институт

Московский физико-технический институт (Физтех) является одним из ведущих вузов страны и входит в основные рейтинги лучших университетов мира. Институт обладает не только богатой историей – основателями и профессорами института были Нобелевские лауреаты Пётр Капица, Лев Ландау и Николай Семенов – но и большой научно-исследовательской базой. Основой образования в МФТИ является уникальная «система Физтеха», сформулированная Петром Капицей: кропотливый отбор одаренных и склонных к творческой работе абитуриентов; участие в обучении ведущих научных работников; индивидуальный подход к отдельным студентам с целью развития их творческих задатков; воспитание с первых шагов в атмосфере технических исследований и конструктивного творчества с использованием потенциала лучших лабораторий страны. Среди выпускников МФТИ — нобелевские лауреаты Андрей Гейм и Константин Новоселов, основатель компании ABBYY Давид Ян, один из авторов архитектурных принципов построения вычислительных комплексов Борис Бабаян и др....

О Яндекс

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Специализация Машинное обучение и анализ данных: общие сведения

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.