Ключ к успешному развитию любой компании в современном мире — это умение делать быстрые и правильные решения, основываясь на данных. С каждым годом этих данных становится всё больше, при этом старые методы анализа перестают адекватно работать на таких объемах.
Этот курс входит в специализацию ''Специализация Промышленное машинное обучение'
от партнера
Об этом курсе
Основы программирования на Python и SQL,
Основы Unix,
Основы высшей математики,
Основы компьютерных сетей,
Базовые знания о машинном обучении.
Чему вы научитесь
Работать с наиболее распространенными источниками данных
Уверенно работать с командной строкой в Linux
Разрабатывать и запускать алгоритмы на платформах Hadoop и Spark
Приобретаемые навыки
Основы программирования на Python и SQL,
Основы Unix,
Основы высшей математики,
Основы компьютерных сетей,
Базовые знания о машинном обучении.
от партнера

НИУ ВШЭ
HSE University is one of the top research universities in Russia. Established in 1992 to promote new research and teaching in economics and related disciplines, it now offers programs at all levels of university education across an extraordinary range of fields of study including business, sociology, cultural studies, philosophy, political science, international relations, law, Asian studies, media and communicamathematics, engineering, and more.
Программа курса: что вы изучите
Базовые подходы к хранению и извлечению информации
На этой неделе мы познакомимся с SQL и NoSQL базами данных и извлечением информации из Интернета. Ведь большие данные откуда-то нужно брать.
Bash для инженера данных
На этой неделе мы научимся работать с командной строкой в bash. Это очень полезное умение, которое пригодится на протяжении всего курса.
Начало работы с большим объемом данных: Hadoop, MapReduce
В этом модуле разберемся, как устроены два важных компонента экосистемы Hadoop: файловая система HDFS и API для вычислений MapReduce. Посмотрим, почему они устроены именно так и почему горизонтальная масштабируемость – это хорошо.
Знакомство со Spark
На этой неделе разберем фреймворк для распределенных вычислений Spark. С ним сильно проще работать из Python и он умеет много всего.
Специализация Промышленное машинное обучение: общие сведения
Программа состоит из трех курсов, позволяющих освоить методы обработки больших данных и получить представление о процессе проектирования, реализации и поддержки полноценного решения на базе интеллектуального анализа данных.

Часто задаваемые вопросы
Когда я получу доступ к лекциям и заданиям?
Что я получу, оформив подписку на специализацию?
Is financial aid available?
Получу ли я зачеты в университете за прохождение курса?
Остались вопросы? Посетите Центр поддержки учащихся.