В 90-х годах компьютеры резко подешевели и начали появляться повсюду, а пользователи постепенно осознали их возможности. Компьютер может хранить ваши фотографии, упрощать бизнес-процессы, с его помощью можно пообщаться с людьми с другого континента или, наконец, просто поиграть в крутую игру. Всем стали нужны программисты. Без них компьютер — просто кусок железа. Сегодня сложно найти университет, в котором не готовят специалистов по программированию, сложно найти компанию, в которой не работает хотя бы один программист. Сейчас то же самое происходит с данными. Потребность в анализе данных вышла далеко за пределы технологических и интернет-компаний. Методы машинного обучения все активнее используются при оптимизации технологических процессов или маршрутов транспорта. С их помощью создаются новые лекарства или автомобили без водителя. Специалист в анализе данных, или дата-сайентист, — это одна из самых востребованных и актуальных профессий сегодняшнего дня. Спрос на таких специалистов огромный, и он только растет. Это отмечают HR-аналитики по всему миру. К сожалению, на современном уровне специалистов науки о данных готовят в относительно небольшом количестве университетов. Да и качество программы в появляющихся в большом количестве сейчас экспресс-курсах тоже оставляет желать лучшего. Именно поэтому мы и создали эту специализацию. Машинное обучение — это не квантовая физика. Если вы знаете базовые основы математики и когда-нибудь программировали на каком-нибудь языке, вы без труда освоите все необходимые техники. А мы — преподаватели МФТИ и дата-сайентисты фабрики данных «Яндекса» — расскажем вам не то, что легко рассказать, а то, что хорошо работает на практике. >> В нашей специализации решены проблемы, которые мы наиболее часто наблюдаем в подготовке специалистов по анализу данных. Мы сразу даем вам необходимые знания про язык Python и про использование библиотек для анализа данных, чтобы практика в дальнейшем не отрывалась от теории. Кроме того, мы напоминаем вам основные сведения из математики, которые потребуются в дальнейшем, чтобы избежать профанаций вида «Ой, вот это матрицы. Ну неважно, что вы не знаете, что это такое и как их умножать, все равно умножать будете на компьютере». Нет, мы хотим, чтобы вы понимали те алгоритмы, которые мы вам расскажем. Кроме того, мы рассказываем только те методы и алгоритмы, которые часто используются на практике и хорошо зарекомендовали себя в прикладных задачах. >> Наша специализация состоит из шести курсов и длится полгода. В первом курсе мы разберем основы математики, которая нужна для понимания всего последующего материала, и научимся программировать на языке Python. Второй курс посвящен обучению на размеченных данных, или обучению с учителем. Мы узнаем, как по набору исторических примеров построить предсказательную модель и оценить ее качество. В третьем курсе мы будем заниматься выявлением структуры данных. Мы узнаем, как делать кластеризацию, визуализацию, понижение размерности и как искать в данных аномалии. Четвертый курс посвящен искусству превращения данных в выводы. Мы освоим основные методы статистического анализа и планирования экспериментов. В пятом курсе, одном из моих любимых, мы разберем несколько крупных типовых задач анализа данных, таких как анализ текстов или прогнозирование временных рядов. А в конце вас ждет финальный проект, в котором вам будет на выбор предложена одна из больших задач анализа данных, и мы поможем вам создать систему, которая ее решает. Эту систему вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Мы научим вас хорошему. Оставайтесь в нами! [МУЗЫКА]