Обработка и анализ больших данных представляет собой новую практическую задачу, требующую навыков работы с современным инструментарием. В настоящее время данные называют «нефтью 21 века», они накапливаются в корпоративных и государственных информационных системах, социальных сетях, веб-блогах и сайтах и потенциально являются ценным ресурсом для извлечения новых знаний, инсайтов для научных исследований, повышения эффективности и конкурентоспособности предприятий. Методы интеллектуального анализа больших данных, таким образом, представляют собой тот необходимый инструмент для высвобождения этого потенциала.
от партнера
Машинное обучение и большие данные
Национальный исследовательский ядерный университет "МИФИ"Об этом курсе
Чему вы научитесь
Основным стандартам и методологиям анализа, обработки, описания и визуализации социально-экономических данных
Математическим и инструментальным методам машинного обучения
Использованию современных информационно-коммуникационных технологий в профессиональной деятельности
от партнера

Национальный исследовательский ядерный университет "МИФИ"
National Research Nuclear University “MEPhI” is one of the most recognized technical universities in Russia. It is the only research nuclear university in Russia. The aim of the university existence is preparing the specialists for nuclear industry, science, information technology and other high-tech sectors of Russian economy.
Программа курса: что вы изучите
Анализ данных
В этом модуле вы познакомитесь с основными понятиями и методами анализа данных. Узнаете, что такое искусственные нейронные сети и для чего они используются. Получите представление об основных целях и задачах машинного обучения, о существующих стандартах в сфере хранения и обработки данных.
Подготовка данных
В рамках наиболее популярного стандарта CRISP мы рассмотрим этап анализа, который называется подготовка данных. На предыдущих шагах мы выяснили потребности бизнеса. Определили, какие данные у нас имеются, их источники и форматы. Данные мы каким-то образом извлекли из источников. И наша текущая задача эти данные подготовить, очистить, преобразовать для того, чтобы можно было дальше заниматься моделированием.
Визуализация данных
Данный модуль посвящен визуализации данных. Эта тема является очень важной для анализа, поскольку визуализация данных используется на разных этапах стандарта CRISP. Визуализация данных позволяет вырабатывать гипотезы, проверять гипотезы и, в целом, оценивать качество моделей, построенных ранее.
Описательные статистики
Этот модуль посвящен систематизации данных и описанию их с помощью различных методов, таких как: расчет статистик; проверка статистических тестов и гипотез; построение диаграмм, ранее рассмотренных с точки зрения визуализации.
Часто задаваемые вопросы
Когда я получу доступ к лекциям и заданиям?
Что я получу, оплатив сертификацию?
Is financial aid available?
Остались вопросы? Посетите Центр поддержки учащихся.