Специализация Анализ данных

Начинается Jul 23

Специализация Анализ данных

Анализ данных. Прикладные задачи статистического анализа данных: взаимосвязи, тренды, прогнозы, классификации

Об этой специализации

В рамках специализации вы освоите основные методы работы с количественными данными, в том числе основы теории вероятностей и математической статистики, инструменты исследования связей между признаками, научитесь строить прогнозы на основе регрессионных моделей, сравнивать группы, выделять группы методами кластерного анализа, строить классификации, визуализировать данные, интерпретировать и представлять результаты статистического анализа. Вы примените эти методы на учебных примерах и сможете адаптировать их под специфику ваших данных и задач. В курсах специализации мы рассмотрим, как оценить связь условий труда и удовлетворенности работой, как спрогнозировать количество кликов на сайт компании, как разделить университеты на классы, как выявить стратегии поиска работы, как отличить геозависимую рубрику от геонезависимой, и множество других практических задач. Кроме того, мы научимся решать такие задачи в популярных средах анализа данных (SPSS и R). В заключительной части каждого курса вам предстоит выполнить проект на реальных данных, который позволит применить полученные знания на практике и продемонстрировать умение анализировать и представлять результаты анализа статистически и графически. Специализация разработана Новосибирским государственным университетом, одним из ведущих исследовательских университетов России и мира, совместно с 2GIS, известной международной технологической компанией, которая разрабатывает сервисы для комфортной жизни в городе.

Автор:

Партнеры курса:

courses
4 courses

Следуйте предложенному порядку или выберите свой.

projects
Проекты

Поможет на практике применить полученные навыки.

certificates
Сертификаты

Отметьте новые навыки в резюме и на LinkedIn.

Обзор проектов

Курсы
Intermediate Specialization.
Some related experience required.
  1. 1-Й КУРС

    Введение в данные

    Upcoming session: Jul 23
    Выполнение
    5 недель обучения, 3-5 часов в неделю
    Субтитры
    Russian

    О курсе

    Этот курс - первый в специализации "Анализ данных". Курс будет особенно полезен тем, кто имеет небольшой опыт работы с данными, или хочет освежить знания по теории вероятностей, математической статистике и типах данных. Сначала мы вспомним основы теории вероятностей и поговорим о случайных величинах и их свойствах, об основных распределениях случайных величин. Затем перейдем к основным характеристикам распределений: мерам центра и мерам вариативности. Далее обсудим основные типы шкал измерения признаков, а также основные ограничения, которые тип шкалы накладывает на применимые методы анализа данных. Третья неделя курса посвящена графическому анализу данных и способам визуализации распределений, индивидуальных или совместных. Завершающий модуль курса посвящен выборкам и способам их формирования, а также принципам и инструментам работы с пропущенными и неопределенными значениями. Вы сможете применить полученные знания, выполнив небольшой проект на реальных данных, предоставленных компанией 2GIS. Присоединяйтесь!
  2. 2-Й КУРС

    Исследование статистических взаимосвязей

    Upcoming session: Jul 23
    Выполнение
    5 недель обучения, 3-6 часов в неделю
    Субтитры
    Russian

    О курсе

    Курс рассматривает способы и инструменты исследования статистических взаимосвязей между признаками. Вы научитесь оценивать, связаны ли признаки, а также делать обоснованные выводы о том, значима ли эта связь статистически. Связаны ли богатство и счастье, как связана потребительская активность людей с днем недели, способствует ли наличие аккаунта в социальных сетях популярности корпоративного сайта? На вопросы такого рода вы сможете ответить, пройдя этот курс. В первом модуле курса мы поговорим о статистических гипотезах, о способах их проверки и об основных статистических критериях, которые для этого разработаны. После этого мы рассмотрим практические инструменты выявления статистических взаимосвязей признаков, измеренных разными типами шкал, а также способы оценки значимости этих связей. Мы поговорим об основных коэффициентах взаимосвязи признаков, о том, как правильно выбрать коэффициент для решения конкретной задачи и покажем, как рассчитывать коэффициенты связи в статистических пакетах. В заключении мы подробно рассмотрим модель линейной регрессии, которая позволяет не только выявлять взаимосвязи между признаками, но и строить прогноз, и попрактикуемся в её построении.
  3. 3-Й КУРС

    Сравнение и создание групп

    Upcoming session: Aug 6
    Выполнение
    5 недель обучения, 3-5 часов в неделю
    Субтитры
    Russian

    О курсе

    Курс посвящен статистическому сравнению характеристик групп и категорий. В первой части курса мы рассказываем о параметрических и непараметрических тестах сравнения средних и распределений, какие возможности и ограничения связаны с разными методами сравнения групп, говорим о сравнении связанных и несвязанных выборок. Различаются ли регионы (или аудитории) по доходу или возрасту? Как отличается пользовательская активность в разные времена года? Случайны различия между группами или закономерны? Курс научит искать ответы на такие вопросы. Вторая половина курсов посвящена выделению групп на основе эмпирических данных. Есть ли структура в данных? Можно ли говорить о том, что люди, компании или университеты группируются в отличительные, узнаваемые классы? Как найти и охарактеризовать такие группы? Мы покажем основные алгоритмы кластеризации, которые позволяют решать такие задачи. В практических видео курса мы покажем реализацию основных инструментов сравнения и выделения групп, а также предложим практические задачи и задания для отработки полученных навыков.
  4. 4-Й КУРС

    Тренды и классификации

    Upcoming session: Jul 16
    Выполнение
    5 недель обучения, 4-6 часов в неделю
    Субтитры
    Russian

    О курсе

    В этом курсе мы поговорим о трендах и классификаторах. Анализ трендов помогает ответить на вопросы вроде: растут ли продажи, увеличивается ли количество пользователей сервиса? Если есть рост, то случайность это или закономерность? Есть ли в данных сезонные колебания? Как выделить тренд и как объяснить его? Также мы поговорим о факторном анализе, который позволяет найти скрытую переменную (или переменные), направляющие проявление множества видимых признаков. Как найти такие скрытые переменные и понять, что за ними стоит? В заключительной части курса поговорим о классификаторах, применение которых решает задачи отнесения объектов к тому или иному классу с определенной вероятностью, а также позволяет прогнозировать попадание нового объекта в определенный класс. Как предсказать исход события, зная основные характеристики действующего лица? Закончит ли слушатель курс, отдаст ли заемщик кредит? Как оценить точность прогноза и минимизировать ошибки? Мы разберемся с устройством обозначенных методов анализа данных и попрактикуемся в их применении.

Авторы

  • Novosibirsk State University

    Новосибирский государственный университет (НГУ) - один из ведущих исследовательских университетов России и мира. НГУ готовит высококлассных специалистов для науки и образования, для наукоёмкого производства и бизнеса. Фундаментальное образование, серьезная аналитическая подготовка и умение быстро работать с большими объемами информации позволяет выпускникам быстро адаптироваться к меняющимся потребностям общества и быть востребованными во всём мире.

    Novosibirsk State University (NSU) is a research university located in Novosibirsk Akademgorodok, the world-famous scientific center in Siberia. 80% of NSU teachers are active researchers affiliated with the Russian Academy of Sciences; therefore education is closely linked to world-class science: our students get first-hand knowledge about scientific discoveries before they are published. Nearly 6000 students (including international students from 37 countries) are enrolled at undergraduate and graduate programs offered by 13 departments. The leading areas of NSU expertise are natural sciences, life sciences, physics, math, IT, and more.

  • Виктор Дёмин

    Виктор Дёмин

    Специалист по анализу данных, кандидат технических наук
  • Наталья Галанова

    Наталья Галанова

    Специалист по анализу данных
  • Ольга Ечевская

    Ольга Ечевская

    доцент, кандидат социологических наук

FAQs