Курс рассматривает способы и инструменты исследования статистических взаимосвязей между признаками. Вы научитесь оценивать, связаны ли признаки, а также делать обоснованные выводы о том, значима ли эта связь статистически. Связаны ли богатство и счастье, как связана потребительская активность людей с днем недели, способствует ли наличие аккаунта в социальных сетях популярности корпоративного сайта? На вопросы такого рода вы сможете ответить, пройдя этот курс.
В первом модуле курса мы поговорим о статистических гипотезах, о способах их проверки и об основных статистических критериях, которые для этого разработаны. После этого мы рассмотрим практические инструменты выявления статистических взаимосвязей признаков, измеренных разными типами шкал, а также способы оценки значимости этих связей. Мы поговорим об основных коэффициентах взаимосвязи признаков, о том, как правильно выбрать коэффициент для решения конкретной задачи и покажем, как рассчитывать коэффициенты связи в статистических пакетах.
В заключении мы подробно рассмотрим модель линейной регрессии, которая позволяет не только выявлять взаимосвязи между признаками, но и строить прогноз, и попрактикуемся в её построении.
From the lesson
Линейная регрессия
В заключительном модуле курса мы поговорим о модели линейной регрессии, которая позволяет не только делать вывод о связи между признаками, но и строить прогноз, т.е., рассчитать значение одного (зависимого) признака, зная значения других, определяющих его. Мы начнём с общей идеи модели, поговорим о возможностях и ограничениях инструмента, затем на примере пошагово разберём, как построить модель линейной регрессии, как оценить её качество, и как строить прогноз на основе построенной модели. Базовый пример модуля - модель, построенная на реальных данных, предоставленных компанией 2GIS.