Об этом курсе

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 22 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...

Русский

Субтитры: Русский

Приобретаемые навыки

Data ModelingRegression ValidationR ProgrammingLinear RegressionStatistics

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 22 часа на выполнение

Предполагаемая нагрузка: 8 hours/week...

Русский

Субтитры: Русский

Программа курса: что вы изучите

Неделя
1
3 ч. на завершение

Корреляционный анализ. Простая линейная регрессия

Мы начнем разговор о методах численного описания связей между количественными величинами с коэффициентов ковариации и корреляции, которые позволяют оценить силу и направление связи. Затем вы узнаете, какую дополнительную информацию о связях можно получить, построив линейную модель зависимости между величинами. Вы научитесь интерпретировать коэффициенты регрессии и узнаете, когда и как можно использовать линейные модели для предсказаний на новых данных. К концу этого модуля вы научитесь подбирать уравнение линейной модели и строить ее график с доверительной областью....
14 видео ((всего 97 мин.)), 2 материалов для самостоятельного изучения, 1 тест
14 видео
Пример - размер мозга и IQ8мин
Взаимосвязи между явлениями8мин
Ковариация и корреляция9мин
Тестирование статистической значимости коэффициента корреляции4мин
Корреляционный анализ в R4мин
Модели как отражение взаимосвязи6мин
Простая линейная регрессия9мин
Метод наименьших квадратов10мин
Подбор коэффициентов линейной регресии в R6мин
Стандартные ошибки коэффициентов регрессии7мин
Доверительные интервалы коэффициентов и доверительная зона регрессии6мин
Использование регрессии для предсказаний9мин
Что мы знаем и что будет дальше3мин
2 материала для самостоятельного изучения
Обзор курса10мин
Материалы: Корреляционный анализ. Простая линейная регрессия10мин
Неделя
2
3 ч. на завершение

Проверка значимости и валидности линейных моделей

Построить линейную модель и записать ее уравнение - это только самое начало анализа. В этом модуле вы узнаете, как описывать результаты регрессионного анализа: как проверить статистическую значимость модели в целом или ее коэффициентов, оценить качество подгонки. У линейных моделей (вернее, у статистических тестов, которые для них используются), как у любого метода, есть свои ограничения. Вы узнаете, что это за ограничения и откуда они возникают. Графические методы диагностики, которыми мы будем пользоваться, универсальны для разных линейных моделей - больше практики поможет вам увереннее принимать решения. Разобравшись со всем этим, вы сможете написать на языке R полный скрипт для подбора, диагностики и представления результатов простой линейной регрессии....
13 видео ((всего 89 мин.)), 1 материал для самостоятельного изучения, 1 тест
13 видео
Тестирование значимости коэффициентов регрессии при помощи t-теста7мин
Тестирование значимости модели при помощи F критерия8мин
Качество подгонки модели4мин
Не стоит обольщаться. Зачем нужна диагностика моделей4мин
Разновидности остатков6мин
Влиятельные наблюдения и как с ними бороться8мин
Линейность связи8мин
Независимость наблюдений10мин
Нормальное распределение остатков6мин
Постоянство дисперсии остатков5мин
Анализ остатков в R10мин
Что мы знаем и что будет дальше3мин
1 материал для самостоятельного изучения
Материалы: Проверка значимости и валидности линейных моделей10мин
Неделя
3
3 ч. на завершение

Краткое введение в мир линейной алгебры

В этом модуле мы с вами погрузимся в самое сердце линейных моделей. Для этого вам придется изучить или вспомнить основы линейной алгебры. Мы обсудим разновидности матриц, способы их создания в R и основные операции с ними. Все это нам понадобится, чтобы разобраться, как устроена линейная регрессия изнутри. Вы узнаете, что такое модельная матрица, научитесь записывать уравнение линейной регрессии в виде матриц и находить его коэффициенты. Вы своими глазами увидите хэт-матрицу, которая позволяет получать предсказанные значения, и даже сможете ее вычислить вручную. Наконец, вы научитесь рассчитывать остаточную дисперсию, вариационно-ковариационную матрицу и использовать все это для того, чтобы строить доверительную зону регрессии. Потом эти знания помогут вам разобраться с устройством более сложных моделей: с дискретными предикторами, с другими распределениями остатков, с иным устройством вариационно-ковариационной матрицы....
11 видео ((всего 81 мин.)), 1 материал для самостоятельного изучения, 1 тест
11 видео
Разновидности матриц3мин
Основные действия с матрицами7мин
Основы матричного умножения9мин
Умножение двух матриц10мин
Решение систем уравнений при помощи матриц12мин
Линейная регрессия в матричном виде7мин
Вычисление остатков в матричном виде5мин
Строим график модели вручную6мин
Доверительная зона регрессии в матричном виде10мин
Что мы знаем и что будет дальше2мин
1 материал для самостоятельного изучения
Материалы: Краткое введение в мир линейной алгебры10мин
Неделя
4
3 ч. на завершение

Множественная линейная регрессия

Чаще всего связи между величинами устроены сложнее, чем это можно описать при помощи простой линейной регрессии. Множественная линейная регрессия используется, чтобы описать, как переменная-отклик зависит от нескольких предикторов. С появлением в модели множества предикторов у линейной регрессии появляется новое условие применимости - требование отсутствия мультиколлинеарности. В этом модуле вы узнаете, как можно выявить мультиколлинеарность и избежать ее. Наконец, нередко во множественных моделях переменных больше, чем это можно изобразить на плоскости, поэтому мы научим вас простым приемам, которые помогут создавать информативные графики даже в таком случае....
12 видео ((всего 93 мин.)), 1 материал для самостоятельного изучения, 1 тест
12 видео
Пример - маркер рака простаты3мин
Протокол анализа данных7мин
Разведочный анализ в R17мин
Модель множественной линейной регрессии и ее интерпретация11мин
Мультиколлинеарность и другие условия применимости15мин
Взаимодействия предикторов3мин
Сравнение влияния отдельных предикторов7мин
Качество подгонки модели множественной линейной регрессии3мин
Визуализация модели: один предиктор10мин
Визуализация модели: два предиктора5мин
Что мы знаем и что будет дальше1мин
1 материал для самостоятельного изучения
Материалы: Множественная линейная регрессия10мин

Преподаватели

Avatar

Варфоломеева Марина Александровна

Старший преподаватель
Кафедра зоологии беспозвоночных
Avatar

Хайтов Вадим Михайлович

Доцент
Кафедра Зоологии беспозвоночных

О Санкт-Петербургский государственный университет

The Saint-Petersburg University (SPbU) is a state university, located in Saint-Petersburg, Russia. Founded in 1724, SPbU is the oldest institution of higher education in Russia. At present, there are more than 30 000 students in SPbU studying 398 programmes...

О специализации ''Просто о статистике (с использованием R)'

Специализация “Просто о статистике” познакомит вас с основами прикладного анализа данных. Здесь не будет сложной математики, зато мы разберем на практике множество примеров. Вы научитесь описывать данные графически и при помощи описательных статистик; тестировать гипотезы, делая поправки на множественность тестов. При помощи линейных моделей вы сможете анализировать данные разных типов и проверять, выполняются ли допущения, лежащие в основе статистических методов. В частности, мы разберем, как устроены простая и множественная линейная регрессия, дисперсионный анализ, логистическая и Пуассоновская регрессия и т.д. Наконец, вы научитесь строить смешанные линейные модели, позволяющие работать с данными, когда благодаря дизайну сбора материала отдельные наблюдения оказываются взаимозависимы. Для статистического анализа мы будем использовать язык R -- универсальный язык науки о данных. Даже если вы раньше не писали программ, вы сможете научиться не только адаптировать существующие, но и создавать свои собственные скрипты для анализа данных. Каждый из курсов заканчивается практическим проектом, так что к концу специализации вы сможете собрать портфолио из разных видов анализа данных. Отчеты по проекту, выдержанные в традиции воспроизводимых исследований, вы научитесь создавать, не покидая R, при помощи пакетов knitr / rmarkdown....
Просто о статистике (с использованием R)

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.