Об этом курсе

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Русский

Субтитры: Русский

Приобретаемые навыки

Logistic RegressionR ProgrammingPoisson RegressionGeneralized Linear Mixed Model (GLMM)Random Effects Model

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Русский

Субтитры: Русский

Программа курса: что вы изучите

Неделя
1
4 ч. на завершение

Знакомство со смешанными линейными моделями

В этом модуле вы сделаете первый шаг в мир смешанных линейных моделей. Вы познакомитесь с понятием случайного фактора. Вы увидите примеры дизайнов сбора данных, когда использование таких факторов становится необходимым и поймете, что происходит с моделями, если такие факторы не учитывать или учитывать нерационально. Вам предстоит построить смешанную модель, предполагающую, что переменная-отклик подчиняется нормальному распределению. На этом примере вы научитесь трактовать результаты построения смешанных моделей и визуализировать их. Вы увидите, что подходы к работе со смешанными моделями существенно отличаются от более привычных нам форм регрессионного и дисперсионного анализа. ...
14 видео ((всего 90 мин.)), 2 материалов для самостоятельного изучения, 1 тест
14 видео
Пример - недосып и время реакции6мин
Недосып. Почему обычные методы не работают?4мин
Фиксированные и случайные факторы4мин
GLMM со случайным отрезком5мин
Визуализация предсказаний GLMM со случайным отрезком7мин
Индуцированная корреляция9мин
Диагностика модели со случайным отрезком6мин
GLMM со случайным отрезком и углом наклона5мин
Визуализация предсказаний GLMM со случайным отрезком и углом наклона4мин
Диагностика модели со случайным отрезком и углом наклона4мин
Смешанные линейные модели9мин
Тестирование гипотез в смешанных моделях12мин
Что мы знаем и что будет дальше5мин
2 материала для самостоятельного изучения
Обзор курса10мин
Знакомство со смешанными линейными моделями10мин
Неделя
2
3 ч. на завершение

Моделирование структуры дисперсии в смешанных моделях

Одним из ключевых ограничений при работе с моделями, основанными на нормальном распределении переменной отклика, является отсутствие гетероскедастичности. Тем не менее признаки неравенства дисперсии для разных значений ковариат выявляются очень часто. Если гетерогенность дисперсий не учитывать, это может привести к неадекватной трактовке результатов подбора модели. В этом модуле мы рассмотрим один из возможных подходов к решению этой проблемы - моделирование структуры дисперсии. Вы познакомитесь с нескольким способами моделирования связи между варьированием переменной отклика и непрерывными или дискретными предикторами, которые называются ковариаты дисперсии. Мы рассмотрим как можно ввести такой компонент, как в простую, так и смешанную линейную модель. ...
9 видео ((всего 65 мин.)), 1 материал для самостоятельного изучения, 1 тест
9 видео
Пример – сексуальная активность мух10мин
Моделирование дисперсии4мин
Дисперсия может зависеть от непрерывной ковариаты11мин
Дисперсия может зависить от дискретного фактора4мин
Моделирование гетерогенности дисперсии – финальная модель8мин
Моделирование структуры дисперсии при наличии случайных факторов4мин
Модель со случайным фактором5мин
Моделируем структуру дисперсии8мин
1 материал для самостоятельного изучения
Моделирование структуры дисперсии в смешанных моделях10мин
Неделя
3
3 ч. на завершение

Смешанные линейные модели для счетных данных

В этом модуле вы научитесь моделировать поведение счетных величин при помощи обобщенных смешанных линейных моделей (GLMM). В основе этих моделей будет лежать распределение Пуассона или отрицательное биномиальное распределение. Мы вместе вспомним, что такое связывающей функция, и каким образом она обеспечивает связь между предиктором и счетной зависимой переменной. GLMM для счетных данных требуют, чтобы связь среднего и дисперсии в данных соответствовала ожидаемой для выбранного распределения. Вы научитесь оценивать степень избыточности дисперсии и бороться с ней, если она присутствует. Мы встретим и обсудим случаи, когда функции языка R не будут способны подобрать модель по техническим причинам, и рассмотрим некоторые методы устранения таких проблем. Наконец, мы обсудим особенности трактовки результатов GLMM: интерпретацию коэффициентов моделей, основанных на распределениях для счетных данных, методы тестирования гипотез, пост-хок тесты и способы визуализации результатов....
9 видео ((всего 61 мин.)), 1 материал для самостоятельного изучения, 1 тест
9 видео
Пример – саламандры и добыча угля10мин
Смешанная модель с Пуассоновским распределением отклика.7мин
Диагностика моделей с Пуассоновским распределением. Избыточность дисперсии6мин
Смешанная модель с отрицательным биномиальным распределением отклика7мин
Диагностика модели с отрицательным биномиальным распределением отклика5мин
Тестирование гипотез8мин
Визуализация модели4мин
Что мы знаем и что будет дальше2мин
1 материал для самостоятельного изучения
Материалы: Смешанные линейные модели для счетных данных10мин
Неделя
4
5 ч. на завершение

Смешанные линейные модели для бинарных данных

В последнем модуле этой специализации мы применим весь имеющийся нашем арсенале набор средств для построения модели, в которой зависимая переменная имеет бинарную природу. Мы повторим принципы работы с бинарными переменными: переход от вероятностей к шансам и логитам. Далее мы обсудим материал, в котором несколько случайных факторов находятся в иерархическом соподчинении. На примере модели для этих данных мы рассмотрим разнообразные подводные камни, которые имеются при работе со смешанными моделям с бинарной переменной-откликом....
9 видео ((всего 74 мин.)), 1 материал для самостоятельного изучения, 2 тестов
9 видео
Пример -- морские звезды и мидии9мин
Знакомимся с данными4мин
Подбираем модель14мин
Дорабатываем модель5мин
Анализ итогов7мин
Визуализация модели6мин
Дополнительные штрихи к модели9мин
Что мы знаем и что важное осталось за рамками4мин
1 материал для самостоятельного изучения
Материалы: Смешанные линейные модели для бинарных данных10мин

Преподавателя

Avatar

Варфоломеева Марина Александровна

Старший преподаватель
Кафедра зоологии беспозвоночных
Avatar

Хайтов Вадим Михайлович

Доцент
Кафедра Зоологии беспозвоночных

О Санкт-Петербургский государственный университет

The Saint-Petersburg University (SPbU) is a state university, located in Saint-Petersburg, Russia. Founded in 1724, SPbU is the oldest institution of higher education in Russia. At present, there are more than 30 000 students in SPbU studying 398 programmes...

О специализации ''Просто о статистике (с использованием R)'

Специализация “Просто о статистике” познакомит вас с основами прикладного анализа данных. Здесь не будет сложной математики, зато мы разберем на практике множество примеров. Вы научитесь описывать данные графически и при помощи описательных статистик; тестировать гипотезы, делая поправки на множественность тестов. При помощи линейных моделей вы сможете анализировать данные разных типов и проверять, выполняются ли допущения, лежащие в основе статистических методов. В частности, мы разберем, как устроены простая и множественная линейная регрессия, дисперсионный анализ, логистическая и Пуассоновская регрессия и т.д. Наконец, вы научитесь строить смешанные линейные модели, позволяющие работать с данными, когда благодаря дизайну сбора материала отдельные наблюдения оказываются взаимозависимы. Для статистического анализа мы будем использовать язык R -- универсальный язык науки о данных. Даже если вы раньше не писали программ, вы сможете научиться не только адаптировать существующие, но и создавать свои собственные скрипты для анализа данных. Каждый из курсов заканчивается практическим проектом, так что к концу специализации вы сможете собрать портфолио из разных видов анализа данных. Отчеты по проекту, выдержанные в традиции воспроизводимых исследований, вы научитесь создавать, не покидая R, при помощи пакетов knitr / rmarkdown....
Просто о статистике (с использованием R)

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.