Об этом курсе
100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Промежуточный уровень

Часов на завершение

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...
Доступные языки

Русский

Субтитры: Русский

Приобретаемые навыки

Logistic RegressionR ProgrammingGeneralized Linear ModelPoisson RegressionModel Selection
100% онлайн

100% онлайн

Начните сейчас и учитесь по собственному графику.
Гибкие сроки

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Промежуточный уровень

Часов на завершение

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...
Доступные языки

Русский

Субтитры: Русский

Программа курса: что вы изучите

Неделя
1
Часов на завершение
4 ч. на завершение

Знакомство с обобщенными линейными моделями

Обобщенные линейные модели (GLM) позволяют моделировать поведение величин, не подчиняющихся нормальному распределению. Чтобы первые шаги в мире GLM были легче, мы разберем их устройство на примере GLM для нормально распределенных величин - так вы сможете проводить параллели с простыми линейными моделями. Вы узнаете, что такое функция связи, как работает метод максимального правдоподобия и научитесь тестировать гипотезы о GLM при помощи тестов Вальда и тестов отношения правдоподобий....
Reading
14 видео ((всего 117 мин.)), 2 материалов для самостоятельного изучения, 1 тест
Video14 видео
Зоопарк распределений15мин
Обобщенные линейные модели12мин
GLM с нормальным распределением отклика5мин
Пример -- питательная ценность икры7мин
Подбор GLM c нормальным распределением отклика в R7мин
Разновидности остатков обобщенных линейных моделях5мин
Диагностика GLM с нормальным распределением отклика9мин
Тестирование значимости коэффициентов при помощи критерия Вальда6мин
Работаем с логарифмами правдоподобий. Анализ девиансы9мин
Анализ девиансы в R9мин
Качество подгонки GLM4мин
Визуализация GLM12мин
Что мы знаем и что будет дальше?5мин
Reading2 материала для самостоятельного изучения
Обзор курса10мин
Знакомство с обобщенными линейными моделями10мин
Неделя
2
Часов на завершение
3 ч. на завершение

Проблема выбора модели

В этом модуле мы поговорим о методологических проблемах, связанных с построением моделей. Модель есть упрощенное отображение реальности и выбор между разными конкурирующими способами такого упрощения - частая задача аналитика. В этом модуле вы научитесь сравнивать модели при помощи информационных критериев. Мы обсудим основные варианты хода анализа при выборе моделей и поговорим о сложностях, возникающих в связи со скрытой множественностью моделей. Наконец, мы научим вас распознавать основные виды злоупотреблений при выборе моделей (data-fishing, p-hacking)....
Reading
11 видео ((всего 59 мин.)), 1 материал для самостоятельного изучения, 1 тест
Video11 видео
Проблема выбора в действии10мин
Третий путь: несколько равноправных моделей3мин
Информационные критерии7мин
Вычисление AIC вручную3мин
AIC в действии6мин
Сопоставление моделей-кандидатов2мин
Блеск и нищета выбора моделей4мин
В саду расходящихся тропок8мин
Выбор моделей на краю пропасти4мин
Что мы знаем и что будет дальше?4мин
Reading1 материал для самостоятельного изучения
Проблема выбора модели10мин
Неделя
3
Часов на завершение
4 ч. на завершение

Обобщенные линейные модели для счетных данных

В этом модуле мы обсудим основные методы моделирования счетных величин. Для начала мы обсудим, почему обычные линейные модели не годятся для счетных данных. Свойства счетных распределений помогут вам понять отличия разновидностей GLM для счетных данных и особенности их диагностики. Вы своими глазами увидите работу функции связи, когда будете визуализировать предсказания GLM в масштабе функции связи и в масштабе переменной отклика....
Reading
9 видео ((всего 80 мин.)), 1 материал для самостоятельного изучения, 1 тест
Video9 видео
Пример - гадючий лук и опылители13мин
Опасности моделирования счетных величин при помощи обычной регрессии10мин
GLM с Пуассоновским распределением отклика10мин
Диагностика моделей с Пуассоновским распределением отклика12мин
Квазипуассоновские модели6мин
GLM с отрицательным биномиальным распределением отклика10мин
Описание и визуализация модели4мин
Что мы знаем и что будет дальше?3мин
Reading1 материал для самостоятельного изучения
Обобщенные линейные модели для счетных данных10мин
Неделя
4
Часов на завершение
5 ч. на завершение

Обобщенные линейные модели с бинарным откликом

Иногда возникает необходимость моделировать наступило ли какое-то событие или нет, выиграла ли футбольная команда или проиграла, выздоровел ли пациент после лечения или нет, совершил ли клиент покупку или нет. Для модели рования таких бинарных данных (событий с двумя исходами) не подходят обычные линейные модели, но это легко можно сделать при помощи обобщенных линейных моделей. В этом модуле вы научитесь моделировать вероятности наступления событий, представляя их в виде шансов. Мы разберем, как устроена функция связи логит и как интерпретируются коэффициенты GLM в случае ее применения. Наконец, вы сможете попрактиковаться в анализе обобщенных линейных моделей с разными распределениями, выполнив проект по анализу данных. Результаты этого анализа нужно будет представить в виде отчета в формате html, написанного при помощи rmarkdown/knitr....
Reading
11 видео ((всего 71 мин.)), 1 материал для самостоятельного изучения, 2 тестов
Video11 видео
Пример – морские звезды и мидии6мин
Простой линейной регрессией не обойтись3мин
Логистическая кривая6мин
Шансы и логиты4мин
Немного алгебры: Логиты в качестве зависимой переменной7мин
Вернемся к морским звездам и мидиям8мин
Смысл коэффициентов в моделях с бинарным откликом15мин
Диагностика модели с бинарным откликом6мин
Визуализация модели7мин
Что мы знаем и что будет дальше?3мин
Reading1 материал для самостоятельного изучения
Обобщенные линейные модели с бинарным откликом10мин

Преподавателя

Avatar

Варфоломеева Марина Александровна

Старший преподаватель
Кафедра зоологии беспозвоночных
Avatar

Хайтов Вадим Михайлович

Доцент
Кафедра Зоологии беспозвоночных

О Санкт-Петербургский государственный университет

The Saint-Petersburg University (SPbU) is a state university, located in Saint-Petersburg, Russia. Founded in 1724, SPbU is the oldest institution of higher education in Russia. At present, there are more than 30 000 students in SPbU studying 398 programmes...

О специализации ''Просто о статистике (с использованием R)'

Специализация “Просто о статистике” познакомит вас с основами прикладного анализа данных. Здесь не будет сложной математики, зато мы разберем на практике множество примеров. Вы научитесь описывать данные графически и при помощи описательных статистик; тестировать гипотезы, делая поправки на множественность тестов. При помощи линейных моделей вы сможете анализировать данные разных типов и проверять, выполняются ли допущения, лежащие в основе статистических методов. В частности, мы разберем, как устроены простая и множественная линейная регрессия, дисперсионный анализ, логистическая и Пуассоновская регрессия и т.д. Наконец, вы научитесь строить смешанные линейные модели, позволяющие работать с данными, когда благодаря дизайну сбора материала отдельные наблюдения оказываются взаимозависимы. Для статистического анализа мы будем использовать язык R -- универсальный язык науки о данных. Даже если вы раньше не писали программ, вы сможете научиться не только адаптировать существующие, но и создавать свои собственные скрипты для анализа данных. Каждый из курсов заканчивается практическим проектом, так что к концу специализации вы сможете собрать портфолио из разных видов анализа данных. Отчеты по проекту, выдержанные в традиции воспроизводимых исследований, вы научитесь создавать, не покидая R, при помощи пакетов knitr / rmarkdown....
Просто о статистике (с использованием R)

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.