Об этом курсе

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Русский

Субтитры: Русский

Приобретаемые навыки

Logistic RegressionR ProgrammingGeneralized Linear ModelPoisson RegressionModel Selection

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Русский

Субтитры: Русский

Программа курса: что вы изучите

Неделя
1
4 ч. на завершение

Знакомство с обобщенными линейными моделями

Обобщенные линейные модели (GLM) позволяют моделировать поведение величин, не подчиняющихся нормальному распределению. Чтобы первые шаги в мире GLM были легче, мы разберем их устройство на примере GLM для нормально распределенных величин - так вы сможете проводить параллели с простыми линейными моделями. Вы узнаете, что такое функция связи, как работает метод максимального правдоподобия и научитесь тестировать гипотезы о GLM при помощи тестов Вальда и тестов отношения правдоподобий....
14 видео ((всего 117 мин.)), 2 материалов для самостоятельного изучения, 1 тест
14 видео
Зоопарк распределений15мин
Обобщенные линейные модели12мин
GLM с нормальным распределением отклика5мин
Пример -- питательная ценность икры7мин
Подбор GLM c нормальным распределением отклика в R7мин
Разновидности остатков обобщенных линейных моделях5мин
Диагностика GLM с нормальным распределением отклика9мин
Тестирование значимости коэффициентов при помощи критерия Вальда6мин
Работаем с логарифмами правдоподобий. Анализ девиансы9мин
Анализ девиансы в R9мин
Качество подгонки GLM4мин
Визуализация GLM12мин
Что мы знаем и что будет дальше?5мин
2 материала для самостоятельного изучения
Обзор курса10мин
Знакомство с обобщенными линейными моделями10мин
Неделя
2
3 ч. на завершение

Проблема выбора модели

В этом модуле мы поговорим о методологических проблемах, связанных с построением моделей. Модель есть упрощенное отображение реальности и выбор между разными конкурирующими способами такого упрощения - частая задача аналитика. В этом модуле вы научитесь сравнивать модели при помощи информационных критериев. Мы обсудим основные варианты хода анализа при выборе моделей и поговорим о сложностях, возникающих в связи со скрытой множественностью моделей. Наконец, мы научим вас распознавать основные виды злоупотреблений при выборе моделей (data-fishing, p-hacking)....
11 видео ((всего 59 мин.)), 1 материал для самостоятельного изучения, 1 тест
11 видео
Проблема выбора в действии10мин
Третий путь: несколько равноправных моделей3мин
Информационные критерии7мин
Вычисление AIC вручную3мин
AIC в действии6мин
Сопоставление моделей-кандидатов2мин
Блеск и нищета выбора моделей4мин
В саду расходящихся тропок8мин
Выбор моделей на краю пропасти4мин
Что мы знаем и что будет дальше?4мин
1 материал для самостоятельного изучения
Проблема выбора модели10мин
Неделя
3
4 ч. на завершение

Обобщенные линейные модели для счетных данных

В этом модуле мы обсудим основные методы моделирования счетных величин. Для начала мы обсудим, почему обычные линейные модели не годятся для счетных данных. Свойства счетных распределений помогут вам понять отличия разновидностей GLM для счетных данных и особенности их диагностики. Вы своими глазами увидите работу функции связи, когда будете визуализировать предсказания GLM в масштабе функции связи и в масштабе переменной отклика....
9 видео ((всего 80 мин.)), 1 материал для самостоятельного изучения, 1 тест
9 видео
Пример - гадючий лук и опылители13мин
Опасности моделирования счетных величин при помощи обычной регрессии10мин
GLM с Пуассоновским распределением отклика10мин
Диагностика моделей с Пуассоновским распределением отклика12мин
Квазипуассоновские модели6мин
GLM с отрицательным биномиальным распределением отклика10мин
Описание и визуализация модели4мин
Что мы знаем и что будет дальше?3мин
1 материал для самостоятельного изучения
Обобщенные линейные модели для счетных данных10мин
Неделя
4
5 ч. на завершение

Обобщенные линейные модели с бинарным откликом

Иногда возникает необходимость моделировать наступило ли какое-то событие или нет, выиграла ли футбольная команда или проиграла, выздоровел ли пациент после лечения или нет, совершил ли клиент покупку или нет. Для модели рования таких бинарных данных (событий с двумя исходами) не подходят обычные линейные модели, но это легко можно сделать при помощи обобщенных линейных моделей. В этом модуле вы научитесь моделировать вероятности наступления событий, представляя их в виде шансов. Мы разберем, как устроена функция связи логит и как интерпретируются коэффициенты GLM в случае ее применения. Наконец, вы сможете попрактиковаться в анализе обобщенных линейных моделей с разными распределениями, выполнив проект по анализу данных. Результаты этого анализа нужно будет представить в виде отчета в формате html, написанного при помощи rmarkdown/knitr....
11 видео ((всего 71 мин.)), 1 материал для самостоятельного изучения, 2 тестов
11 видео
Пример – морские звезды и мидии6мин
Простой линейной регрессией не обойтись3мин
Логистическая кривая6мин
Шансы и логиты4мин
Немного алгебры: Логиты в качестве зависимой переменной7мин
Вернемся к морским звездам и мидиям8мин
Смысл коэффициентов в моделях с бинарным откликом15мин
Диагностика модели с бинарным откликом6мин
Визуализация модели7мин
Что мы знаем и что будет дальше?3мин
1 материал для самостоятельного изучения
Обобщенные линейные модели с бинарным откликом10мин

Преподаватели

Avatar

Варфоломеева Марина Александровна

Старший преподаватель
Кафедра зоологии беспозвоночных
Avatar

Хайтов Вадим Михайлович

Доцент
Кафедра Зоологии беспозвоночных

О Санкт-Петербургский государственный университет

Санкт-Петербургский государственный университет (СПбГУ) — старейший вуз России, основанный в 1724 году. Университет сегодня — научный, образовательный и культурный центр мирового значения, неизменно входящий во все международные рейтинги вузов. В номинации взаимодействие с работодателями QS Graduate Employability 2018 СПбГУ занимает 20 место среди 400 ведущих вузов мира и является лучшим в России. В настоящее время СПбГУ реализует 418 образовательных программ, включающих самые современные направления подготовки и специальности. Сертификат об успешном окончании представленных онлайн-курсов дает 5 дополнительных баллов при поступлении на программы магистратуры и аспирантуры СПбГУ. St Petersburg University is the oldest university in Russia, founded in 1724. The University today is a world-class research, educational and cultural centre which is always included in all international rankings of world universities. St Petersburg University was ranked 20th in QS Graduate Employability Ranking 2018 among 400 leading universities in the world and is the best in Russia. At present, St Petersburg University offers 418 academic programmes, including the most advanced areas and fields of study. The certificate of successful completion of offered online courses gives five additional points when applying for master’s and doctoral programmes at St Petersburg University....

О специализации ''Просто о статистике (с использованием R)'

Специализация “Просто о статистике” познакомит вас с основами прикладного анализа данных. Здесь не будет сложной математики, зато мы разберем на практике множество примеров. Вы научитесь описывать данные графически и при помощи описательных статистик; тестировать гипотезы, делая поправки на множественность тестов. При помощи линейных моделей вы сможете анализировать данные разных типов и проверять, выполняются ли допущения, лежащие в основе статистических методов. В частности, мы разберем, как устроены простая и множественная линейная регрессия, дисперсионный анализ, логистическая и Пуассоновская регрессия и т.д. Наконец, вы научитесь строить смешанные линейные модели, позволяющие работать с данными, когда благодаря дизайну сбора материала отдельные наблюдения оказываются взаимозависимы. Для статистического анализа мы будем использовать язык R -- универсальный язык науки о данных. Даже если вы раньше не писали программ, вы сможете научиться не только адаптировать существующие, но и создавать свои собственные скрипты для анализа данных. Каждый из курсов заканчивается практическим проектом, так что к концу специализации вы сможете собрать портфолио из разных видов анализа данных. Отчеты по проекту, выдержанные в традиции воспроизводимых исследований, вы научитесь создавать, не покидая R, при помощи пакетов knitr / rmarkdown....
Просто о статистике (с использованием R)

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.