Об этом курсе
Недавно просмотрено: 1,789

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 21 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Русский

Субтитры: Русский

Приобретаемые навыки

Data ModelingRegression ValidationR ProgrammingLinear RegressionStatistics

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Прибл. 21 часа на выполнение

Предполагаемая нагрузка: 9 hours/week...

Русский

Субтитры: Русский

Программа курса: что вы изучите

Неделя
1
3 ч. на завершение

Корреляционный анализ. Простая линейная регрессия

Мы начнем разговор о методах численного описания связей между количественными величинами с коэффициентов ковариации и корреляции, которые позволяют оценить силу и направление связи. Затем вы узнаете, какую дополнительную информацию о связях можно получить, построив линейную модель зависимости между величинами. Вы научитесь интерпретировать коэффициенты регрессии и узнаете, когда и как можно использовать линейные модели для предсказаний на новых данных. К концу этого модуля вы научитесь подбирать уравнение линейной модели и строить ее график с доверительной областью....
14 видео ((всего 97 мин.)), 2 материалов для самостоятельного изучения, 1 тест
14 видео
Пример - размер мозга и IQ8мин
Взаимосвязи между явлениями8мин
Ковариация и корреляция9мин
Тестирование статистической значимости коэффициента корреляции4мин
Корреляционный анализ в R4мин
Модели как отражение взаимосвязи6мин
Простая линейная регрессия9мин
Метод наименьших квадратов10мин
Подбор коэффициентов линейной регресии в R6мин
Стандартные ошибки коэффициентов регрессии7мин
Доверительные интервалы коэффициентов и доверительная зона регрессии6мин
Использование регрессии для предсказаний9мин
Что мы знаем и что будет дальше3мин
2 материала для самостоятельного изучения
Обзор курса10мин
Материалы: Корреляционный анализ. Простая линейная регрессия10мин
Неделя
2
3 ч. на завершение

Проверка значимости и валидности линейных моделей

Построить линейную модель и записать ее уравнение - это только самое начало анализа. В этом модуле вы узнаете, как описывать результаты регрессионного анализа: как проверить статистическую значимость модели в целом или ее коэффициентов, оценить качество подгонки. У линейных моделей (вернее, у статистических тестов, которые для них используются), как у любого метода, есть свои ограничения. Вы узнаете, что это за ограничения и откуда они возникают. Графические методы диагностики, которыми мы будем пользоваться, универсальны для разных линейных моделей - больше практики поможет вам увереннее принимать решения. Разобравшись со всем этим, вы сможете написать на языке R полный скрипт для подбора, диагностики и представления результатов простой линейной регрессии....
13 видео ((всего 89 мин.)), 1 материал для самостоятельного изучения, 1 тест
13 видео
Тестирование значимости коэффициентов регрессии при помощи t-теста7мин
Тестирование значимости модели при помощи F критерия8мин
Качество подгонки модели4мин
Не стоит обольщаться. Зачем нужна диагностика моделей4мин
Разновидности остатков6мин
Влиятельные наблюдения и как с ними бороться8мин
Линейность связи8мин
Независимость наблюдений10мин
Нормальное распределение остатков6мин
Постоянство дисперсии остатков5мин
Анализ остатков в R10мин
Что мы знаем и что будет дальше3мин
1 материал для самостоятельного изучения
Материалы: Проверка значимости и валидности линейных моделей10мин
Неделя
3
3 ч. на завершение

Краткое введение в мир линейной алгебры

В этом модуле мы с вами погрузимся в самое сердце линейных моделей. Для этого вам придется изучить или вспомнить основы линейной алгебры. Мы обсудим разновидности матриц, способы их создания в R и основные операции с ними. Все это нам понадобится, чтобы разобраться, как устроена линейная регрессия изнутри. Вы узнаете, что такое модельная матрица, научитесь записывать уравнение линейной регрессии в виде матриц и находить его коэффициенты. Вы своими глазами увидите хэт-матрицу, которая позволяет получать предсказанные значения, и даже сможете ее вычислить вручную. Наконец, вы научитесь рассчитывать остаточную дисперсию, вариационно-ковариационную матрицу и использовать все это для того, чтобы строить доверительную зону регрессии. Потом эти знания помогут вам разобраться с устройством более сложных моделей: с дискретными предикторами, с другими распределениями остатков, с иным устройством вариационно-ковариационной матрицы....
11 видео ((всего 81 мин.)), 1 материал для самостоятельного изучения, 1 тест
11 видео
Разновидности матриц3мин
Основные действия с матрицами7мин
Основы матричного умножения9мин
Умножение двух матриц10мин
Решение систем уравнений при помощи матриц12мин
Линейная регрессия в матричном виде7мин
Вычисление остатков в матричном виде5мин
Строим график модели вручную6мин
Доверительная зона регрессии в матричном виде10мин
Что мы знаем и что будет дальше2мин
1 материал для самостоятельного изучения
Материалы: Краткое введение в мир линейной алгебры10мин
Неделя
4
3 ч. на завершение

Множественная линейная регрессия

Чаще всего связи между величинами устроены сложнее, чем это можно описать при помощи простой линейной регрессии. Множественная линейная регрессия используется, чтобы описать, как переменная-отклик зависит от нескольких предикторов. С появлением в модели множества предикторов у линейной регрессии появляется новое условие применимости - требование отсутствия мультиколлинеарности. В этом модуле вы узнаете, как можно выявить мультиколлинеарность и избежать ее. Наконец, нередко во множественных моделях переменных больше, чем это можно изобразить на плоскости, поэтому мы научим вас простым приемам, которые помогут создавать информативные графики даже в таком случае....
12 видео ((всего 93 мин.)), 1 материал для самостоятельного изучения, 1 тест
12 видео
Пример - маркер рака простаты3мин
Протокол анализа данных7мин
Разведочный анализ в R17мин
Модель множественной линейной регрессии и ее интерпретация11мин
Мультиколлинеарность и другие условия применимости15мин
Взаимодействия предикторов3мин
Сравнение влияния отдельных предикторов7мин
Качество подгонки модели множественной линейной регрессии3мин
Визуализация модели: один предиктор10мин
Визуализация модели: два предиктора5мин
Что мы знаем и что будет дальше1мин
1 материал для самостоятельного изучения
Материалы: Множественная линейная регрессия10мин
Неделя
5
4 ч. на завершение

Сравнение линейных моделей

Множественные линейные модели подобны конструктору: более сложные модели можно разбирать на части и упрощать. Вы узнаете, как сравнение вложенных моделей при помощи частного F-теста используется при проверке значимости отдельных предикторов или их групп. Более сложные модели лучше описывают исходные данные, но избыточное усложнение опасно, т.к. такие модели начинают давать плохие предсказания на новых данных. При помощи частных F-тестов можно упрощать модели, постепенно исключая незначимые предикторы. Упрощенные модели легче использовать для интерпретации и представления результатов. Все, что вы успели узнать о линейной регрессии, вы сможете применить, выполнив проект по анализу данных, где нужно будет корректно построить оптимальную множественную линейную модель и представить ее результаты в отчете, написанном при помощи rmarkdown и knitr....
9 видео ((всего 55 мин.)), 1 материал для самостоятельного изучения, 2 тестов
9 видео
Полные, уменьшенные и вложенные модели3мин
Частный F-критерий6мин
I и II типы сумм квадратов9мин
Зачем бывает нужно упрощать модели7мин
Упрощение моделей при помощи частных F-тестов6мин
Диагностика финальной модели7мин
Визуализация финальной модели6мин
Что мы знаем и что будет дальше2мин
1 материал для самостоятельного изучения
Материалы: Сравнение линейных моделей10мин

Преподаватели

Avatar

Варфоломеева Марина Александровна

Старший преподаватель
Кафедра зоологии беспозвоночных
Avatar

Хайтов Вадим Михайлович

Доцент
Кафедра Зоологии беспозвоночных

О Санкт-Петербургский государственный университет

Санкт-Петербургский государственный университет (СПбГУ) — старейший вуз России, основанный в 1724 году. Университет сегодня — научный, образовательный и культурный центр мирового значения, неизменно входящий во все международные рейтинги вузов. В номинации взаимодействие с работодателями QS Graduate Employability 2018 СПбГУ занимает 20 место среди 400 ведущих вузов мира и является лучшим в России. В настоящее время СПбГУ реализует 418 образовательных программ, включающих самые современные направления подготовки и специальности. Сертификат об успешном окончании представленных онлайн-курсов дает 5 дополнительных баллов при поступлении на программы магистратуры и аспирантуры СПбГУ. St Petersburg University is the oldest university in Russia, founded in 1724. The University today is a world-class research, educational and cultural centre which is always included in all international rankings of world universities. St Petersburg University was ranked 20th in QS Graduate Employability Ranking 2018 among 400 leading universities in the world and is the best in Russia. At present, St Petersburg University offers 418 academic programmes, including the most advanced areas and fields of study. The certificate of successful completion of offered online courses gives five additional points when applying for master’s and doctoral programmes at St Petersburg University....

О специализации ''Просто о статистике (с использованием R)'

Специализация “Просто о статистике” познакомит вас с основами прикладного анализа данных. Здесь не будет сложной математики, зато мы разберем на практике множество примеров. Вы научитесь описывать данные графически и при помощи описательных статистик; тестировать гипотезы, делая поправки на множественность тестов. При помощи линейных моделей вы сможете анализировать данные разных типов и проверять, выполняются ли допущения, лежащие в основе статистических методов. В частности, мы разберем, как устроены простая и множественная линейная регрессия, дисперсионный анализ, логистическая и Пуассоновская регрессия и т.д. Наконец, вы научитесь строить смешанные линейные модели, позволяющие работать с данными, когда благодаря дизайну сбора материала отдельные наблюдения оказываются взаимозависимы. Для статистического анализа мы будем использовать язык R -- универсальный язык науки о данных. Даже если вы раньше не писали программ, вы сможете научиться не только адаптировать существующие, но и создавать свои собственные скрипты для анализа данных. Каждый из курсов заканчивается практическим проектом, так что к концу специализации вы сможете собрать портфолио из разных видов анализа данных. Отчеты по проекту, выдержанные в традиции воспроизводимых исследований, вы научитесь создавать, не покидая R, при помощи пакетов knitr / rmarkdown....
Просто о статистике (с использованием R)

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.