Об этом курсе
4.6
Оценки: 66
Рецензии: 10
Этот курс - первый в специализации "Анализ данных". Курс будет особенно полезен тем, кто имеет небольшой опыт работы с данными, или хочет освежить знания по теории вероятностей, математической статистике и типах данных. Сначала мы вспомним основы теории вероятностей и поговорим о случайных величинах и их свойствах, об основных распределениях случайных величин. Затем перейдем к основным характеристикам распределений: мерам центра и мерам вариативности. Далее обсудим основные типы шкал измерения признаков, а также основные ограничения, которые тип шкалы накладывает на применимые методы анализа данных. Третья неделя курса посвящена графическому анализу данных и способам визуализации распределений, индивидуальных или совместных. Завершающий модуль курса посвящен выборкам и способам их формирования, а также принципам и инструментам работы с пропущенными и неопределенными значениями. Вы сможете применить полученные знания, выполнив небольшой проект на реальных данных, предоставленных компанией 2GIS. Присоединяйтесь!...
Globe

Только онлайн-курсы

Начните сейчас и учитесь по собственному графику.
Calendar

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Intermediate Level

Промежуточный уровень

Clock

Approx. 9 hours to complete

Предполагаемая нагрузка: 5 недель обучения, 3-5 часов в неделю...
Comment Dots

Russian

Субтитры: Russian...
Globe

Только онлайн-курсы

Начните сейчас и учитесь по собственному графику.
Calendar

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.
Intermediate Level

Промежуточный уровень

Clock

Approx. 9 hours to complete

Предполагаемая нагрузка: 5 недель обучения, 3-5 часов в неделю...
Comment Dots

Russian

Субтитры: Russian...

Программа курса: что вы изучите

Week
1
Clock
3 ч. на завершение

ОСНОВЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ

В первом модуле курса мы вспомним основы теории вероятностей. Мы поговорим о вероятности и её свойствах, о случайных величинах и их характеристиках, а также об основных распределениях случайных величин и их ключевых свойствах. Этот модуль формирует основы для понимания принципов, на которых строится статистический анализ данных....
Reading
7 видео (всего 43 мин.), 9 материалов для самостоятельного изучения, 4 тестов
Video7 видео
1.1. Введение в теорию вероятностей6мин
1.2. Свойства вероятности4мин
1.3. Характеристики случайных величин7мин
1.4. Непрерывные распределения. Часть 16мин
1.5. Нормальные и логнормальные непрерывные распределения6мин
1.6. Дискретные распределения6мин
Reading9 материала для самостоятельного изучения
О чем этот курс и как он устроен10мин
Дополнительные материалы по статистическим пакетам10мин
Данные, на которые мы опираемся и ссылаемся10мин
Введение в теорию вероятностей (презентация)10мин
Свойства вероятности (презентация)10мин
Характеристики случайных величин (презентация)10мин
Непрерывные распределения. Часть 1 (презентация)10мин
Нормальные и логнормальные непрерывные распределения (презентация)10мин
Дискретные распределения (презентация)10мин
Quiz4 практического упражнения
Вопросы для самоконтроля6мин
Вопросы для самоконтроля6мин
Вопросы для самоконтроля6мин
Основы теории вероятностей20мин
Week
2
Clock
2 ч. на завершение

ОСНОВЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ВЫБОРОЧНЫХ ДАННЫХ

В этом модуле мы поговорим об описательных статистиках и о двух типа характеристик распределений: меры центральной тенденции (или просто меры центра: что типично для исследуемого распределения) и меры вариативности (или меры разброса: насколько разнообразны значения признака, распределение которого исследуется). Для начала мы разберемся с типами данных, немного поговорим о выборках, и затем рассмотрим основные меры центра и разброса, применимые для данных разных типов. В завершении модуля мы посмотрим, как рассчитываются описательные статистики в SPSS и в R....
Reading
8 видео (всего 52 мин.), 7 материалов для самостоятельного изучения, 2 тестов
Video8 видео
2.2. Выборка случайных величин5мин
2.3. Меры центральной тенденции11мин
2.4. Меры вариативности9мин
2.5. Несмещенная дисперсия2мин
2.6. Меры и типы переменных: что и где применимо?6мин
Практика 1. Описательные статистики в R2мин
Практика 2. Описательные статистики в SPSS7мин
Reading7 материала для самостоятельного изучения
Типы данных (презентация)10мин
Выборка (презентация)10мин
Меры центральной тенденции (презентация)10мин
Меры вариативности (презентация)10мин
Обзор способов расчета процентилей и межквартильного размаха10мин
Несмещенная дисперсия (презентация)10мин
Меры и типы переменных: что и где применимо (презентация)10мин
Quiz2 практического упражнения
Вопросы для самопроверки4мин
Основы статистического анализа выборочных данных20мин
Week
3
Clock
2 ч. на завершение

ГРАФИЧЕСКИЙ АНАЛИЗ ДАННЫХ

В этом модуле мы займемся графическим анализом данных. Сначала мы увидим, как по-разному могут выглядеть распределения, обладающие похожими характеристиками. Затем рассмотрим основные виды графиков, поймём области их применения и основные ограничения для каждого графического инструмента. В практической части курса мы научимся строить графики в SPSS и в R....
Reading
7 видео (всего 50 мин.), 5 материалов для самостоятельного изучения, 6 тестов
Video7 видео
3.2. Гистограмма и методы её построения6мин
3.3. Box plot, или ящик с усами4мин
3.4. Диаграмма рассеяния6мин
3.5. Графики для неметрических шкал7мин
Практика 1. Построение графиков в R8мин
Практика 2. Построение графиков в SPSS11мин
Reading5 материала для самостоятельного изучения
Почему важно визуализировать данные... (презентация)10мин
Гистограмма и методы ее построения (презентация)10мин
Box plot, или ящик с усами (презентация)10мин
Диаграмма рассеяния (презентация)10мин
Графики для неметрических шкал (презентация)10мин
Quiz6 практического упражнения
Вопросы для самопроверки4мин
Вопросы для самопроверки6мин
Вопросы для самопроверки6мин
Вопросы для самопроверки6мин
Вопросы для самопроверки6мин
Графический анализ данных20мин
Week
4
Clock
2 ч. на завершение

ФОРМИРОВАНИЕ ВЫБОРОК И ПОДГОТОВКА ДАННЫХ

В этом модуле мы поговорим о том, как строить выборки, а также научимся работать с пропущенными и неопределенными данными. Мы рассмотрим основные виды выборок, научимся рассчитывать необходимый объем выборки и ошибку выборки, а также разберём, как кодировать пропущенные и неопределённые данные и что делать с ними дальше. В практической части модуля мы научимся формировать массив данных в SPSS так, чтобы сэкономить время на этапе обработки и анализа данных. ...
Reading
6 видео (всего 45 мин.), 5 материалов для самостоятельного изучения, 2 тестов
Video6 видео
4.2. Ошибки выборки7мин
4.3. Определение необходимого объема выборки4мин
4.4. Работа с пропущенными наблюдениями5мин
4.5. Кодирование неопределённых ответов6мин
4.6. Формирование массива данных в SPSS. Практика11мин
Reading5 материала для самостоятельного изучения
Выборки (презентация)10мин
Ошибки выборки (презентация)10мин
Определение необходимого объема выборки (презентация)10мин
Работа с пропущенными наблюдениями (презентация)10мин
Кодирование неопределенных ответов (презентация)10мин
Quiz2 практического упражнения
Вопросы для самопроверки6мин
Формирование выборок и подготовка данных20мин

Преподавателя

Ольга Ечевская

доцент, кандидат социологических наук
Кафедра общей социологии ЭФ НГУ

Наталья Галанова

Специалист по анализу данных
Компания 2GIS

Виктор Дёмин

Специалист по анализу данных, кандидат технических наук
Компания 2GIS

О Novosibirsk State University

Novosibirsk State University (NSU) is a research university located in Novosibirsk Akademgorodok, the world-famous scientific center in Siberia. 80% of NSU teachers are active researchers affiliated with the Russian Academy of Sciences; therefore education is closely linked to world-class science: our students get first-hand knowledge about scientific discoveries before they are published. Nearly 6000 students (including international students from 37 countries) are enrolled at undergraduate and graduate programs offered by 13 departments. The leading areas of NSU expertise are natural sciences, life sciences, physics, math, IT, and more....

О специализации ''Анализ данных'

В рамках специализации вы освоите основные методы работы с количественными данными, в том числе основы теории вероятностей и математической статистики, инструменты исследования связей между признаками, научитесь строить прогнозы на основе регрессионных моделей, сравнивать группы, выделять группы методами кластерного анализа, строить классификации, визуализировать данные, интерпретировать и представлять результаты статистического анализа. Вы примените эти методы на учебных примерах и сможете адаптировать их под специфику ваших данных и задач. В курсах специализации мы рассмотрим, как оценить связь условий труда и удовлетворенности работой, как спрогнозировать количество кликов на сайт компании, как разделить университеты на классы, как выявить стратегии поиска работы, как отличить геозависимую рубрику от геонезависимой, и множество других практических задач. Кроме того, мы научимся решать такие задачи в популярных средах анализа данных (SPSS и R). В заключительной части каждого курса вам предстоит выполнить проект на реальных данных, который позволит применить полученные знания на практике и продемонстрировать умение анализировать и представлять результаты анализа статистически и графически. Специализация разработана Новосибирским государственным университетом, одним из ведущих исследовательских университетов России и мира, совместно с 2GIS, известной международной технологической компанией, которая разрабатывает сервисы для комфортной жизни в городе....
Анализ данных

Часто задаваемые вопросы

  • Once you enroll for a Certificate, you’ll have access to all videos, quizzes, and programming assignments (if applicable). Peer review assignments can only be submitted and reviewed once your session has begun. If you choose to explore the course without purchasing, you may not be able to access certain assignments.

  • When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile. If you only want to read and view the course content, you can audit the course for free.

Остались вопросы? Посетите Центр поддержки учащихся.