[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Сейчас мы с вами рассмотрим наиболее типичные, часто встречающиеся меры изменчивости, то есть меры, параметры которой рассчитываются для определения изменчивости по нашей выборке. Это соотвественно размах, межквартильный размах и дисперсия. Часто еще применяется специализированная мера под названием стандартное отклонение. Меры изменчивости очень важны в описательных вариантах описания вашей выборки и в анализе. В статистике эти меры являются чуть ли не основными. Большинство различных интерпретаций, выводов строится именно на этих мерах, на их анализе непосредственно в исходном виде либо в каких-либо модификациях. На экране сейчас вы можете видеть таблицу, в которой представлено соотнесение некоторых мер изменчивости и тех переменных в шкалах, которые можно применять для расчета этих самых мер. В частности мы видим, что такие меры, как размах и межквартильный размах, можно применять на любых типах шкал, кроме номинальной переменной, в номинальной шкале, а в таких шкалах, как интервальная и абсолютная, можно применять расчеты любых мер изменчивости, которые мы с вами рассматриваем. Итак, рассмотрим наиболее типичные, часто встречающиеся меры для неметрических шкал — это размах и межквартильный размах. Для того чтобы определить эти меры изменчивости, нам необходимо провести предварительные расчеты. Нужно вычислить минимум и максимум нашего распределения, чтобы определить размах, и нам нужно вычислить первый и третий квартили, для того чтобы определить межквартильный размах. В частности, если вы сейчас посмотрите на экран, вы можете там увидеть результаты подобного рода расчета. Для наших результатов измерений мы видим минимум, максимум подсчитанный и размах нашего распределения, равный 14. Кроме того, мы видим подсчитанные 1-й и 3-й квартили нашего распределения и межквартильный размах, равный 5,5. При всех прочих равных условиях размах считается проще, но в то же время использование межквартильного размаха предпочтительнее, поскольку он в себя включает наиболее типичную выраженность нашего признака — во-первых. Кроме того, межквартильный размах очень сильно устойчив к возможным выбросам по сравнению с обычным размахом. В этом отношении межквартильный размах точнее позволяет определить типичную меру изменчивости. Также на экране вы можете видеть варианты функции расчета MS Excel всех возможных предложенных вариантов, о которых мы с вами говорили: минимум, максимум, 1-й и 3-й квартили. Далее, размах и межквартильный размах можем получить арифметическим действием — вычитанием. Возвращаясь к распространенному средству визуализации медианы, а также квартилей, именно диаграмме boxplot или ящик с усами, можем с вами отметить, что на этой диаграмме прекрасно визуализируется межквартильный размах. В частности, этот межквартильный размах ограничен 1-м, 3-м квартилем, а именно размерами ящика. Вариант этого схематичного расчета диаграммы вы можете видеть сейчас на экране. Усы этой диаграммы, которые присоединяются к ящику сверху и снизу, являются дополнительным расчетом — рассчитывается с помощью того же самого межквартильного размаха — и являются абсолютным значением в размере полутора межквартильных размахов. Кроме того, крайне полезна функция этих усов в плане возможного анализа вариантов формы вашего распределения и наличия выбросов. Выбросы будут замечены на подобного рода диаграмме в виде отдельных точек, выходящих за пределы усов. Если вы заметили, мы постоянно рассуждаем на тему выбросов в нашем распределении. Это обязательно нам понадобится в дальнейшем, когда мы будем с вами говорить о форме распределения, а конкретно — о конкретном варианте нормального распределения, что наиболее часто применяется в статистическом анализе. Теперь перейдем к описанию таких мер изменчивости, как дисперсия и производное от него стандартное отклонение. Прежде всего, давайте обратим внимание на формулу дисперсии. Желательно крайне хорошо усвоить или, может быть, даже запомнить эту формулу. Она является одной из самых основных в статистике, мы будем часто обращаться к ней. Во многих других производных формулах может встречаться формула расчета дисперсии. Поэтому чем лучше вы запомните эту формулу, чем больше вы поймете вариантов расчета по этой формуле, тем легче вам будет освоить конкретные варианты статистического анализа, тем легче вам будет применять формулы конкретных статистических критериев и тем проще вам будет усвоить материалы этого курса. Давайте рассмотрим формулу более подробно, в виде шагов. На первом шаге мы обязательно рассчитываем среднее значение. В формуле среднее значение обозначено M с индексом x. На втором шаге мы производим сопоставление нашего среднего значения с каждым конкретным значением нашего распределения. Тем самым мы получаем отклонение каждого конкретного распределения от среднего типичного значения. Это основной элемент формулы. Именно за счет этого элемента мы позволяем получить возможные варианты отклонений, которые получаются на нашей выборке. На третьем шаге нашей формулы, на третьем этапе, нам необходимо произвести суммирование всех возможных отклонений, для того чтобы получить общее отклонение по всей нашей выборке, чтобы оценить отклонение наших конкретных значений от типичного значения в целом по выборке. Однако если мы с вами это осуществим, в итоге при суммировании мы получим ноль, поскольку сумма всех отклонений от среднего математически равняется нулю. Чтобы этого избежать, на третьем этапе все возможные варианты конкретных значений от типичного значения возводятся в квадрат. Мы получаем сумму в итоге квадратов разности наших конкретных значений по отношению к среднему значению. На последнем четвертом этапе нам необходимо усреднить результаты наших расчетов отклонений, для того чтобы не быть зависимыми от объемов выборки, для того чтобы иметь возможность сопоставлять результаты этого расчета с другими расчетами. Производится это усреднение за счет отношения суммы квадратов отношений к числу степеней свободы. В формуле это представлено в виде знаменателя N − 1. О том, что такое число степеней свободы, мы посмотрим, мы поговорим позднее. Сейчас же мы с вами в итоге получаем расчет дисперсии. Дисперсия в данном случае нам будет говорить о типичном среднем отклонении всех наших результатов измерения от типичного среднего значения по выборке. То есть насколько в среднем наши испытуемые, например, отличаются по какому-то признаку, измеренному с помощью какой-либо переменной. Наконец, стандартное отклонение. По формуле это есть корень из дисперсии, это величина, производная от дисперсии. И применяется она в большинстве случаев для удобства, поскольку имеет размерность ту же самую, что и среднее значение по выборке, и каждое отдельное значение в том распределении, которое у нас имеется. Если помните, дисперсия, единицы измерения ее — квадратные единицы измерения. Это очень неудобно для сопоставления, допустим, для применения вместе со средним значением, поэтому применяется стандартное отклонение. И очень часто в расчетных таблицах, также в формулах вы можете увидеть не саму дисперсию, а именно стандартное отклонение. Однако помним, что в основе этой величины, этого параметра, лежит расчет именно дисперсии. Результаты расчетов дисперсии и стандартного отклонения вы можете видеть сейчас на экране. То есть мы посчитали это заранее, применили формулы. Кроме того, на экране вы можете видеть и варианты расчета дисперсии и стандартного отклонения с помощью функции MS Excel. Это значительно облегчает и экономит время при проведении расчетов. Если вам требуется как следует освоить понятие дисперсии, то я рекомендую вам осуществить расчеты этой самой дисперсии при выполнении самостоятельных заданий вручную. То есть осуществлять подсчет, непосредственно применяя формулу, и не пользоваться функцией, которую предоставляют нам электронные таблицы Excel.