[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Продолжаем нашу работу с нормальным распределением и его свойствами. И сейчас мы с вами рассмотрим варианты проверки нашего распределения на нормальность. Мы очень много и долго говорили о том, как хорошо нормальное распределение. Теперь давайте поговорим о том, как же, собственно говоря, определить, нормальным является распределение у нас измеренной переменной или все-таки нормальным оно не является. Первый вариант проверки — это использование специфических статистических критериев. Конечно же, их можно при большом желании рассчитать вручную, но это будет довольно долго, трудоемко. Поэтому чаще всего производится расчет в специализированных компьютерных статистических пакетах. Варианты этих пакетов вы видите сейчас на экране. Каков основной принцип расчета по подобному принципу? Сопоставляется форма распределения, форма распределения, с одной стороны, вашего эмпирического и форма эталонной модели, в частности, форма эталонной модели нормального распределения. Если при применении критерия разница между формами распределения не обнаруживается, то ваше распределение по этому критерию признается распределением нормального вида. Достаточно удобно, при применении компьютерных программ быстро и эффективно, является уже распространенным стандартом. Применение подобного рода критерия является уже эффективным средством, но при этом не стоит относиться к применению критериев как к панацее, потому что каждый критерий рассчитан все-таки на сопоставление с определенным видом распределения. Применять его лучше в определенных условиях. И если вы знаете, как его использовать, как его не использовать, вы можете пренебрегать подобного рода правилом. Но при этом обязательным условием сохраняется изучение, подробное изучение вашего распределения и как минимум отслеживание выбросов в вашем распределении, поскольку, если помните, именно выбросы очень сильно влияют на расчет среднего значения по метрической переменной. Обращайте на это пристальное внимание. Второй способ проверки на нормальность — это расчет специальных параметров распределения — асимметрии и эксцесса. Не будем сейчас подробно разбираться, что это такое, как это считается. Можете оставить это на самостоятельное освоение, либо внимательно прослушайте лекционную часть курса. Самое главное, что нам необходимо для практических расчетов, — это помнить о том, что асимметрия и эксцесс распределения по форме нормального вида или напоминающее нормальное распределение должны быть как можно ближе расположены к 0. В идеальном случае, в случае нормального распределения асимметрия и эксцесс равны 0. Определение границ, при котором мы с вами относим распределение к нормальному или распределение ненормального вида, различно. Используются различные техники. Самая простая техника, которую можно применять при расчетах вручную, — это сопоставление асимметрии и эксцесса с 1. Если модуль ваших расчетов асимметрии и эксцесса не превышает значения 1, то, скорее всего, ваше распределение достаточно симметрично, вершина расположена в среднем положении и, соответственно, в вашем распределении не присутствуют выбросы и оно похоже на нормальное. То есть рассчитывать среднее значение по вашей метрической переменной вполне корректно. Третий способ проверки вашего распределения на нормальность — это графический способ. Этот вариант вы можете видеть сейчас на экране. При этом с левой части экрана представлено распределение, которое больше по форме похожее на нормальное распределение, а в правой части экрана расположено распределение, по форме менее похожее на нормальное. Оно менее симметрично, вершина расположена не в среднем положении. Кроме того, мы видим, там встречаются нетипичные случаи, то есть выбросы. В идеальном случае при использовании графического способа проверки на нормальность было бы построить и сопоставить полигон вашего распределения с графиком, идеальным графиком, эталонным графиком формы нормального распределения, и увидеть, совпадают ли полигон и этот график или сильно не совпадают. Существуют и другие способы графической проверки распределения на нормальность. Например, с помощью уже рассмотренной нами ранее диаграммы box plot, то есть «ящик с усами», мы с вами помним, что в случаях крайне ненормального распределения на этом графике мы увидим выбросы в виде отдельных точек, выходящие за пределы усов или межквартильных размахов. Второй способ — это построение квантильных графиков. Квантильные графики вручную строить довольно трудоемко. В программе Excel старых версий квантильные графики тоже не построить. Строятся они очень часто в специализированных пакетах. Опять же, варианты этих пакетов вы можете видеть на экране. Квантильные графики достаточно интересны, достаточно точны. Нужно, конечно же, уметь их интерпретировать. При этом они применяться для проверки нормальности довольно часто. Это очень удобный и быстрый способ проверки. Рассмотрим простой пример проверки нашего распределения, его формы на нормальность. Воспользуемся при этом построением гистограммы, которую можно с вами сделать как вручную, так и с помощью с электронных таблиц, так и с помощью расчетов асимметрии и эксцесса. Формулы расчетов этих параметров были приведены выше. Кроме того, не забывайте, что в электронных таблицах Excel есть специальные функции, которые позволяют довольно-таки быстро посчитать эти параметры. Сейчас на экране вы можете видеть результаты подобного рода проверки, результаты расчетов. В частности, представлена гистограмма. По гистограмме мы можем сказать, что распределение наше достаточно симметричное. Вершина у нас расположена примерно в среднем положении. И по гистограмме мы не наблюдаем выбросов. Это самое главное. Также проведены расчеты асимметрии и эксцесса. Если мы внимательно посмотрим на эти значения, они у нас, конечно же, отличаются от 0, другими словами, наше распределение не идеально нормальной формы, но при этом мы видим, что значения асимметрии и эксцесса не превышают по модулю 1, то есть, в целом, укладываются в границы, которые позволяют нам говорить, что наше распределение метрической переменной все-таки похоже на нормальное распределение. Другими словами, у нас достаточно оснований проводить расчет среднего значения, и это среднее значение по нашей выборке будет достаточно корректным. Я призываю вас обязательно проделать задание для самостоятельной работы к этому занятию и проделать этих занятий как можно больше, чтобы закрепить свои навыки. [БЕЗ_ЗВУКА]