[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Здравствуйте, дорогие друзья. Мы продолжаем наше занятие по практике по курсу «Математические методы в психологии. Основы применения». На сегодняшнем занятии мы рассмотрим такое важное понятие, как нормальное распределение, некоторые его свойства, и заодно рассчитаем несколько критериев на основе применения нормального распределения. Прежде чем мы приступим непосредственно к рассмотрению понятия нормального распределения, давайте обратим свой взор на экран, увидим там интересную задачу. На этой задаче мы можем с вами увидеть пример того, как некорректно можно рассчитывать среднее значение на распределениях метрической переменной. В частности, вы видите, что по рассчитанным параметрам среднее значение значительно выше, чем медиана. В этом случае, если мы обратим свой взор на гистограмму, мы увидим, что среднее значение как бы смещается в сторону от интервала наиболее типичных значений к интервалу нетипичных значений. Происходит это за счет имеющихся в распределении выбросов, которые сконцентрированы на гистограмме в отдельном столбце с правой стороны. Наличие этих выбросов оттягивает на себя расчет среднего значения, и среднее значение перестает отвечать своей главной функции, а именно — описывать типичные значения распределения. В данном случае лучшим вариантом для применения является медиана. И в конечном счете, нам некорректно будет применять параметрические критерии, статистические критерии расчета, основанные на использовании среднего значения. Поскольку среднее значение, как мы видим с вами, не рассчитывать здесь — некорректно. Что же можно делать? Какие варианты решения у нас имеются? Вариант первый: это отказаться от использования некорректного среднего значения, применяя для анализа типичных случаев медиану, и использовать соответствующие непараметрические критерии, то есть рассчитывать статистические параметры без использования среднего значения. Вариант второй: серьезнее относиться к нашим результатам измерения, использовать точные инструменты и в конечном счете получать переменные, которые позволяют все-таки применять нормальное распределение, то есть позволяют в конечном счете использовать среднее значение. Что же такое это «нормальное распределение»? На экране вы сейчас видите схему подобного рода распределения. Это распределение кратко можно описать как описание наиболее типичных случаев. Оно симметрично относительно вертикальной оси. То есть в середине нашего ряда находятся наиболее типичные случаи, они близки к среднему, и их большинство. По краям ряда расположены нетипичные, крайние случаи. Крайне низкие и крайне высокие. Использование нормального распределения возможно по достаточно большому количеству шкал, которые мы можем с вами увидеть в живой природе вокруг нас. Например, это масса тела человека. Например, это рост человека, и ряд других показателей, которые мы можем измерять. За счет своих свойств симметричности, описанию некоторого серединного положения, нормальное распределение обладает некоторым интересным свойством, которое позволяет предсказывать те значения, которые у нас имеются в ряду. То есть рассчитывать вероятности проявления этих самых значений в ряду. То есть мы можем с вами предсказывать, как часто у нас могут встречаться люди определенного веса, например, если у нас вес тела соответствует нормальному распределению, как часто встречаются в ряду люди определенного роста, соответственно, если у нас рост нормального вида. Другими словами, нормальное распределение предоставляет нам некий стандарт распределения. Мы можем свести большинство наших распределений, которые по своей форме похожи на нормальные, к некоторому стандартному нормальному распределению и дальше производить по нему множество интересных расчетов. Как мы можем с вами это сделать? Обратите внимание на формулу, которую вы видите на экране. По этой формуле вы можете получить значение нашей переменной, в данном случае это z-значение, значение новой шкалы, стандартной шкалы, через расчеты параметров по нашему старому распределению или, чаще говорят, старому распределению сырых баллов. Каждое значение шкалы сырых баллов может привести в новое значение z-распределения. Применяется это для разных случаев. Варианты этих случаев вы можете видеть на экране. Рассмотрим первый вариант, а именно работа со свойствами нормального распределения для того, чтобы предсказывать определенным образом значения по нашей выборке. Сейчас на экране можете видеть наиболее типичные, часто встречающиеся варианты интервалов, описывающие непосредственные вероятности появления тех или иных событий, которые описываются нормальным распределением. Эти интервалы разделены на две группы. В первой группе мы отталкиваемся от величин интервала, связанных со стандартным отклонением. Обратите внимание, в интервале от среднего значения до одного стандартного отклонения либо в левую сторону, либо в правую сторону, у нас заключается примерно 34 % всей выборки, всех возможных результатов измерения. Если мы объединим два этих интервала в один большой, то мы увидим что в наиболее большой, типичный результат измерения от −1 стандартного отклонения до +1 стандартного отклонения включается примерно 68 % измерений по всей выборке. То есть подавляющее большинство всех возможных измерений. Эти интервалы достаточно стандартны. Можно рассчитать не только эти интервалы, но и любые другие. Во вторую группу у нас попадают интервалы, где происходит ориентировка не на основе величин стандартного отклонения, а на основе самих вероятностей. В данном случае, вы видите процентные доли. Наиболее распространенный интервал — это 95%-ный интервал. Называют подобного рода интервалы еще доверительными интервалами. С помощью подобного рода интервалов можно определить или рассчитывать интервалы возможного изменения среднего значения по выборке или статистического критерия, который мы рассчитываем, или ряд других параметров. Подобного рода интервалы применяются в статистике очень часто, и мы с ними еще столкнемся. Желательно помнить, конечно же, некоторые возможные интервалы, которые наиболее часто применяются в расчетах, но не забывайте о том, что любые интервалы мы с вами можем рассчитать. Давайте как раз посмотрим пример подобного рода расчетов. Сейчас вы видите на экране задачу. Внимательно прочитайте эту задачу. Что нам необходимо сейчас сделать? Нас просят найти как раз таки вероятность попадания результатов измерений в определенные интервалы. Всего таких мини-задач нам нужно выполнить три. Две из них достаточно простые, а одна достаточно сложная. Давайте с вами разберемся, посчитаем, как это выполняется на практике. Итак, начинаем мы с того, что рассчитываем параметры нашего распределения, то есть параметры по сырым баллам. Нам обязательно нужно вычислить среднее значение и стандартное отклонение. Обратите внимание, что они уже подсчитаны, вы их видите на экране. Это 3,9 — среднее значение, 0,25 — стандартное отклонение. Зная эти параметры, мы можем с вами осуществить преобразование таблицы сырых данных, то есть шкалу с сырыми баллами, перевести в шкалу стандартных z-оценок. Это будет все та же переменная, только преобразованная в другие единицы измерения. Воспользуемся уже известной нам формулой и проведем преобразование. Результат преобразования вы можете видеть в таблице, в соответствующем столбце с z-оценкой. Кроме того, можно не только применять подобного рода расчеты вручную, но и использовать электронные таблицы Excel. Варианты расчета с помощью таблиц Excel вы также видите на экране. Функцию, которую можно использовать. На втором этапе мы обязательно должны рассчитать вероятности этих самых событий. Вероятности мы можем рассчитать сами, либо взять, вытащить из таблиц с нормальными, стандартными единичными вероятностями. Они встречаются довольно-таки часто, и все таблицы, которые мы будем использовать в наших расчетах, вы можете найти в дополнительных материалах к нашим занятиям. Обратите внимание, что у нас уже представлен столбец в нашей таблице с вероятностями. Вероятности рассчитаны для каждого нашего значения. В таблице представлены вероятности только для положительных значений, но они идентичны и для отрицательных значений, если мы будем брать z-оценки по модулю. Давайте перейдем к ответам на задачу. Первый ответ — нас просят узнать, какова вероятность, что оценки наших школьников в среднем будут выше, чем 4 балла. В таблице мы уже можем видеть результат этого ответа. Вероятность эту можете увидеть, равняется она примерно 3,5, или 35 %. То есть оценки наших школьников выше четырех баллов встречаются по выборке в 35 % всех случаев. Аналогично поступаем с поиском вероятности для интервала оценок для второй части нашей задачи, а именно сколько человек, какова вероятность встретить по выборке оценку у школьников 3,55 и ниже. Немного сложнее обстоит дело с третьей частью, сложной, нашей задачи. Видим, что она состоит как бы из трех частей. Для нас важно найти интервал, вероятность попадания нашей оценки в интервал от среднего значения и до минимума, то есть меньше среднего значения. Нас интересует интервал попадания оценки от среднего значения до 4,15 балла, и интервал от 4,15 балла и выше. Соответственно, в конечном итоге нас интересует интервал от 4,15 балла и меньше. Посмотрите внимательно на формулу. Она складывается из нескольких подсчетов нескольких вероятностей, нескольких интервалов. Посмотрите внимательно на таблицу и проверьте, как именно производится подобного рода расчет.