[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Мы рассмотрели с вами формальные свойства дисперсии. А теперь обратимся к интерпретации дисперсии. Дисперсию можно интерпретировать с двух точек зрения. Во-первых, дисперсия является показателем масштаба или чувствительности применяемой шкалы. Можно пример привести из физики. Как соотносятся сигмы роста в сантиметрах или измеренного в дюймах? На одной и той же выборке. Понятно, что сигма в сантиметрах будет в 2,5 раза выше, чем сигма роста в дюймах, потому что сантиметры — это более чувствительная шкала. Или возраст детей часто представляют в годах, а ещё чаще в месяцах. Понятное дело, что возраст в месяцах — это более чувствительная шкала к возрасту. И поэтому сигма возраста в месяцах будет в 12 раз выше, чем сигма возраста в годах. Ну а теперь представим себе ситуацию, что, применяя один и тот же тест на двух выборках, мы получили существенно разную дисперсию. На одной выборке меньше, а на другой выборке, скажем, в несколько раз выше. Что бы это значило и какие выводы мы можем из этого сделать? Это означает, что одна и та же шкала обладает разной чувствительностью к одной и к другой выборке. В этом случае, конечно, например, сравнивать среднее значение, вычисленное для той и другой выборки, было бы также нелепо, как, скажем, сравнивать среднее значение роста в одной выборке измеренный в сантиметрах, а в другой выборке измеренный в дюймах. Следующий аспект интерпретации дисперсии — это дисперсия как индикатор причин. Что имеется в виду? Вот обратимся к тому примеру, который мы с вами рассматривали в самом начале. Пример изучения связи пола и коммуникативной компетентности. Допустим, мы посчитали дисперсию коммуникативной компетентности, измеренной в количественной шкале для объединённой выборки юношей и девушек. Затем разделили эти две выборки и снова посчитали дисперсию в той и в другой выборке. Если дисперсия не изменилась, какой вывод мы можем сделать? В этом случае вывод один — пол не влияет на коммуникативную компетентность. Напротив, если при разделении выборок в каждой выборке в отдельности мы получим существенно меньшую дисперсию, это будет означать, что пол влияет на коммуникативную компетентность. И, таким образом, пол объясняет часть дисперсии коммуникативной компетентности. Вот эти формулы разложения дисперсии. Дисперсия зависимой переменной, Dx раскладывается на две составные части: факторная составляющая изменчивости, та, которая обусловлена различием между группами, и остаточная дисперсия, которая наблюдается внутри каждой из групп. Вот эта остаточная дисперсия трактуется как та, которая обусловлена всеми иными причинами помимо той, которая учитывается в исследовании. Ну в нашем примере факторная составляющая дисперсии — это та, которая обусловлена различиями в коммуникативной компетентности между юношами и девушками. А остаточная дисперсия, или дисперсия ошибки, — это та, которая наблюдается внутри каждой группы. Внутри группы юношей, внутри группы девушек. Мы можем пойти дальше. Разделить группы юношей и девушек по уровню образования. Скажем, на группу с высшим образованием и группу со средним образованием. Если при этом в этих более однородных группах дисперсии ещё уменьшатся, это означает, что мы нашли ещё одну причину изменчивости, ещё одну причину дисперсии коммуникативной компетентности. На это указывает вторая формула. И так далее. Мы можем находить основания для деления, которые соответствуют предполагаемой причине изменчивости изучаемого явления, и тем самым разложить дисперсию изучаемого явления на составные части по предполагаемым причинам. В идеале мы можем исчерпать все причины изменчивости. Но это только теоретически, на практике это просто невозможно. Всегда останется некоторая доля необъяснённой части дисперсии, которая объясняется влиянием тех причин, которые нам неподконтрольны. Сравнивая между собой доли дисперсий, доли объясняемых дисперсий, скажем, доля дисперсии, которая объясняется половыми различиями, с долей дисперсии, которая объясняется уровнем образования, мы можем также определить какая из причин влияет сильнее. Пол или образование? И так далее. Дополнительный вопрос: стандартизация и z-преобразование. Стандартизация или z-преобразование — это перевод измерений в стандартную z-шкалу. Z-шкала, как и любые другие шкалы, характеризуется двумя основными показателями. Это средним значением, для z-шкалы среднее значение равно 0, стандартное отклонение для z-шкалы равно 1. Каким образом производится z-преобразование? Сначала вычисляется среднее и стандартное отклонение для данной выборки по этой переменной, и затем от каждого значения переменной, от каждого индивидуального значения, вычитается сначала среднее, тем самым производится центрирование, то есть новое среднее значение будет равно 0, и результат делится на σ. Тем самым, новая σ становится равной 1, соответственно, дисперсия тоже становится равной 1. Формула z-преобразования приведена на экране. Для чего проводится z-преобразование? Мы увидим в дальнейшем, что это преобразование чрезвычайно важно для применения закона нормального распределения. Также z-преобразование весьма удобно для интерпретации индивидуальных показателей, потому что после z-преобразования мы видим для каждого индивидуального значения больше или меньше среднего, соответственно, если положительная величина z-значения, значит данное индивидуальное значение выше среднего, если отрицательное — так ниже среднего. И насколько выше или насколько ниже среднего, в единицах z. На экране вы видите пример z-преобразования средней отметки учащихся в 10 и в 11 классе, соответственно, Отметка1 и Отметка2. И, сравнивая между собой показатели в z-шкале, мы можем видеть, у кого улучшилась успеваемость, у кого ухудшилась успеваемость, и насколько улучшилась или ухудшилась успеваемость. В дополнение к интерпретации мер изменчивости, дополнительной меры изменчивости, прежде всего рассмотрим асимметрию. Программы могут вычислить этот показатель, показатель асимметрии. Формула приведена ниже. Значение асимметрии пропорционально z³. Как видите, суммируются значения z³ и делятся на N. Это показатель родственной дисперсии. Если дисперсию называют вторым моментом случайной величины, то показатель симметрии называют ещё третьим моментом случайной величины. И по этому показателю мы можем судить, насколько сильно выражена асимметрия, и каков её характер. Скажем, если показатель асимметрии равен 0, это означает, что распределение в точности симметрично. Если же показатель асимметрии меньше 0, это будет означать правостороннюю асимметрию, если же показатель асимметрии положителен, то это будет означать левостороннюю асимметрию. Показатель изменчивости, тоже характеризующий форму распределения, это эксцесс. Эксцесс — мера островершинности или плосковершинности распределения. Показатель эксцесса тоже может быть вычислен при помощи компьютерной программы, формула приведена ниже. Высокий эксцесс будет означать чрезмерную островершинность распределения, и, как правило, мы наблюдаем значительный показатель эксцесса в том случае, если редко встречаются существенно отклоняющиеся от среднего значения, то есть выбросы, то есть мы показатель эксцесса можем использовать для определения того, есть ли экстремально большие или экстремально малые значения, от которых, может быть, следовало бы избавиться. Отрицательные значения эксцесса будут означать, что слишком часто встречаются значения, отклоняющиеся от среднего, и слишком редко те, которые близки к среднему. Ну и, наконец, нулевое значение эксцесса означает так называемую нормальную выпуклость, которая соответствует нормальному распределению.