Это видео посвящено критерию Стьюдента для связанных выборок. С помощью этого критерия мы будем решать задачу оценки эффективности лечения синдрома дефицита внимания и гиперактивности у умственно отсталых детей. В эксперименте участвуют 24 ребенка. Каждый из них неделю принимает плацебо, а неделю принимает препарат метилфенидат. По окончании каждой недели каждый ребенок проходит тест на способность к подавлению импульсивных поведенческих реакций. Данные, которые мы анализируем, перед вами на этой диаграмме рассеяния. По горизонтальной оси здесь отложена способность к подавлению импульсивных поведенческих реакций после недели приема плацебо, по вертикальной — после недели приема препарата. Каждая точка здесь соответсвует одному ребенку. Таким образом, несмотря на то что у нас две выборки, эти выборки не являются независимыми, поскольку значения здесь померяны на одних и тех же объектах. Это и есть случай связанных выборок. Мы хотим понять, эффективно ли лечение с помощью метилфенидата. Большая часть точек на этом графике лежит выше диагонали. Это значит, что после приема метилфенидата у большинства детей способность к подавлению импульсивных поведенческих реакций увеличилась. Но значимо ли это изменение? Для того чтобы ответить на этот вопрос, нам нужен статистический критерий. Будем использовать t-критерий Стьюдента для связанных выборок. Итак, у нас есть две связанные выборки одинакового объема n. Первая — из нормального распределения с параметрами μ1 и σ1, вторая — с параметрами μ2 и σ2. Мы хотим проверять нулевую гипотезу о том, что μ1 и μ2 равны, и мы можем это делать против любой односторонней или двусторонней альтернативы. Проверку мы будем вести с помощью T-статистики, равной отношению разности выборочных средних X1 и X2 к какому-то стандартному отклонению S / √n. Вот это S — это выборочное стандартное отклонение, посчитанное на выборке D попарных разностей между X1 и X2, взятых на соответствующих объектах. Нулевое распределение такой статистики — это распределение Стьюдента с числом степеней свободы n − 1. В числителе здесь стоит разность выборочных средних X1 и X2. Это то же самое, что выборочное среднее разности X1 − X2. Таким образом, t-критерий для двух связанных выборок эквивалентен одновыборочному t-критерию, примененному к выборке попарных разностей. Вернемся к нашей задаче. Нулевая гипотеза, которую мы проверяем, — это отсутствие эффективности нашего лечения: способность к подавлению импульсивных поведенческих реакций не изменилась, μ1 = μ2. Проверять эту гипотезу мы будем против двусторонней альтернативы, поскольку мы не можем исключать, что способность к подавлению импульсивных поведенческих реакций в результате применения нашего препарата уменьшится. t-критерий Стьюдента для связанных выборок дает значение достигаемого уровня значимости p, равное примерно 0,004. То есть нулевая гипотеза о том, что средняя способность к подавлению импульсивных поведенческих реакций не изменилась, отвергается на уровне значимости 0,05. Точечная оценка для изменения признака в результате применения нашего препарата, а это разность выборочных средних, и равна она примерно пяти пунктам. 95 % доверительный интервал для этой величины, построенный с помощью распределения Стьюдента, составляет от 1,8 до 8,1 пунктов. Итак, на протяжении последних трех видео мы рассмотрели пять разновидностей t- и z-критериев Стьюдента. Мы рассмотрели критерии Стьюдента для одновыборочной задачи, для двухвыборочной задачи с независимыми выборками и со связанными выборками. В следующем видео мы поговорим о предположении нормальности, которое лежит в основе всех рассмотренных нами критериев.