[МУЗЫКА] [МУЗЫКА] На примере одновыборочного t-теста мы с вами рассмотрим все шаги алгоритма тестирования и гипотез. Давайте попробуем решить простенькую задачу. Вот представьте себе ситуацию: вы, допустим, хотите купить машину. И вы хорошо подготовились, почитали, что производители говорят про разные машины, выбрали машину и на сайте производителя узнали, каков ее расход топлива с точки зрения производителя. Производитель считает, что расход топлива всех машин, которые он произвел этой модели будет 5.9 литра на 100 километров. Вы хитрый человек, вы понимаете, что производитель вряд ли говорит правду или всю правду по крайней мере. Вы идете на какой-нибудь сайт-агрегатор — сейчас таких много, — где пользователи сами сообщают информацию о расходе топлива их машин. И там вы находите, что есть выборка из 32 машин, чьи владельцы сообщили, какой расход топлива у них. И выяснилось, что там расход топлива в среднем 6.2 литра на 100 километров. И стандартное отклонение — 0.7 литров на 100 километров. В вашу душу закрадывается сомнение, правду ли говорит производитель. Эти цифры выглядят разными, но насколько сильно отличаются? Действительно ли производитель неправ? Давайте попробуем это проверить при помощи t-критерия? Первый этап проверки — это выдвижение статистических гипотез. С нулевой гипотезой все будет очень просто, мы скажем, что реальный расход топлива для машин этой модели не отличается от паспортного. Альтернативная гипотеза — с ней немножко сложнее, потому что они бывают двух сортов. И двухсторонняя альтернативная гипотеза звучала бы так: реальный расход топлива отличается от паспортного. Мы бы не подчеркивали направление различий, нам было бы не важно, больше или меньше — главное, что он не совпадает. Второй вариант формулировки альтернативной гипотезы — это односторонняя гипотеза. Она могла бы формулироваться по-разному в зависимости от того, какие различия мы заранее ожидаем встретить. Например, мы можем заранее ожидать, что средний расход топлива в выборке будет больше, чем тот, который заявлен производителем. Или мы можем, наоборот, считать, что средний расход топлива в нашей выборке будет меньше, чем то, что заявлено. Односторонние гипотезы — они немножко мягче, когда мы их проверяем при помощи тестов. Вы потом поймете, почему, немножко позже. Поэтому традиционно используются чаще всего двухсторонние гипотезы, если нет никаких веских оснований в пользу односторонней. Поэтому мы будем проверять гипотезу о том, отличается ли средний расход топлива от заявленного, не акцентируя внимание на направление этих различий. Эти гипотезы нужно перевести на язык математики. Давайте мы обозначим буквой μ тот расход топлива, который реально у всех машин в генеральной совокупности, у всех машин этой модели, которую произвел производитель. Тогда значение, которое он заявляет в качестве паспортного, это будет μ0. И это какое-то конкретное значение — в нашем случае это 5.9 литров на 100 километров. Мы сформулировали гипотезы, теперь наша задача сконструировать статистику, чтобы их можно было проверить. Давайте представим, что у нас есть выборка из независимых наблюдений, и тогда мы знаем, что если справедлива центральная предельная теорема, то средние значения x будут распределены нормально со средним значением μ и стандартным отклонением, которое будет в корень из n раз меньше, чем стандартное отклонение в генеральной совокупности. Если мы стандартизуем эту величину, то есть вычтем из среднего значения x его ожидаемое значение, среднее в его распределении, и поделим на стандартное отклонение, то эта величина будет подчиняться нормальному распределению, причем стандартному нормальному распределению, у которого среднее значение 0 и стандартное отклонение = 1. Мы бы могли использовать z-тест тогда, но ничего не получится, потому что на самом деле мы не знаем значение σ в генеральной совокупности. Мы его оцениваем при помощи стандартного отклонения в выборке. И тогда статистика, которая у нас есть, она будет подчиняться t-распределению. Она будет подчиняться t-распределению в том случае, если выполняются условия, при которых справедлива центральная предельная теорема. И у этого t-распределения будет число степеней свободы = n − 1, потому что у нас только n − 1 наблюдение независимо друг от друга. О логике получения этого числа степеней свободы вы могли слышать в прошлом модуле. Теперь когда мы сконструировали статистику, нам нужно посмотреть, каковы ее условия применимости. Условия применимости любого теста — это те предположения, которые мы делаем в явном или неявном виде, когда конструируем статистику. В данном случае мы предположили, что выполняются условия, при которых справедлива центральная предельная теорема. Это и будут условия применимости одновыборочного t-теста. То есть нам нужно, чтобы наблюдения были независимы друг от друга, наблюдения о расходе топлива тех 32 машин, которые есть в нашей выборке. И, наверное, это условие, скорее всего, выполняется, потому что это машины разных людей, возможно, с разных континентов, они сошли с разных конвееров. И то, что происходит с одной машиной и ее владельцем, оно совершенно никак не сказывается на том, что происходит с другой машиной. Это независимые наблюдения, здесь все в порядке. Следующее условие применимости связано с объемом выборки. Дело в том, что выборочные средние подчиняются нормальному распределению, только если у нас есть большой достаточно объем выборки — больше 30 экземпляров, либо исходные переменные должны быть нормально распределены. В данном случае у нас объем выборки не очень большой — у нас всего 32 наблюдения, поэтому нам хорошо бы проверить, выполняются ли условия, выполняется ли нормальное распределение для расхода топлива этих машин. Чтобы проверить эти условия, мы построим квантильный график. По оси x мы отложим квантили стандартного нормального распределения, по оси y мы отложим значения расхода топлива в нашей выборке. И если эти точки лягут на одну прямую, как в нашем случае, мы будем считать, что значительных отклонений от нормального распределения нету в нашей выборке. И — ура! — мы можем пользоваться t-статистикой. Теперь нам нужно вычислить значение тестовой статистики по нашим выборочным данным. И мы просто подставляем нужные значения в формулу. Что мы знаем? Что производитель заявляет, что расход топлива — 5.9, подставляем это вместо μ — ожидаемого значения. То, что мы наблюдали в выборке из 32 машин — это 6.2. Знаменатель, соответственно, это выборочное стандартное отклонение, деленное на корень из объема выборки. В результате мы получаем значения статистики — 2.4. Но много это или мало, как нам решить? А решить довольно просто: нам нужно построить распределение t-статистики для того случая, когда справедлива нулевая гипотеза, то есть для случая, когда расход топлива совпадает с паспортным и расход топлива во всей совокупности машин — 5.9 литров. Когда мы построим такое распределение, мы выясним, что в большинстве случаев значение этой статистики будет варьировать вокруг 0. То есть когда мы берем выборку, расход топлива в ней будет очень похож на генеральные значения. Но будут какие-то редкие значения. И, собственно, наша задача понять — насколько редкое значение статистики мы получили. Вы помните, что мы не умеем считать площадь под точкой, то есть мы не можем оценить значение вероятности конкретного значения статистики. Мы можем только понять, насколько часто мы можем получить более экстремальные статистики — те, которые больше t, которое мы вычислили, или меньше −t, потому что порядок уменьшаемого и вычитаемого можем меняться, соответственно, может меняться знак t. Нас будут интересовать оба хвоста, потому что в данном случае мы проверяем двустороннюю гипотезу, то есть нам не важно, больше расход топлива или меньше. Альтернативная гипотеза двусторонняя, она говорит вообще он наличии различий. И это значение вероятности получить более экстремальное значение статистики мы можем вычислить [НЕРАЗБОРЧИВО] очень легко. Нам достаточно взять посчитать площадь вот этого хвоста и умножить ее на 2, потому что t-распределение симметрично. Как считается площадь этого хвоста? Вы помните, мы умеем интегрировать только в одну сторону, только влево. И мы считаем сначала вот этот вот кусочек — вот, собственно, он. А потом вычитаем из 1 его площадь, и тогда мы получаем площадь хвоста. А потом умножаем на 2. В результате мы выясняем, что вероятность получить более экстремальное значение t-статистики, чем мы получили, всего лишь 2 %, то есть это весьма редкое событие — получить такую выборку, в которой настолько сильно будет отличаться расход топлива. Но верить нам этому или нет? Непонятно. Как нам решить? Достаточно оно уже редкое или еще недостаточно? А решение мы будем принимать на основе сравнения с уровнем значимости. Люди договорились друг с другом, что если вероятность получить более экстремальное значение статистики будет больше, чем 5 %, то мы будем считать, что это обычное значение статистики и будем сохранять нулевую гипотезу. А если мы получаем такое значение вероятности, которое меньше, чем выбранный нами критический уровень, то мы отвергнем нулевую гипотезу. В нашем случае получилось, что вычисленный нами уровень значимости p — это 2 %. И это значительно меньше, чем 5 %. Смотрите, это гораздо более редко событие. Соответственно, в данном случае нам нужно отвергнуть нулевую гипотезу в отсутствие различие и принять альтернативную, то есть в данном случае мы можем сказать, что фактически расход топлива, он отличается от того, что заявлено в паспорте у производителя. [БЕЗ_ЗВУКА]