Проверим гипотезу сразу о нескольких коэффициентах. К примеру, исследователь оценил модель зависимости стоимости квартиры в Москве от ряда факторов. У исследователя была модель 1 и модель 2. Модель 1 имела следующий вид. Логарифм стоимости квартиры объяснялся следующим образом: минус 0.215 плюс 0.83 умножить на логарифм общей площади плюс 0.268 помножить на логарифм жилой площади плюс 0.196 на логарифм площади кухни плюс 0.112 умножить на дамми-переменную, которая равна единичке для кирпичных домов и ноль иначе, минус 0.01 на расстояние до метро в минутах и плюс 0.1 на дамми-переменную, которая означает метро пешком. И модель 2 была короче. Исследователь предположил, ну тут какие-то коэффициенты маленькие, – 0.01, 0.1. А давайте вот мы уберём те переменные, которые характеризуют удаленность от метро. Собственно, и метро пешком или на транспорте, и время, — они характеризуют удалённость квартиры от метро, то есть эти две переменные, они отвечают за одну и ту же идею. Давайте мы их уберём, рассмотрим модель попроще. Соответственно, модель 2 имела следующий вид: логарифм price с крышкой, — он оценил, соответственно, модель без этих двух переменных и получил, естественно, другие результаты: минус 0.261 плюс 0.795 помножить на логарифм общей площади плюс 0.309 помножить на логарифм жилой площади и плюс 0.13 помножить на дамми-переменную, отвечающую за кирпичность дома. И известно, что в модели 1 сумма квадратов остатков RSS оказалась равна 62.6, а в модели 2 RSS оказался равен, сумма квадратов остатков, 69.3. И известно, что оценивание производилось по 2040-ка наблюдениям. Соответственно, вопрос следующий: какую модель следует предпочесть? Первую модель — она, конечно, более сложная, но она, вроде, и предсказывает получше, RSS поменьше? Либо вторую — она, может, чуть-чуть похуже предсказывает, но зато она проще? Вот вопрос, является ли разница RSS вызванной случайными факторами или у нас вот просто систематически мы пропустили в модели 2 значимые важные переменные? То есть формально наша гипотеза H_0 формулируется в виде гипотезы о равенстве, то есть гипотеза о том, что β при переменной metrdist равняется нулю, и β при переменной walk равняется нулю. А альтернативная гипотеза формулируется о том, что хотя бы один из этих двух коэффициентов, хотя бы один из β_metrdist или β_walk не равен нулю. То есть неважно, какое неравенство нарушено, все равно H_0 не выполнено. Эта гипотеза проверяется с помощью F-статистики. Напомню формулу для F-статистики. Это RSS ограниченной модели минус RSS неограниченной модели делить на количество ограничений делить на RSSur на (n – k_ur). В нашем случае два ограничения. Ограниченной моделью является модель, где мы считаем, что β равны нулю, то есть более короткая модель ограниченная. М2 — это ограниченная модель, а М1 — это неограниченная модель. Подставляя, соответственно: 69.3 минус 62.6 делим на 2 (у нас два ограничения, раз, два), делим на RSS_ur, это 62.6, делить на количество наблюдений 2040, минус k (это количество оцениваемых коэффициентов в неограниченной модели); в неограниченной модели у нас раз, два, три, четыре, пять, шесть, семь — семь коэффициентов оценивалось β с крышкой. И если это посчитать, окажется, что примерно получается 110. А с точки зрения теории, у нас есть теорема, которая говорит, что при верной H_0 F-статистика должна иметь, наблюдаемая F-статистика должна иметь F-распределение со степенями свободы r и (n – k_ur). То есть у нас должно быть F-распределение с 2, 2033 степенями свободы. F-распределение выглядит следующим образом. Поскольку у нас степени свободы две, то поэтому тут такой особый случай, вот она выглядит так вот. Обычно F-распределение для большого количества степеней свободы выглядит примерно вот так. Но для двух — это небольшое исключение. Есть здесь некое F критическое. Давайте проверим. Я не указал уровень значимости. Ну давайте возьмём, скажем, уровень значимости, ошибка первого рода, вероятность ошибки первого рода 5 %. Если я беру вероятность ошибки первого рода 5 %, то у меня справа от F критического оказывается площадь 0.05, слева от F критического 0.95. И, соответственно, можно, например, либо по таблицам, либо с помощью R найти, что F-критическое — это квантиль F-распределения с вероятностью 0.95 слева, степени свободы 1 — это 2 и степени свободы вторые — это 2033. И дав, например, эту команду в R, мы получим результат, что F-критическое примерно равно трём. Соответственно, вот это три, а наше F-наблюдаемое, Fobs, оно существенно дальше, чем F-критическое, то есть у нас разница между RSSr и RSSur слишком велика. То есть мы попадаем в область, где H_0 отвергается. Слишком велика разница между этими моделями в RSS, то есть первая модель предсказывает существенно лучше, это не случайность — такое большое отличие в RSS. А вот здесь было бы, если бы у нас F-наблюдаемое попало в эту область, то H_0 не отвергалась бы. Соответственно, в нашем случае вывод: H_0 отвергается. Гипотеза H_0 состояла в том, что коэффициенты равняются нулю, то есть один из коэффициентов, пропущенных во второй модели не равен нулю, пропускать коэффициенты — это плохо, то есть мы делаем вывод, что нам надо предпочесть модель 1, а не модель 2.