Разберем конкретный пример проверки гипотезы и построения доверительных интервалов для коэффициентов. Предположим, что мы по 47 наблюдениям оценили модель следующего вида. Скажем, у нас были данные по швейцарским кантонам, разных показателей для каждой провинции, каждого кантона. И вот мы оценили показатель, как зависит показатель фертильности от доли населения, занятого в сельском хозяйстве этом кантоне, и доли католического населения, 0.115 умножить на долю католического населения в этом кантоне. И, соответственно, у нас поскольку есть вектор β с крышкой, это вектор оценки коэффициентов, соответственно, там есть β₁ с крышкой, β при доле сельскохозяйственного населения и β при доле католического населения. У нас появляется оценка ковариационной матрицы этого вектора, то есть матрица, где лежат все оценки дисперсий, все оценки ковариаций этих трех коэффициентов. Любой эконометрический пакет выводит оценку ковариационной матрицы. И, соответственно, в нашем случае она оказалась равна 15.9; -0.257; -0.257; это матрица симметричная, 0.00616; -0.007, -0.00135, -0.007, -0.00135 и 0.00182. Еще раз подчеркну смысл каждого коэффициента. Например, вот этот вот коэффициент, он находится в третьей строчке, во втором столбике. Соответственно, он показывает ковариацию, оценку третьего коэффициента со вторым. Вот второй, вот третий, это третья строчка, второй столбик, соответственно, это оценка ковариации второго коэффициента, второй — это коэффициент при доле сельскохозяйственного населения, и третьего коэффициента. А, например, вот этот вот коэффициент, он находится в третьей строчке в третьем столбце, стало быть, это оценка дисперсии третьего коэффициента, то есть дисперсия β с крышкой при доле католического населения. Итак, имея следующие данные, наша задача — сделать следующее. Первое — построить, построить 95%-ый доверительный интервал для истинного коэффициента при доле католического населения, то есть β без крышки. Второе — проверить гипотезу о том, что этот самый истинный коэффициент зависимости равен нулю, то есть на самом деле зависимости от доли сельскохозяйственного населения нет, против альтернативной гипотезы о том, что на самом деле все-таки зависимость от доли сельскохозяйственного населения есть, то есть о том, что β_a не равно нулю. И тут надо выбрать какой-нибудь уровень значимости, давайте выберем уровень значимости пять процентов. И третье — построить, построить 95%-ый доверительный интервал для неизвестного показателя дисперсий σ². И здесь нам, соответственно, понадобится показатель σ², σ² с крышкой, σ² с крышкой, который равен 11.07 в квадрате. Поехали. Как у нас строится доверительный интервал? Для построения доверительного интервала мы используем некую теорему. Нам надо, соответственно, либо верить в нормальность остатков, либо предполагать, что у нас очень много наблюдений. В данном случае 47 наблюдений это не так много, поэтому единственный способ проверить гипотезу — это работать в предположении, что остатки нормальны, то есть мы за кадром используем предположение, что ε_i нормальный с математическим ожиданием 0 и дисперсией σ². Без этого предположения мы не можем тестировать гипотезы и строить доверительные интервалы. И, соответственно, используя это предположение, мы знаем, что у нас есть теорема, которая нам гарантирует, что t-статистика, имеющая вид β с крышкой при доле сельскохозяйственного населения, минус β_a настоящее, делить на стандартную ошибку β_a с крышечкой, эта величина должна иметь t-распределение с (n - k) степенями свободы. В данном случае у нас t-распределение с 47 по условию минус k, это количество оцениваемых коэффициентов, здесь оценивалось три коэффициента, значит 47 минус 3, то есть t-распределение с 44-мя степенями свободы. И, соответственно, теперь мы можем уже построить свободно доверительный интервал. Как у нас выглядит t-распределение, его функция плотности? Функция плотности t-распределения выглядит примерно вот так, похожа на нормальную. Это, соответственно, t-распределение с 44-мя степенями свободы. Есть некие два значения, какое-то минус t-критическое и t-критическое, так что посередке площадь равна 0.95, а по краям приходится по 2.5 % площади. Соответственно, вероятность того, что вот эта дробь, вот эта t-статистика, β_a с крышкой минус β_a, деленное на стандартную ошибку β_a с крышкой, лежит от минус t-критического до t-критического, эта равно вероятность попасть от минус t-критического до t-критического, и равна вот этой площади, и то есть равна 0.95. У нас получается некое неравенство, в котором фигурирует неизвестная β_a, заметьте, что β_a с крышечкой мы знаем, вот оно, стандартную ошибку мы найдем как корень из дисперсии и t-критическое мы найдем с помощью компьютера или из таблицы. Соответственно, мы в этом неравенстве знаем все, кроме β_a, и β_a мы, соответственно, можем просто выразить. Для этого домножим на знаменатель, вычтем β_a с крышкой и помножим на минус 1, то есть в этом неравенстве найдем β_a. Окажется, что β_a лежит в диапазоне от β_a с крышечкой плюс t-критическое на стандартную ошибку β_a с крышечкой, а тут β_a с крышечкой минус t-критическое на стандартную ошибку β_a с крышечкой. И, стало быть, вероятность того, что β_a накроется этим интервалом, равна 0.95, потому что я просто заменил неравенство на эквивалентное. И теперь я могу все посчитать, у меня получается, что интервал β_a лежит, то есть 95%-ый, доверительный интервал имеет следующий вид: β_a с крышечкой 0,109 минус t-критическое, по таблице можно найти t-критическое, либо таблица, либо компьютер. Мы, конечно, воспользуемся компьютером, мы скажем, что вот если рассмотреть, например, t-критическое, то площадь слева от него, вот я даже специально перерисую картинку, то есть я рассмотрю t-критическое, то площадь слева от него 0.975. Соответственно, t-критическое, которое я ищу, — это квантиль для, соответственно, 97.5%. И я, например, могу его найти в R командой q квантили t-распределения, qt, площадь слева 0,975, и надо указать степени свободы, потому что t-распределение — это не одно распределение, это некое семейство. То есть здесь надо написать, что степени свободы df равно 44. И, соответственно, компьютер мне выдаст, если это сделать, то компьютер мне выдаст 2.02, и это значение t-критического. Подставляем его сюда: минус 2.02 на стандартную ошибку, то есть на корень из 0.00616 до 0.109 плюс 2.02 на корень из 0,00616. Соответственно, вот мы получили доверительный интервал для неизвестного коэффициента β.