Теперь перейдем к проверке гипотез. Допустим, мы хотим проверить гипотезу о том, что коэффициент при доле сельскохозяйственного мужского населения равен нулю. Напомню кратко условия задачи. Итак, у нас есть оцененное уравнение регрессии, есть оценка ковариационной матрицы, известно количество наблюдений. И нам нужно проверить гипотезу о том, что на самом деле, фертильность не зависит от показателя того, насколько этот регион является сельскохозяйственным. Есть три способа проверить гипотезу. Первый способ самый простой — посмотреть на построенный доверительный интервал. Первый способ: посмотреть на доверительный интервал. Мы строили доверительный интервал для β и доверительный интервал для β, когда мы его построили, если его посчитать численно без корней, окажется равным от -0.05 до 0.27. Соответственно, мы видим, что ноль входит в этот доверительный интервал, то есть мы не исключили ноль, значение β равное 0, когда построили доверительный интервал. Это говорит о том, что гипотеза H0 о том, что истинное β = 0 не отвергается. Если предварительно доверительный интервал построен, то проверить гипотезу очень легко, достаточно посмотреть входит ли ноль в доверительный интервал. Второй способ, он не требует построения доверительного интервала, а соответственно, требует некоторых подсчетов. Второй способ — это сравнить t-наблюдаемое и t-критическое. Давайте посмотрим, как выглядит наша статистика. t-статистика, она всегда выглядит как оценка коэффициента минус истинное значение коэффициента делить на стандартную ошибку коэффициента. В нашем случае, мы тестируем гипотезу о том, что истинное значение коэффициента равно нулю. Подставив сюда, мы получаем совсем простую формулу для t-статистики — это отношение оценки коэффициента к стандартной ошибке. Стало быть в нашем случае, это отношение оценки коэффициента к стандартной ошибке, здесь конечно находится оценка дисперсии, поэтому тут надо извлечь корень. Это Var с крышкой, β_а с крышкой. Соответственно, нам надо взять 0.109 поделить на корень из 0.00616 и получится примерно 1.4. Как мы помним, у t-распределения с 44-мя степенями свободы, у него критическое значение, мы его уже считали, это 2.2. И соответственно, мы видим, что t-наблюдаемое, наше t-наблюдаемое попало в область от минус t-критического до t-критического. А это область, где H0 не отвергается, здесь H0 отвергается и здесь тоже H0 отвергается. Соответственно, у нас из-за того, что t-наблюдаемое попало в область, где H0 не отвергается, вывод опять: H0 не отвергается. И есть еще третий способ проверить H0, сравнивая, который на практике используется довольно часто. Третий способ. Очень часто статистические пакеты считают так называемые показатели p-значения. Что это такое? Давайте я на одном графике покажу сложившуюся у нас ситуацию. Вот это t-критическое, это минус t-критическое. Вот это — это α пополам, вот это, это α пополам. Альфа, я напомню, это 5%. И я на соседнем графике изображу картинку с t-наблюдаемым. В нашем случае, t-наблюдаемое оказалось чуть ближе к нулю. Вот это 2.02. А это t-критическое, а t-наблюдаемое (t-observed) это 1.4. Соответственно, α меряет площадь справа и суммарную площадь справа и слева от t-критического. А p-value, подобно альфа, меряет суммарную площадь справа и слева от минус t-наблюдаемого и правее t-наблюдаемого. То есть это P-значение пополам и это P-значение пополам. Соответственно, если компьютер выводит P-значение или мы сами можем его посчитать руками, то достаточно просто сравнить P-значение с α. В нашем случае мы легко можем посчитать P-значение с помощью команды pt. Посчитав t-наблюдаемое равное 1.4 мы можем посчитать площадь, P-значение пополам, соответственно, P-значение пополам — это будет площадь правее t-наблюдаемого, это будет единичка минус площадь слева в точке 1.4 и степени свободы 44, поскольку pt показывает площадь слева. И соответственно, домножив на два, мы выясним, что P-значение равняется в данной задаче 0.17, что больше α и следовательно, вывод тот же самый: H0 не отвергается. P-значение в данной задаче больше α. В литературе, скажем в научных статьях, очень часто стандартные ошибки выписывают под коэффициентами. Это нужно для того чтобы, глядя только вот на одно выписанное уравнение регрессии, можно было устно грубо проверить гипотезу о значимости коэффициентов или построить доверительный интервал. Нормальное распределение для него 95% критические значения это примерно минус два и два соответственно, запомнив всего одно число, двойку, можно устно строить доверительный интервал для коэффициентов. Например, здесь оценка коэффициента β₁ с крышкой равна 59.8. А оценка стандартной ошибки этого коэффициента равна 3.98. Соответственно, 60 прибавляем и вычитаем два раза по четыре. Соответственно, получается, что доверительный интервал для неизвестного β₁ — это от 52 до 68. 60 плюс-минус 2 умножить на 4.60 плюс-минус 8. Это очень легко, можно устно прикинуть или поделить одно на другое, получить t-статистику, сравнить с двойкой и проверить значимость коэффициента. Все статистические пакеты, имеющие отношение к эконометрике, будь-то R, stata, spss, eviews, gretl, всё, что угодно, все они выводят стандартную табличку, по которой можно проверить гипотезы о значимости отдельного коэффициента. Эта табличка устроена простым образом. Сейчас мы разберем, каким конкретно.