Сегодня мы разберем — что такое гетероскедастичность, чем она нам грозит, и как с нею бороться, если это нужно. Если бы гетероскедастичность придумали в Древней Руси, ее бы называли «разноразбросие». Что такое гетероскедастичность? При проверке гипотез, построении доверительных интервалов мы предполагали, что условная дисперсия ошибки ε_i при известных иксах равна константе. Это называется «условная гомоскедастичность». В отличие от условной гомоскедастичности в условной гетероскедастичности предполагается, что дисперсия ε_i при фиксированных Х не постоянна, то есть не равна константе и как-то определяется самими регрессорами. Это и называется — гетероскедастичность. Давайте посмотрим, чем нарушение предпосылки о гомоскедастичности нам грозит. Ну для начала давайте разберем небольшую тонкую разницу между условной гетероскедастичностью и безусловной гетероскедастичностью. Итак, условная гетероскедастичность — это когда дисперсия ε_i при фиксированных Х непостоянна. А безусловная гетероскедастичность — это когда дисперсия ε_i просто непостоянна. Давайте на примере поймем аккуратно в чем разница. Чтобы лучше разобраться в разнице между условной гетероскедастичностью и безусловной гетероскедастичностью, рассмотрим три случая, три простых примера. Случай А. Мы рассмотрим случайную выборку, то есть наблюдения будут независимые и одинаково распределены. В частности, пара: ошибка в первый момент и регрессор в первый момент, объясняющий переменную, будут распределены точно так же, как ошибка во второй момент времени и регрессор, относящийся ко второму моменту времени. И эти две пары будут не только одинаково распределены, но и независимы. И зададим закон распределения. Пара x₁ε₁ табличкой. x₁ε₁. x₁ будет принимать значения либо 1, либо 10. ε₁ — мы напишем потенциальное значение: -10, -1, 1, 10. Но по факту в случае А используем меньшее количество вариантов. В табличку занесем вероятность. И в силу независимости и одинаковой распределенности, закон распределения пары ε₂х₂ будет точно такой же. Полностью я переписывать не буду, поставлю здесь «аналогично». И в рамках этого условия я хочу выяснить, имеет ли у меня место условная гетероскедастичность, имеет ли у меня место безусловная гетероскедастичность. Для этого я посчитаю математическое ожидание от ε₁ при условии x₁, математическое ожидание от ε₁ в квадрате при условии x₁. Дисперсию ε₁ при условии х₁. Обычное математическое ожидание от ε₁ безусловное и обыкновенную безусловную дисперсию ε₁. Поскольку закон распределения связки ε₂х₂ такой же, то аналогичные характеристики для пары х₂ε₂ будут точно такими же. Поехали! Математическое ожидание от ε₁ при условии х₁. Поскольку х₁ принимает всего два значения, то нам и надо рассмотреть эти два случая. Какие значения может принимать ε₁, если известно, что х₁ равно 1? Составляем табличку с вероятностями. Получаем, что если х₁ = 1, то есть первая строчка, то ε₁ может принимать значения либо -1, либо 1. Поскольку мы вычеркнули вторую строчку, и мы точно знаем, что мы находимся в рамках первой строчки, то все вероятности пропорционально возрастают так, чтобы в сумме составить 1. То есть вот эти две вероятности с 1/4 увеличиваются в 2 раза, чтобы в сумме дать 1. Значит здесь будет 1/2, 1/2. И аналогично математическое ожидание ε1 при условии, что х₁ равняется 10, значения потенциальные у ε₁ такие же — -1 и 1. И вероятности тоже такие же — 1/2, 1/2. Соответственно, в данной ситуации я вижу, что математическое ожидание от ε₁, если я знаю, что х₁ равно 1, равно -1 * 1/2, +1 * 1/2, = 0. Математическое ожидание от ε₁, если я знаю, что х₁ = 10, = -1 * 1/2 + 1 * 1/2 = 0. Следовательно, я прихожу к выводу, что неважно, что я знаю про х₁, то, что оно равно 1 или то, что оно равно 10, я вижу, что среднее значение ε₁ равно в любом случае 0. Я могу этот факт отразить в виде одной записи, что математическое ожидание от ε₁ при условии, что я знаю х₁, равно 0 вне зависимости от х₁. Аналогично, составляя таблички для ε₁ в квадрате и для ε₁ в квадрате при разных значениях х₁, получаем математическое ожидание от ε₁ в квадрате при условии х₁. Составляем. Значения ε₁ в квадрате, если я знаю, что х₁ = 1. Тут все гораздо проще. Поскольку ε само принимает значения: -1, 1, то квадрат ε, естественно, принимает только значение 1. И вероятность этого = 1. Аналогично для ε₁ в квадрате, если я знаю, что х₁ = 10. ε₁ в квадрате опять же = 1, и вероятность = 1. Стало быть, я вижу, что математическое ожидание от ε₁ в квадрате, если я знаю, что х₁ = 1, = 1. Математическое ожидание от ε₁ в квадрате, если я владею информацией, что х₁ = 10, также = 1. То есть вне зависимости от информации и об иксе, я знаю, что математическое ожидание от ε₁ в квадрате при условии х₁, = 1. Остальные показатели мы уже можем посчитать по, не зная закона распределения, а руководствуясь только имеющейся здесь информацией, по стандартным формулам. Соответственно, дисперсия ε₁ при условии х₁, это есть математическое ожидание от ε₁ в квадрате при условии х₁, минус квадрат условного математического ожидания. Это есть 1- 0 в квадрате, это есть 1. Обыкновенная, безусловная, без наличия информации об иксе. Математическое ожидание от ε₁, пользуясь свойством, что можно внутри без изменения результата дописать любое условное математическое ожидание. Я допишу условное по х₁. Это равняется математическое ожидание от нуля, как мы выяснили, и это 0. И наконец, обычная безусловноя дисперсия ε₁, используя теорему Пифагора, это дисперсия от ε₁, от условного математического ожидания ε₁ при условии х₁, плюс математическое ожидание от условной дисперсии ε₁ при условии х₁. И это есть дисперсия от 0, плюс математическое ожидание от 1, и это есть 1. Соответственно, мы в данной задаче нашли все необходимые нам математические ожидания условной и безусловной и дисперсии. И мы можем теперь сделать вывод о наличии или отсутствии условной и безусловной гетероскедастичности. А именно — что означало бы, что означает условная, условная гомоскедастичность? Условная гомоскедастичность означает, что дисперсия ε_i при условии х_i равно константе. Ну в нашем случае, поскольку результаты не зависят от номера, у нас имеет место случайная выборка с одинаковыми табличками, поэтому, если здесь мы пришли к выводу, что условная дисперсия ε₁ при условии х₁ равна 1, то для любого i это будет в нашем случае всегда равно 1. То есть у нас тут имеет место условная гомоскедастичность. И точно так же в нашем случае, в случае А, имеет место безусловная, безусловная гомоскедастичность. Если я рассмотрю просто дисперсию ε_i, то она вне зависимости от номера, как у первого ε равна 1, так же у второго ε будет равна 1, и у любого ε она будет равна 1. А условия постоянства обыкновенной дисперсии мы называем безусловной гомоскедастичностью.