Здравствуйте. В прошлом модуле мы поговорили о том, как работают с моделями, в которых присутствуют одновременно непрерывный предиктор и дискретный фактор. И вот в прошлой нашей беседе одним из важных аспектов было то, что в регрессионных моделях дискретный фактор и непрерывный предиктор иногда могут находиться в состоянии взаимодействия. Тут важно отметить, что присутствие взаимодействия в регрессионных моделях или их отсутствие нельзя постулировать априори. Мы должны провести специальные исследования, чтобы выяснить имеет ли место взаимодействие предикторов в нашей системе или при построении модели ими можно пренебречь. В двух предыдущих примерах, которые мы разобрали - про коз и про объем легких, нам повезло и мы, используя формальный алгоритм сравнения полных и вложенных моделей смогли обоснованно показать, что взаимодействием можно пренебречь. Однако, так бывает далеко не всегда. И вот в этом модуле мы поговорим о том, как поступать в тех случаях, когда избавиться от взаимодействия не удается. Для начала давайте вспомним, что же такое взаимодействие предикторов и как оно выглядит при визуализации модели. Давайте предположим, что в некоторых изучаемых нами системах, имеет место один дискретный фактор с двумя градациями и один непрерывный предиктор. Если взаимодействия предикторов нет, то возможны всего три ситуации. Во-первых - дискретный фактор может не играет никакой роли и в этом случае две линии регрессии, как в этом случае, они полностью объединяются и мы не можем увидеть между ними разницу. Соответственно, в такой ситуации обе линии регрессии могут иметь очень близкие значения углового коэффициента и очень близкие значения свободного члена. В такой ситуации мы можем пренебречь этим дискретным предиктором, однако возможна и другая ситуация. Две линии регрессии могут быть разнесены на достаточно большое расстояние, как вот в этом случае - одна линия регрессии и вторая линия регрессии. И в такой ситуации мы можем утверждать, что дискретный предиктор оказывает существенное влияние на поведение зависимой переменной. С математической точки зрения это означает, что у двух линий регрессии сильно различаются их свободные члены. Однако здесь, как и в других случаях, две линии регрессии имеют одинаковые значения углового коэффициента и стало быть, идут параллельно друг другу. Вот такое параллельное расположение линии регрессии и свидетельствует о том, что в данной системе взаимодействия предикторов не наблюдается или, по крайней мере, мы можем им пренебречь при построении модели. Соответственно, если наша модель отражает реальность, то в этой реальности взаимодействия нет. То есть, характер связи переменной с одним из предикторов не зависит от связей с другим предиктором. Вместе с тем, возможна и другая ситуация. Например, такая: когда две линии регрессии имеют близкие значение интерсепта, но при этом очень разные значения углового коэффициента. Углы у таких линий регрессий могут отличаться значением и свободного члена и углы их наклона, как в этом случае. В такой ситуации мы вынуждены признать, что при разных значениях дискретного фактора, а именно они создают две группы точек и две линии регрессии, связь с дискретным предиктором выглядит по разному. Это и называется взаимодействием предикторов. И вот когда такое взаимодействие выявляется, мы должны быть готовы к тому, что схемы работы с моделями несколько меняется. Однако, перед тем как поговорить о подводных камнях при работе с моделями, включающими взаимодействие, давайте научимся записывать уравнение для модели, включающую взаимодействие предикторов. Мы об этом кратко говорили в предыдущем модуле, но следуя знаменитой поговорке - "Повторение - мать учения", давайте повторим это еще раз.