[БЕЗ_ЗВУКА] В этом видео мы начнем разбираться с первым классом прогнозирующих моделей — это будут модели ARMA. Если помните, мы уже пытались свести задачу прогнозирования временного ряда к задаче обучения с учителем, которую мы очень хорошо умеем решать, и делать регрессию значений ряда на какие-то признаки, зависящие от времени, например, линейные и квадратичные тренды. Получалось очень плохо, этих признаков недостаточно, нужны какие-то еще. Откуда их можно взять? Идея: давайте будем делать регрессию ряда не на какие-то внешние признаки, зависящие от времени, а непосредственно на его собственные значения в прошлом. Составим регрессионное уравнение, в котором в качестве отклика будет стоять yt, в качестве признаков — y в моменты времени (t − 1), (t − 2), ..., (t −p). Параметрами этой модели, которые мы будем оценивать, будут α и φ1, ..., φp — это, собственно, константы, которые нам нужны для того, чтобы модель задать. И кроме того, добавим в модель шумовую компоненту εt, которая будет описывать отклонения значений ряда от всего того, что в этом уравнении записано. Такая модель называется моделью авторегрессии порядка p. В этой модели yt представляет собой линейную комбинацию p предыдущих значений ряда и шумовой компоненты εt. Запомним этот класс моделей. Давайте рассмотрим еще один. Это модели типа скользящего среднего. Для того чтобы лучше понимать, как они устроены, давайте для начала возьмем независимый одинаково распределенный во времени шум εt, вот он перед вами на графике. Давайте теперь для каждого t посчитаем среднее арифметическое между εt и ε(t − 1). То, что получается при этом, перед вами на графике. Если теперь мы будем усреднять не две, а три соседние компоненты ε, то мы получим вот такую кривую. Если мы возьмем среднее по четырем соседним точкам, кривая будет вот такая. То, что получается в результате такого усреднения — это уже ни в коем случае не простая выборка с независимыми одинаково распределенными элементами. Соседние значения на этой красной линии очень похожи друг на друга, потому что в формулах для них участвуют одни и те же шумовые компоненты. Давайте попробуем эту идею обобщить и запишем вот такую модель ряда. Значение ряда в момент времени t, yt, мы будем представлять в виде линейной комбинации значений шума в q предыдущие моменты времени, а также нового значения шума в момент времени t, εt. Параметры, которые в этой модели нужно оценить — это α и все θ: θ1, ..., θq, коэффициенты перед предыдущими значениями шума. Такая модель называется моделью скользящего среднего порядка q. Она утверждает, что значение нашего ряда представляет собой линейную комбинацию q последних значений шумовой компоненты. Эта модель выглядит достаточно странно. Шумовая компонента — это что-то, что мы не можем наблюдать. Как же мы такую модель будем обучать и зачем она нам вообще нужна? Сначала ответим на второй вопрос, а потом постепенно разберемся с первым. Давайте проделаем вот такой трюк. Возьмем авторегрессионную модель порядка p и модель скользящего среднего порядка q и просто сложим то, что стоит в их правых частях. Полученная модель записана перед вами. Она называется моделью ARMA порядка (p, q) и состоит ровно из авторегрессионной компоненты порядка p и компоненты скользящего среднего порядка q. А теперь главное. Теорема Вольда утверждает, что любой стационарный временной ряд может быть описан моделью ARMA(p, q) с правильным подбором значений параметров p и q. Это прекрасный результат. Он говорит нам о том, что семейство моделей ARMA(p, q) достаточно богато для того, чтобы в нем можно было найти более или менее хорошую модель, описывающую любой стационарный ряд. Давайте, например, посмотрим на вот этот ряд с поголовьем рыси. Мы этот пример уже видели и уже знаем, что этот ряд действительно стационарен, а значит, можно надеяться, что в классе ARMA(p, q) для него можно найти какое-то достаточно хорошее описание. Действительно, если мы посмотрим на модель, например, ARMA (2, 2), мы увидим, что то, что получается, уже достаточно сильно похоже на наш ряд. Эта модель не во всех точках близка к истинному значению ряда, но, по крайней мере, это уж точно намного лучше, чем если бы мы сделали линейную регрессию на линейный или квадратичный временной тренд. Настроив эту модель ARMA(2, 2), ее можно использовать и для построения прогноза, то есть для решения той задачи, ради которой мы здесь, собственно, и собрались. Итак, в этом видео мы рассмотрели класс моделей ARMA(p, q). Этот класс, благодаря утверждению теоремы Вольда, мы знаем, что достаточно широк для того, чтобы более или менее точно описывать все стационарные временные ряды. В следующем видео мы поговорим о том, что делать с временными рядами нестационарными.