[МУЗЫКА] [МУЗЫКА]
[БЕЗ_ЗВУКА] В
прошлый раз мы обсудили с вами две модели: это модель Хольта
и модель Тейла-Вейджа, которые представляют собой развитие простой
модели экспоненциального сглаживания для данных, которые могут содержать
линейный тренд и линейный тренд и некоторую сезонную компоненту.
Но, на самом деле, видов рядов, сочетаний тренда и сезонности может
быть достаточно много, и давайте рассмотрим девять основных случаев.
В случае тренда у нас могут быть три различные ситуации: это отсутствие тренда,
наличие линейного тренда и наличие экспоненциального тренда.
В случае сезонности у нас могут быть, как вы помните, мы уже обсуждали,
два вида: нас может быть аддитивная сезонность и мультипликативная сезонность.
Сочетания различных вариантов дают нам 9 вот таких моделей.
Ну эти 9 основных моделей можно графически представить следующим образом.
Так вот модели,
основанные на экспоненциальном сглаживании в принципе можно обобщить следующим
видом и в таком случае подобрать модель именно под тот вид тренда,
который у нас есть, и под тот вид сезонности, который у нас есть в данных.
Ну здесь у нас a1 — это всё тот же адаптационный коэффициент для
некоторого уровня ряда, d1 и d2 у нас подбираются в зависимости от модели,
a2 и r — это либо аддитивный, либо мультипликативный коэффициент тренда,
a2 — это, соответственно, коэффициент линейного тренда,
r — это коэффициент мультипликативного, то есть экспоненциального тренда.
Ну и, соответственно, у нас есть также две компоненты сезонности: это g,
которую мы уже с вами рассматривали в рамках модели Тейла-Вейджа,
это аддитивная сезонность, и также в сезонность у нас может входить
мультипликативная, и для этого у нас есть коэффициент f.
Ну и, как мы уже говорили, d1 и d2 можно подобрать
в зависимости от вида нашей модели, и определяются они по вот такой табличке.
То есть, иными словами, мы смотрим на наши данные, определяем вид тренда (линейный,
экспоненциальный, либо отсутствие тренда),
определяем какого вида у нас сезонность, есть ли у нас вообще сезонность,
входит ли она в модель аддитивно либо мультипликативно, и, собственно,
выбираем ту адаптационную модель, которая нам нужна для наших данных.
Соответственно, если мы потом по этой модели хотим построить некоторый прогноз,
допустим, мы его строим из точки t на k шагов вперёд,
то формулы для прогноза также у нас представлены в виде вот такой таблицы.
На самом деле, определить вид
тренда и сезонность не всегда является простой задачей.
Ну, допустим, мы ещё можем определить есть ли в данных тренд,
но не всегда просто определить, является ли он линейным либо экспоненциальным.
И также достаточно сложной задачей бывает определить характер сезонности.
Входит ли она в модель аддитивно либо мультипликативно.
Поэтому, в принципе, есть такой подход,
когда мы строим по данным сразу несколько моделей и выбираем лучшую.
Такой подход называется адаптивной селекцией и выглядит он следующим образом.
Иными словами, мы строим несколько моделей сразу,
адаптируем их по данным и считаем сглаженную ошибку.
Сглаженная ошибка у нас выглядит следующим образом: γ — это некоторый
параметр сглаживания для ошибки, обычно он берётся равным 0,1.
И, соответственно, в каждый момент времени t мы можем
выбрать наилучшую модель на текущий момент как модель,
у которой на текущий момент минимальная ошибка.
Если вы помните, в рамках прошлой лекции мы рассматривали следующий ряд,
в котором у нас был линейный тренд и недельная сезонность.
Ну и давайте построим три модели по этому ряду: это простое экспоненциальное
сглаживание — модель 1, модель Хольта, то есть модель с линейным трендом — модель 2,
и модель Тейла-Вейджа с линейным трендом и недельной сезонностью — это модель 3.
Прогноз на последние 30 значений у нас для каждой из моделей выглядит следующим
образом, и если в момент, когда мы делаем прогноз,
мы будем выбирать наилучшую модель по минимальной ошибке, то мы видим,
что наименьшая сглаженная ошибка как раз таки получается у модели Тейла-Вейджа,
у которой есть сезонная компонента, что логично,
потому что в данных у нас присутствует явная недельная сезонность, и в принципе
это логичный результат, что именно эта модель у нас получилась наилучшей.
Ну и в следующий раз мы поговорим про следящий контроль.