Добрый день! На предыдущей неделе мы с вами познакомились с играми в развёрнутой форме, описывающими последовательные стратегические взаимодействия, и научились их решать с помощью алгоритма обратной индукции. На этой неделе мы с вами проанализируем свойства решений, которые получаются с помощью такого алгоритма, а также поговорим о том, как связаны игры в развёрнутой форме и игры в нормальной форме. Давайте вернёмся к примеру про Винни-Пуха, о котором мы говорили в прошлый раз. Значит, мы выяснили, что между Винни-Пухом и осликом Иа-Иа было стратегическое взаимодействие, которое можно было представить в виде игры в развёрнутой форме. На ваших экранах сейчас приведено описание этой игры. Мы построили дерево игры, описали множество стратегий Винни-Пуха, описали множество возможных стратегий Иа-Иа. Напомню, что множество возможных стратегий Винни-Пуха состоит из двух стратегий: у него ход… ему принадлежит ход в одной вершине. В этой вершине у него два возможных действия. У Иа-Иа две вершины, в которых ему принадлежит ход. В каждой из этих вершин у него два возможных действия. Значит, всего у Иа-Иа четыре возможные стратегии. Мы обозначать эти стратегии будем парой букв. Первая буква будет соответствовать действию Иа-Иа в верхней вершине, в которой ему принадлежит ход, то есть в том случае, если Винни-Пух съел мёд, а вторая буква будет обозначать действие Иа-Иа в нижней вершине, в которой ему принадлежит ход, то есть в том случае, если Винни-Пух принёс полный горшочек с мёдом. Например, стратегия ПН будет обозначать такую стратегию Иа-Иа: в случае, если Винни-Пух принесёт пустой горшочек, я приму этот подарок, а в случае, если Винни-Пух принесёт полный горшочек, я его не приму. В общем случае, если мы сталкиваемся с игрой, в которой у игрока есть n вершин, в которых ему принадлежит ход, стратегия игрока может быть закодирована указаниями, что делать в каждой из этих n вершин. То есть в общем случае стратегия игрока может быть закодирована набором из n вот таких вот букв, из n действий. И теперь давайте попробуем сделать следующее. Мы знаем множество возможных стратегий каждого из игроков. Давайте запишем по горизонтали стратегии одного игрока, по вертикали — стратегии другого игрока и составим матрицу этой игры. То есть на пересечении i-й строчки и j-го столбца укажем платежи, которые получают игроки, если первый игрок сыграет i-ю свою стратегию, а второй игрок сыграет j-ю свою стратегию. Итак, какие платежи, например, получат игроки, если сыграют профиль (Н, НП), то есть если Винни-Пух не будет есть мёд, а ослик Иа-Иа будет играть такую стратегию: не принимать подарок, если Винни-Пух съел мёд, и принимать подарок, если Винни-Пух принёс полный горшочек. В этом случае игра будет развиваться так: в начальной вершине, в которой ход принадлежит Винни-Пуху, он — смотрим на его стратегию — не будет есть мёд. Значит, игра перейдёт в нижнюю вершину. Здесь ход принадлежит ослику Иа-Иа. Мы смотрим на то, что предписывает стратегия ослика Иа-Иа делать ему в нижней вершине. У нас за нижнюю вершину отвечает вторая буква в его стратегии, это буква П — принимать подарок. Значит, в соответствии с этой стратегией в этом профиле ослик Иа-Иа примет этот подарок, и игра закончится в терминальной вершине, в которой игроки получают платежи 5 и 10, соответственно. То есть Винни-Пух получит 5, Иа-Иа получит 10. Значит, мы можем поставить платежи, равные 5 и 10 соответственно, в профиле, в клетке матрицы, которая соответствует профилю (Н, НП). Абсолютно аналогично заполняются все остальные ячейки матрицы. Мы, зная какой профиль играют игроки, какие стратегии играет каждый из игроков, можем проанализировать, куда придёт эта игра. Начинаем с первой вершины, знаем стратегию первого игрока, — значит, знаем, куда попадём мы из первой вершины. Дальше смотрим на то, кому принадлежит ход в той вершине, в которую мы попали, смотрим на стратегию того игрока, кому принадлежит в ней ход, и так далее. Рано или поздно придём к терминальной вершине, получим платёж, соответственно, составим эту матрицу. Итак, матрицу составили, но после того как у нас составлена матрица игры, мы можем воспользоваться всеми концепциями, которые мы изучали до сих пор, когда изучали матричную запись игр в нормальной форме. Мы можем проанализировать, есть ли в этой игре доминирующие стратегии. Мы можем проанализировать, есть ли в этой игре равновесия Нэша. Давайте отметим оптимальные ответы каждого из игроков в ответ на стратегию другого игрока в этой игре. Итак, отметим точками лучшие ответы Винни-Пуха на фиксированную стратегию Иа-Иа, а звёздочками отметим наилучшие ответы Иа-Иа на фиксированную стратегию Винни-Пуха. Наилучшие ответы обозначены на ваших экранах. Получается, что в этой игре есть три равновесия Нэша: это профиль, в котором Винни-Пух ест мёд, а ослик Иа-Иа всегда принимает подарок, независимо от того, съел Винни-Пух мёд или нет. Это профиль, в котором Винни-Пух ест мёд, а ослик Иа-Иа принимает подарок в случае, если ему достаётся пустой горшочек, и не принимает подарок в случае, если ему достаётся полный горшочек. И, наконец, третий профиль, в котором Винни-Пух не ест мёд, а Иа-Иа принимает подарок только в случае, если ему достаётся полный горшочек. Итак, в этой игре есть три равновесия Нэша. В каждом из них каждый игрок играет оптимально в ответ на фиксированную стратегию другого игрока.