Однако вспомним прошлую лекцию. На прошлой лекции у нас получилось, что решение одно. Воспользовавшись алгоритмом обратной индукции, мы поняли, что игроки будут играть профиль, в котором Винни-Пух будет есть мёд, а Иа-Иа всегда будет принимать подарок. Что же делать? С одной стороны, обратной индукцией мы получили одно решение, а равновесий Нэша — три. Дело в том, что когда мы решали игру с конца, то мы предполагали более сильное условие… мы предполагали выполнение более сильного условия, чем в случае, когда мы анализируем игру на равновесие Нэша. Когда мы анализируем игру с помощью алгоритма обратной индукции, то мы на каждой подыгре находим оптимальный ответ игрока. В равновесии Нэша, вообще говоря, нет такого требования. Если профиль является равновесием Нэша, то совершенно необязательно на каждой подыгре каждый игрок играет оптимально, потому что может быть так, что игра до какой-то подыгры и не добирается. Мы пошли по одной ветке игры, а где-то на другой ветке какой-то из игроков играет неоптимально. В этом случае эта неоптимальность может не нарушить равновесие Нэша, потому что отклониться и воспользоваться этой неоптимальностью может быть невыгодно. Итак, не все равновесия Нэша обладают тем свойством, что на каждой подыгре каждый игрок играет оптимально. Например, давайте рассмотрим профиль стратегий, в котором Винни-Пух ест мёд и приносит пустой горшочек, а Иа-Иа принимает подарок в случае, если ему приносят пустой горшочек, и не принимает подарок в случае, если ему приносят полный горшочек. Ослик Иа-Иа в этой игре ведёт себя неоптимально в том случае, если Винни-Пух решает не есть мёд: Иа-Иа отказывается от подарка. В этом случае он получает полезность, равную нулю, хотя если бы принял подарок, то получил бы полезность, равную десяти. Это означает, что в этой подыгре ослик Иа-Иа играет неоптимально. Поэтому этот профиль мы не нашли, когда анализировали эту игру с помощью алгоритма обратной индукции. Тем не менее этот профиль является равновесием Нэша, потому что Винни-Пух никак не может эксплуатировать для себя эту неоптимальность поведения Иа-Иа на подыгре, в которой он не ест мёд. Ни одному из игроков не выгодно отклониться при текущих стратегиях каждого из них. Если Винни-Пух ест мёд, то Иа-Иа всё равно что делать на подыгре, в которой Винни-Пух не ест мёд, — игра туда не придёт. А если, наоборот, мы зафиксируем стратегию Иа-Иа, в которой тот принимает подарок в случае, если Винни-Пух ест мёд, и не принимает подарок в случае, если Винни-Пух не ест мёд. Так вот, если мы зафиксировали такую стратегию Иа-Иа, то Винни-Пуху невыгодно пересматривать своё решение есть мёд, — сейчас он получает полезность, равную десяти. Ему невыгодно менять это решение на «не есть мёд», потому что в этом случае он получит полезность, равную минус десяти. Значит, ни один из игроков не может улучшить свою полезность, отклонившись и выбрав другую стратегию. Значит, это всё-таки равновесие Нэша. Но не нужно удивляться, что в равновесии Нэша, повторюсь ещё раз, кто-то из игроков может играть неоптимально на той или иной подыгре, до которой игра как таковая и не добирается в этом профиле. То же самое, если мы посмотрим на профиль стратегий, в котором Винни-Пух не ест мёд, а ослик Иа-Иа играет такую стратегию: не принимать подарок, если Винни-Пух съел мёд, и принимать подарок, если Винни-Пух принёс полный горшочек. Так вот, этот профиль тоже является равновесием Нэша, но в этом профиле Иа-Иа снова ведёт себя неоптимально на одной из подыгр. В этом случае он ведёт себя неоптимально в том случае, если Винни-Пух приносит пустой горшочек, потому что Иа-Иа отказывается от подарка, получает платёж, равный нулю. Хотя если бы принял пустой горшочек, то получил бы платёж, равный пяти. Это означает, что Иа-Иа ведёт себя неоптимально, тем не менее это по-прежнему равновесие Нэша, потому что эту неоптимальность снова никто эксплуатировать не может: ни одному из игроков не выгодно отклониться, изменить свою стратегию при фиксированных стратегиях другого, и тем самым он не может увеличить свой платёж. Итак, это свойство этого профиля тоже не очень хорошее: с одной стороны, это равновесие Нэша, но, с другой стороны, на одной из подыгр игрок играет неоптимально. А вот профиль, в котором Винни-Пух ест мёд, а Иа-Иа принимает подарок в любом случае, так вот, вот в этом случае этот профиль обладает замечательным свойством, что на каждой подыгре каждый из игроков играет оптимально при фиксированных стратегиях другого. Ни Винни-Пух не может отклониться в той игре, в которой ему принадлежит ход, — это же равновесие Нэша — ни ослик Иа-Иа ни на одной из подыгр не может отказаться от принятия подарка, и в этом случае увеличить свою полезность. На каждой подыгре каждый игрок играет оптимально при фиксированной стратегии всех остальных. Решение, найденное с помощью алгоритма обратной индукции, как раз всегда будет удовлетворять этому свойству — свойству оптимальности поведения игроков при фиксированных стратегиях всех остальных на каждой подыгре. Такие профили называются равновесиями Нэша, совершенными на подыграх. Формальное определение звучит так: профиль стратегий называется равновесием Нэша, совершенным на подыграх, или аббревиатура SPNE (от Subgame Perfect Nash Equilibrium), если ограничение этого профиля на любую из подыгр является равновесием Нэша. То есть если мы ограничим стратегии игроков на какую-то из подыгр этой игры, то этот профиль снова должен являться равновесием Нэша. Итак, равновесие Нэша, совершенное на подыграх, — это усиление равновесия Нэша, это дополнительное условие, которое мы накладываем на равновесие Нэша. Мы хотим не просто оптимальности поведения игрока во всей игре при фиксированных стратегиях всех остальных, а мы хотим оптимальности поведения каждого игрока на каждой подыгре при фиксированной стратегии всех остальных. Эта концепция решения игр специфична для игр в развёрнутой форме. Мы не могли изучать эту концепцию в играх в нормальной форме: там нет никаких подыгр как таковых. Тем не менее вот эта дополнительная структура, которая появляется в играх в развёрнутой форме, вот это вот дерево и подыгры, которые являются… которые порождаются этим деревом, они позволяют рафинировать равновесие Нэша, то есть из всех равновесий Нэша находить такие, которые обладают лишними хорошими свойствами. И вот равновесие, совершенное на подыграх, это как раз способ рафинирования равновесий Нэша, то есть способ выбрать из всех равновесий Нэша некоторые, которые ещё более хорошие, обладают дополнительными хорошими свойствами.