Давайте рассмотрим несколько игр, которые помогут нам глубже понять, что такое доминирующие стратегии и как с ними обращаться. Пожалуй, самой известной игрой в теории игр является «Дилемма заключенного». Эта игра была описана в 1950 году американскими математиками Дрешером и Фладом. Однако сейчас все ее знают в изложении, которое годом позже сформулировал Такер, для того чтобы рассказать эту игру на научно-популярной лекции. История такая: полиция поймала двух подозреваемых в совершении серьезного преступления — ограбления банка. Однако у полиции недостаточно улик для того, чтобы доказать ограбление. Видно, что стекло разбито, однако где деньги, которые хранились в банке, непонятно. Что делать? Полиция разводит заключенных по разным частям следственного изолятора и предлагает каждому из них пойти на сделку со следствием, а именно: выдать улики на своего напарника в обмен на сокращение собственного срока пребывания в тюрьме. При этом, естественно, полиция запрещает обмен информацией между заключенными. И мы увидим, что с помощью этого ей удается добиться. Значит, у каждого из двух игроков, а именно заключенные в нашей игре являются игроками, есть на допросе две стратегии: это либо промолчать, либо пойти на сделку со следствием и сдать своего напарника, выдать на него улики, тем самым надеясь уменьшить свой собственный срок. Как устроены платежи игроков в этой игре? Если оба игрока будут молчать, и не будут выдавать улики друг на друга, то тогда полиция отправит каждого из них в тюрьму всего лишь на 1 год: за мелкое хулиганство, за разбитое окно в банке. Если один из заключенных выдаст второго, а второй промолчит, то тогда вся тяжесть совершения данного преступления ляжет на того игрока, на того подозреваемого, который промолчал. На него улики выданы, соответственно, он сядет в тюрьму за ограбление банка на 10 лет, а вот второй заключенный, на которого и так не выданы улики, еще и получит возможность уменьшить свой срок. Его бы посадили за мелкое хулиганство на 1 год, но поскольку он пошел на сделку со следствием, то будем считать, что полиция его прощает и отпускает домой. В этом случае его платеж будет равен нулю. И, наконец, если оба заключенных пойдут на сделку со следствием, то тогда улики у полиции будут на каждого из них, каждый из них будет обвинен в ограблении банка. И это светило бы им наказанием в размере 10 лет заключения в тюрьме. Однако вспоминаем, что каждый из них пошел на сделку со следствием. Значит, полиция тоже выполняет условия этого контракта, уменьшает каждому из них срок, и каждый отправляется в тюрьму на 5 лет. Матрица этой игры представлена на ваших экранах. Игра два на два. Давайте попытаемся эту игру проанализировать. Мы научились решать игры с помощью равновесия в строго доминирующих стратегиях. Есть ли в этой игре доминирующие стратегии у кого-либо из игроков? Давайте представим, как рассуждает первый заключенный. Он думает: «Так, какую стратегию мне выбрать? Если мой напарник будет молчать, а я тоже буду молчать, то я получу платеж равный минус 1, отправлюсь в тюрьму на 1 год. А если предам его, то получу платеж равный нулю, выйду на свободу. Мне лучше его предавать». Если я подозреваю, если первый заключенный подозревает, что напарник его предаст, то тогда в случае, если первый заключенный будет молчать, то он отправится в тюрьму на 10 лет. А если предаст, то тогда на 5 лет. Значит, наилучший ответ в ответ на стратегию «Предать» — снова стратегия «Предать». Таким образом, у первого заключенного есть строго доминирующая стратегия — «Предать». То же самое, естественно, можно сказать и про второго заключенного. Они у нас симметричные. Значит, у второго заключенного тоже есть доминирующая стратегия. И она — предавать первого. Таким образом, по определению профиль (Предать, Предать) является равновесием в строго доминирующих стратегиях. В силу замечания, которое мы с вами высказали раньше, этот же профиль будет и равновесием в слабо доминирующих стратегиях. Сейчас сделаем небольшое отвлечение от равновесия в строго доминирующих стратегиях. Дадим еще одно определение, чтобы получше понять свойства профилей стратегий в «Дилемме заключенного». Мы будем говорить, что профиль стратегий s Парето-доминирует профиль стратегий sʼ, если платежи, которые получают игроки в профиле s не меньше платежей, которые получают игроки в профиле sʼ. И, по крайней мере, для одного игрока платеж, который он получает в профиле s, больше платежа, который он получает в профиле sʼ. Мы будем говорить, что профиль стратегий s* называется Парето-оптимальным, если не существует никакого другого профиля стратегий sʼ, который бы доминировал, Парето-доминировал, профиль стратегий s*. Давайте снова посмотрим на «Дилемму заключенного». Какие из профилей являются Парето-оптимальными? Профиль (Предать, Предать), который, как мы знаем, является равновесием в строго доминирующих стратегиях. Является ли он Парето-оптимальным? Ответ — нет, потому что существует профиль (Молчать, Молчать), в котором оба игрока получают платеж, больший, чем в профиле (Предать, Предать). Значит, профиль (Молчать, Молчать) Парето-доминирует профиль (Предать, Предать) и, соответственно, равновесие в строго доминирующих стратегиях не является Парето-оптимальным. Это немножечко странно, казалось бы, потому что мы считали, что каждый игрок использует свою оптимальную стратегию, которая является наилучшим ответом игрока в ответ на любую из стратегий других игроков. В данном случае на любую из стратегий второго игрока. Второй игрок действует точно так же. Играет стратегию, которая является наилучшим ответом на любую из стратегий первого игрока. Однако, тем не менее, платежи, которые они получают в результате этого, оказываются меньше платежей, которые бы они получали, если бы договорились и молчали, в то время как полиция предложила бы им пойти на сделку со следствием. То есть профиль (Молчать, Молчать) является Парето-оптимальным. Почему? Потому что ни один из трех других профилей не Парето-доминирует профиль (Молчать, Молчать). Профиль (Молчать, Предать) является Парето-оптимальным, потому что второй игрок никогда не может получить платеж, больший нуля. И это означает, что невозможно увеличить платеж первого игрока, не уменьшив платеж, который получает второй игрок. Профиль (Предать, Молчать) тоже является Парето-оптимальным. Получается совершенно фантастическая история. В игре есть равновесие (Предать, Предать), однако Парето-оптимальными являются все профили, кроме равновесия. В этом и есть некоторое нехорошее свойство равновесия. На самом деле, с точки зрения общественного благосостояния, равновесие ничего не означает. Те платежи, которые могут получать игроки в этом равновесии, могут быть меньше, чем платежи, которые бы они могли получить в каких-то других профилях.