好,那
在理论上呢,就是这种混合策略的赛局它有一个好处就是说
它通常只有一个均衡,唯一的均衡就是,那所以在我们这一整堂讲
的所有的实验都只有一个唯一的均衡,那所以意思是说这个理论会做出非常特定的预测
那第二个好处是说,这样子的实验,这样的赛局通常是
所谓的零和赛局或者是常和赛局,那意思是说呢就是
我多拿一块钱就是对手损失一块钱,那对手多拿一块钱就是
我会损失一块钱。那所以在这样的情境下呢,就是我们比较不会有对公平的看法或者是说对于
就是我是同情对手等等,因为呢我
我同情你,对别人仁慈就是对自己残忍
那,第三个是说呢,其实有一个很简单的一个策略,那其实就
正好会是均衡的策略,这个策略就是什么?就是你要去极大化你在最糟糕的情况下
你的报酬是多少。就是说当对手故意要来对付 你要害你的时候,你要怎么样趋吉避凶,那所以这个我通常称为是
这个避凶的策略就是等于说我认定说对手就是要害我,那
所以他会不顾他自己的
报酬不计代价然后就是要故意要整我,那当我是在这样子一个最
坏的情况下的打算来思考的时候,然后我希望可以极大化就是在最坏
的情况下我的报酬。那在这种有混合策略均衡的这个赛局里面呢
这样子的一个避凶的策略就会跟Nash均衡策略其实是一样的,就是在这个零和赛局里面
好,那所以因为这样,所以这个其实是一个很好,就是你要检验 我们理论的地方了,因为理论作为一个唯一的预测
然后而且我们没有这些就是考虑到别人的效用的这样的
社会偏好的问题,那而且呢就即使是最简单的这个避凶的策略也就会得到均衡了
好,那所以比如说这边就是一个最简单的一个混合策略
的均衡的赛局的这样一个例子,那这个就是两边两个对手他们各自
丢一个铜板看要出正面或者出反面,那这个就是我小朋友
玩的黑白猜,就是你要选择左边或是右边,对手也是选左边或是右边
那这边呢就是说,一个对手,所以第一个
就是说这边有两个对手,那所以一个叫做,好吧
第一个是所谓的就是选择第几列的这个对手,英文就是第几个row
所以英文是Rowena,那中文的话就是列子。那所以就是列子他要选择第一列
还是第二列,那第二个人是行家,所以他要选择第一行还是第二行,那
这边写的数字呢是这个第一个人就是列子的报酬,所以列子是希望说他
出正面然后要对到对手,对手出正面他也出正面 他可以拿到一分,可是如果对手要出到反面,他就输一分
那如果反过来,如果对手出的是反面的话,列子希望也要出反面然后再这样对到他
那因为这是个零和赛局,所以就是行家的报酬就是这个列子的报酬的乘上-1
好,那所以如果这个是列子的报酬,你会看到什么? 你会看到是说,我
如果选择出正面的话,那最坏的情况 是对手出的反面那我就只得到-1
这样不太好,那我如果出反面的话呢,那对手,最坏的情况是对手
会出正面,那这样也是-1这个不太好,那我还有什么策略可以尝试呢?
诶?我如果是有时候出正面有时候出反面
那这个时候你就会发现说,如果你是一半的机会出正面一半的机会出反面的话,那不管对手出- 正面还是反面
还是有什么样子的随机的策略,你都会拿到,最坏的情况就是你会拿到1/2
那所以在这样的情况下你就会发现说,所以就是在这个黑白猜这个
赛局下呢,其实我要趋吉避凶,我要避免就是在最坏的情况下
我最糟的情况是什么,那答案就是当我选择是一半一半的话
那这样子的,这样可以让 我在最坏的情况下的报酬还是达到最高的
好,那有趣的事情是说,因为这是对称的,所以行家他也会这样想,那所以
这个就是这一个赛局的混合策略均衡。就是两边都是正面反面一半一半。
那当然就是下一步就是如果真的把这一个赛局拿去 实验室里面请人来做决定,那看它是不是符合这个理论的预测
可是呢,其实这样子的赛局对理论也有一些挑战的
那第一个问题是说,你要真的,这个混合策略均衡的要求是你要真的知道
对手的策略就是一半一半,或者是什么三分之一三分之一三分之一还是什么样子的
均匀分配,那可是呢在实际在进行这样子的一个对战的时候
其实我们不见得可以观察得到,或者我们甚至不见得知道说对手的策略是什么
好,那第二个问题是说这边的话就是
上一次发生什么事情,然后你要学会改进 你的策略,那这样子的一个学习过程呢不见得会
趋近会收敛到这个混合策略均衡。那特别原因是因为
在混合策略均衡的时候呢,因为你在做混合策略,所以你选正面
你也是拿到报酬是0,选反面也是报酬是0,那所以其实你乱选其实是没有差的
那当然最后一个问题是说,我之前已经提过了,就是说即使你知道剪刀石头布下的均衡是应该是
三分之一、三分之一、三分之一,可是呢你可不可以执行正确的 执行这个三分之一、三分之一、三分之一的混合策略,这个其实是一个问题
那特别是说,如果你是玩剪刀石头布玩三把或者就是玩很多次的时候,那是不是前后
那就是你每一回都要重新的随机,可是你能不能不要
受到过去的这个结果的影响?这个其实是一个有可能是个困难
好,然后最后一件事情是这样,最后一件事情是说混合策略均衡要求其实
不见得是说一个人一定要是三分之一、三分之一、三分之一
那个混合策略均衡的重点其实是反过来的,是你要去想说
我面临的对手里面有三分之一的人可能会出剪刀
三分之一可能出石头,三分之一可能出布。那因为我不确定我会对到哪个对手,所以
跟我是面对同一个对手,可是他是三分之一、三分之一、三分之一是一样的 那这个是所谓的这个纯化的这样一个想法
那所以也有可能是说,那个混合策略均衡的结果,那它其实是在整个
社会上,有人固定出剪刀,有人固定出石头,有人固定出布。可是整体而言是很像的 好,那所以我先给各位
看一下就是整体的结果会是长什么样子,那这边的这个横轴是混合策略理论均衡的预测
然后纵轴是实际知道的结果,那所以你看到就是说那个大部分的点都是在45度线上的
也就是说其实相较我们可以看到其他的这个赛局,那混合策略均衡赛局其实理论预测 算是蛮符合的。
那所以接下来我们就来看一个又一个的结果
[无声]