这一节我们利用概率,来对级联过程进行一个推理。 也就是说,我们利用一些已知的信息来计算出某些事件,它发生的概率。 比如说,之前我们做的那个小球的那个试验,我们可以计算一下 这个小瓶子,它是蓝色球多的概率为多少呢? 啊,那进而来支持我们接下来要做的决策。 好,为了了解我们如何利用贝叶斯规则来进行推理,我们首先看一个简单的例子。 假如说我现在在一个城市里有两种颜色的出租车,一种 黑色,一种黄色。那么黑色占百分之八十,黄色占百份之二十。 啊,比如说发生了一起交通事故,那么肇事者逃逸了。 那么现场有一个目击者,他说他看到这个肇事车是黄色。 那他有没有可能看错了呢?如果我们说目击者的出错概率是0.1, 那么我们问一下,这个目击者他说是黄色,那么这个肇事车真的是黄色的概率有多大? 那显然在从这个实例给出的条件来说,他因该不是百分之百的,对吧? 好,我们来看一下,如何把这个已知的这些信息, 给它用我们说的概率和条件概率来描述出来。 我们假如说用b来表示黑色车这个事件,用 y来表示黄色车这个事件, 那么目击者报告是黄色,就是他声称他看到了这个逃逸车是黄色这个事件, 我们把它叫做 Report-Y, 那目击者报告是黑色,我们把它称为 Report-B。那么我们看一下, 怎么样来解决这个问题。好,接下来我们会用到贝叶斯公式。 我们之前介绍过,我们把他 列在这里面。之前在介绍贝叶斯公式的时候我们用的是 矩形图。但是在实际应用中我们通常也用这种树结构 来描述实际问题,更直观一些。那么根据我们题目已知的条件,就是B跟Y是两个事件, 在这个要门空间中,B占百分之八十,Y占百分之二十。 如果是一个黑车,那么这个目击者可能有百分之九十的概率, 啊,说他是黑车,那么也有百分之十的概率说错了,说它 是个黄色车。同样,如果是黄色车,他也有同样的出错率。 所以呢,在这里面呢,啊,B 和 Y是我们之前 的E1 和 E2。那么,声称是Y这个事件, 对应我们之前的这个F。所以, 我们就可以利用这一个贝叶斯公式来计算,所以已知B的概率 百分之八十。那么,Y的概率是0.2,那么这个 是一个已知概率,就是说如果它是黑色车,那么他这个 目击者声称是黄色的概率是0.1。 就是说他有这一个0.1 地出错率。 那么如果它是黄色车,他也声称 是黄色的概率只有0.9,并不是一个百分之百。我们现在需要计算的是 这一部分。就是说,目击者 声称是黄色,那么它真正是黄色的概率是多少呢? 利用贝叶斯公式把它带进来,有两部分,分子,分母。 那分子部分呢,实际上就是说是黄色车的概率,乘以 本身是黄色,那么他也声称是黄色的概率,实际上就是这一部分。 对吧?那么根据已知条件等于0.18, 我们可以算出来。 分母部份,由两部分组成。 那么,第一部分,就是刚才我们说的跟这个分子部分是一样的0.18。 就是说,它本身是黄色,他也 声称是黄色。那么还有一种可能就是那个车,可能是黑色, 他也把它看成黄色了。所以这一部分呢,是由它组成的。 就是,本身是一个黑色车,他有百分之十的误差率,把它看成是一个黄色车。 那么计算出来呢,这里面,我们把相应的这个概率和条件概率都列在这儿了呵。 计算出来呢,是应该是0.08。所以呢,最后我们需要 计算的这个结果,把这两部分相除,就得了 9/13。这个结论是什么呢?就是说在这种情况下,当目击者 他说他看到了一个黄色车,但实际上他只有9/13的 正确率。他有一定的概率 看错了,就是把黑车看成是黄色了。啊,通过这个例子,我们就是来 熟悉了怎样来用这个条件概率,或者是这个贝叶斯定理 来进行理性推理。好,接下来我们就回到开始我们做的小球的这个实验。 就是说猜这个小瓶子是蓝色多,还是红色多?我们可以用同样的办法 来计算一下蓝多或者红多的概率。 我们要计算什么呢?条件,就是我们的一些 信号,有可能是我们看到别人的一些决策, 也有可能是我们自己私有的一些信号,就是我们自己抓到球的信息。就是给定这个条件下, 它是蓝多的概率是多少?如果是大于0.5呢显然我们应该猜蓝多。 那么小于0.5我们就应该猜红多,对吧? 我们来看如何用概率问题来描述这个决策问题。我们用b 表示拿到一个蓝色球的事件, r 表示拿到一个红色球的事件。 那么 maj-b 表示蓝多的事件, maj-r 表示是红多的事件。那么接下来我们就有一些已知的条件。 小瓶子是蓝多或者红多的概率是一个先验概率,没有任何条件的, 都是1/2。我们说了我们是随机的, 啊,以百分之五十的概率随机拿一个瓶子,放在那儿的。如果是 蓝多,那么他拿到一个蓝球的概率是多少呢?这是一个条件概率。 显然是2/3,对吧?因为它有两个蓝球,一个红球。 这个蓝多的情况下拿到一个红球的概率呢,就应该是1/3。那么下面那个是同样的。 好,我们利用概率把这些已知的信息都 表达出来了。那么接下来我们就可以进一步地来计算, 我拿到一个蓝球或者是拿到一个红球的这个前提下,那么它是蓝多或者红多的概率,是多少呢? 我们来看,第一个学生。 假如说第一个学生,他拿到一个蓝球,我们需要计算 这个后面,是这个事件,给定的这个事件,拿到一个蓝球,用小写b来表示。 那么它是蓝多的概率是多少?利用贝叶斯公式, 我们可以得出这个结果。 那么我们就看看可不可以用已知的一些信息,来把它计算出来。 我们用这个树结构,来描述这个小球的问题。 那么E1,2 分别表示蓝多或者是红多的这两种事件。那么显然它是 各以百分之五十的概率发生。 啊,那么拿到一个蓝球分两种情况。第一种情况,就是如果他是一个蓝多的这个情况, 他有一定的概率,拿到蓝球。 第二种,就是它是红多的这个状态,他也有一定的概率,拿到蓝球。 我们来计算,那么分子部分,就是这一部分, 所以是,等于说是我们现在要计算这个 拿到一个蓝球,这个蓝多的概率是多少? 所以我们分子部分是在计算这一部分。是蓝多的概率1/2 乘以 蓝多的情况下,拿到一个蓝球的概率,1/2 乘以 2/3。 我们再来看分母部份。 分母部分是由两部分组成的。第一部分,是蓝多的情况下我拿到一个蓝球的概率。 第二部分,是红多的情况下,我拿到一个蓝球的概率。 所以是由这两部分组成的。那么,相应的这个概率我们都放在这各地方了呵。计算的这个结果, 带进去,就可以算出拿到一个蓝球,蓝多的概率应该是2/3。 它是大于1/2 的,所以这个时候你应该猜蓝多。如果拿到一个红球,可以计算出相同的结果,就应该猜红多。 好,我们来继续看第二个学生。假如说第一个人拿到了蓝球,并且也宣布了他的结果, 那么第二个人如果也是拿到了蓝球,那么我们需要计算的是 在给定 b,b这个事件的前提下, 那么蓝多的概率。同样我们用这个图来描述。 两次都拿到蓝色球,分子部分是 蓝多的概率,1/2 乘以 蓝多的情况下,那么两次都拿到蓝球的概率。 因为它两次事件是独立的,所以我们直接可以用它的这个概率相乘。 那么就等于2/9。我们再来看分母部份。 像分母部分的这个第一部分, 跟分子是一样的。那么第二部分,就是说在红多的情况下,他两次都拿到蓝色球的概率。 把这两个加起来,那么再相除,我们算出来,它是 4/5。所以这个概率是大于1/2 的。所以在这个情况下呢,我们最好应该猜蓝多。 如果第二次我拿到一个红色球, 我计算这个事件,就是说 b,r,第一次蓝色,第二次红色 的这个条件下,那么这个蓝多的概率是多少呢?利用我们这个图里 面列出来的这个概率,我们可以计算出蓝多的概率实际上是1/2。 那么这个也是符合我们之前的推理的。那就是说,各占一半,这种情况下,他猜什么都可以。 我们来看第三个学生, 他是如何进行猜测的。假如说前两个人已经公布了蓝、蓝, 我们看第三个人,假定第三个人他拿到了红色球。 所以这个给定的事件是b,b,r,那么在这条件下, 这个蓝多的概率是多少呢?所以同样我们要计算, 分子和分母部分。 那分子部分呢,实际上就是在蓝多的情况下拿到了两个蓝,一个红,实际上是 这部分。 算出来是2/27。我们再来看分母部分,分母部分由两部分 组成,一个还是它,另外一个是红多的情况下它拿到两个篮球一个红球的概率, 利用我们给出的这些概率,我们可以把它计算出来,1/9, 就是说,两个,前两个人拿到蓝色,第3个人拿到红色,这时候呢, 它算出蓝多的概率,是2/3,实际上也是大于1/2的。 那么这种情况下,虽然说它拿到的是红色,但它还是应该,理性选择的话,还是应该猜 蓝色。 当然如果它要是拿到一个蓝色,这个概率会更大,更 应该猜蓝色。对吧。这就验证了刚才我们的直观的这个推理结果, 从第3个人开始,不管他拿到什么颜色,他都会 跟从前两个人,就是忽略他自己的信息,会这样一直猜蓝色。好,我们来继续往下看, 好,通过这个列出来的这个式子,可以进一步的来说明, 就是从第3个人以后,大家都会忽略自己的信息。那么后一个人,即便是他 拿到了一个红色,他也会猜跟前面两个是一样的,所以从第3个人以后,我们这个r, 那么不管是你到了第几个, 拿到这个红色球的这个人来说,那么他看到的只有他自己和前两个人,所以呢, 对于他来说,还是蓝色的机会出现的多一些。 那么我们通过这个底下这个式子,实际上前面这些星号都是不起作用的,他都忽略了, 那所以就等同于我们这个人就是第3个人,跟我们第3个人的 计算的这个概率都是一样的,所以可以算出来他是2/3。 那他拿的一个蓝色,他的概率会更高,所以他都会猜蓝色。 这个时候就形成了级联。 那么这个概率推导的结果实际上是跟我们之前的这个直观上的这个推理 是一致的,也验证了我们之前的那种说法,就是说从第3个人开始,如果前两个一样, 它就会形成一个级联。 好,我们再利用概率来计算一下,如果前两个不一样, 比如说第1个是拿到蓝色,第2个拿到红色,那么第3个人, 我应该怎么猜呢? 假如说我第3个人拿到的是1个红色,所以我的给定事件就是,一次蓝色,两次红色, 那么用同样的方法,我们可以计算出 最终这个蓝多,我这里头用这个b来表示蓝多哈,简化一点。 这个蓝多的概率是1/3,所以这时候应该猜什么呢?应该猜 红多。那同样,如果第3个人拿到的是一个蓝色,所以 b,r,b这种情况下,我可以计算出他是2/3,所以这时候我应该猜 蓝色多。那么这个结果也验证了之前我们的推理。 就是说,如果前两个是不一样,那么第3个人他就会根据自己的信息, 对于他来说,他自己的信号会影响他要做的这个决策。 因为前面是等同的,都是50%, 那么他要把他的信号算进来,来决定他到底是猜哪一种。好利用这种概率计算 来进一步分析这个级联它产生的一个条件。第1种情况,那么利用概率计算也算出这个结果, 当前两个人都拿到蓝色的时候, 就会形成级联,所以从第3个开始,他会忽略自己的信号,一直猜蓝色,这就形成了 一个级联。那么第2种情况,我们看看会出现什么呢?第1个人拿到蓝色猜蓝色,第2个人 猜红色,第3个人刚才我们也通过这个概率计算了,第3个人他会把他自己的信号 代入来计算,那么如果他拿到的是蓝色,应该猜蓝色, 红色,应该猜红色,也一样,后面的人一直没有形成级联,是因为每个人 正好他把他自己的信号代进来以后,正好是 来决定了他要猜的这个颜色,是进行理性的这个推理,所以不会形成级联。 那我们看最后一个情况。 开始的时候,是跟第2种情况是一样的。 蓝跟红相间,所以每个人都会把他自己的信号放进来一起来计算, 蓝多的这个概率是多少来决定他将要做的选择,那么直到 从这个地方开始, 那么我们说这个人,他拿到一个红色,他计算,计算的结果 应该是蓝多和红多的概率应该是一样的,所以呢他按照他自己的 信号猜红多。那么下一个,也拿到了红色,他继续来计算, 实际上应该红色的概率应该更高一些了,所以他也猜红色。 那么我们看看这个人,他再继续来计算, 当然红色的概率还是会高,他也猜红色。 那么他以后的人,即便是拿到了蓝色,整个事件呢是相当于这个事件。 这是一个给定的事件。那么在这个给定的事件的条件下, 他来算蓝多的概率,那大家有兴趣可以自己去算一算,红多的事件会大于1/2。 这种情况下,他应该猜红多,那么事实上就形成了一个红多的级联。所以通过这几个例子,我们可以看出, 什么情况下会形成级联,当然我们从下一节我们会从严格的进行数学推导, 红色信号跟蓝色信号相差多少的时候,会形成一个相应的级联,那么相差不到这个 数字的时候,大家都会按照自己的信号来这样计算来猜测。好,我们简单来总结一下这一小结的要点。 那么这一小结呢,我们是利用了这个Bayes规则对我们之前 做的那个小球的实验进行一个理论的一个推理, 并且利用这种推理的结果验证了我们之前所作出的一些结论,就是说 在什么情况下,能形成级联。好,那么下一节呢,我们会给出一个通用的决策模型, 并且来验证当某些条件满足的时候,一定会产生级联。