好 接下来我们来看一个例子 我们台湾很有名一个天团 叫5566 5566号称有百万粉丝 假设每个粉丝各自独立 你今天会不会买CD 跟我会不会买CD是 我会不会买 跟你是没有关系的 但是我们假定 他们每个人买CD的概率都是0.2 只要天团发CD的话 发行了CD 每一个歌迷 都会有0.2的概率去买这个CD 但是 歌迷彼此之间会不会买 他们是independent 假设今天天团出了一张精选集 请问 天团今天卖这个 CD的数量 会超过 200800张的概率是多少 来看看 现在有1,000,000个歌迷 每一个会买CD的概率是0.2 所以 买CD的个数是什么 这是象一个 Binomial 的 distribution 有1,000,000个歌迷 每一个歌迷会买唱片的概率是0.2 就好象 每一个歌迷会买唱片是一个实验 有多少歌迷 有1,000,000个歌迷 每次试验成功就代表他决定会去买这个唱片 可以看成是个 Binomial n=1000000 p=0.2 我们知道 这个 BIN 它的积分就是 BIN(1000000,0.2) 所以它 >200800 的概率 这种问题也在问 太简单 了吧 就是把这 PMF 从 200801 一直加到 它等于 1000000 的概率 它的PMF长得象这个样子 把它从 200801 一直加到 1000000 好 老师 答案已经写出来了 问题是 数字等于多少 老师要你算到小数第二位 要算出来 老师 算就算 有什么了不起 我就这样算第一项 第一项是什么 就是这个 x=200801 的时候 算它的 PMF 值 算 x=200801 的时候 要代到这个 代到这个 1000000 取 x 就是要算 1000000 取200801 1000000 取 200801 就是 1000000 的阶乘 除以 ( 200801 阶乘 * 799199 阶乘) 这个等于多少 这怎么算 1000000!等于多少 天文数字呀 1*2*3*...... 一直乘到 1000000 天文数字啊 200801 的阶乘也是天文数字 799199 的阶乘也是天文数字 所以 给你这个例子 就发现 你就算知道一个 random variable 的 distribution 如果这个数字是一个非常非常大的数字 这个概率 distribution 你也算不出来 就象这个例子 你知道是 Binomial 可是 光是这个 1000000 取 200801 你就算不出来 你还怎么去算后面这个概率 根本算不出来 怎么办 老师刚才有讲过 好多个东西的和 可以用中央极限定理来算 那我们已经知道 我们已经知道什么 BIN(n,p) 可以写成 n 个 I.I.D.的和 n 个 I.I.D.的 Bernoulli 的和 这是 Binomial 1000000 Binomial 1000000 是否可以写成是1000000 个 I.I.D. 的和 每一个都是 Bernoulli(0.2) 因为这边是 Bin(n,p) p=0.2 所以可以写成是 1000000 个 Bernoulli(0.2) 的和 1000000 个够不够多 1000000 已经很多了 1000000 个I.I.D. 加在一起 出来是什么 是个 Gaussian 中央极限定理告诉我们 这个很接近 Gaussian 但是你要知道 这个 Gaussian 它的另一个期望值是多少 我们知道 µX1是 0.2 每一个 Xi都是 Bernoulli(0.2) 那你就看X1就好了 X1 Bernoulli(0.2) 它的 µX1 是 0.2 它的Variance 是 0.16 所以 当 1000000 个加在一起的话 它的新的 Gaussian 新的常态分布的mean 是什么 就是 n 倍的 µX1 Variance 就是 n 倍的 (σX1)^2 所以我们知道 它的 µX 就是 n倍 1000000 就是你的 n n 倍的 µX1 然后 Variance 就是 1000000 倍的 (σX)^2 你去算一算就会发现 µX 等于 1000000*0.2 就是200000 (σX)^2=1000000*0.16 σX 就是开根号 就等于400 所以我们发现 X的概率分布会很接近 µ=200000 σ=400 这样的常态分布 当你知道 X 是Gaussian 了之后 是常态分布之后 这个 X>200800 可不可以算 当然可以算 我们知道 如果 X 是Gaussian 的话 我们之前有学过 任何一个 Gaussian 它减掉自己的 µ 除以自己的 σx 这东西是什么 它是不是很接近 Gaussian(0,1) 这个Standard Normal 所以 你还记得 我们之前说 一个 Gaussian 的 Random Variable 如果大于某个东西的概率 那么两边 这个 x 跟 200800 两个 同时减掉 µX 你这边减掉 200000 我这边也减掉 200000 两边同时减 这个不等号还是成立 你同时除以你的σX 我也同时除以你的σx 这个概率还是维持不变 但是 我这边的 x 这样整形过后 这个 x 减掉 µ 再除以 σx 这个东西是一个 Gaussian(0,1) 的 Random Variable 所以我只要算一个 Standard Normal 会 会 >(200800-20000)/400 那是什么 就是算出这个 Standard Normal>2 的概率 >2 的概率 就是Q(2) 去算一下 就是 0.023 是 0.023 就算出这个概率了 如果 X 是离散的变数 我们还可以算得更精确 这是 De Moivre-Laplace Formula 就是说 如果要算 X 落在 K1 到 K2 之间的概率的话 最好加一个修正项 不要直接算 K1 到 K2 你算 K1-0.5 到 K2+0.5 之间的概率 什么意思 老师画图给你看 假设你今天的X 是一个discrete的 这个随机变数 看它的PMF 你想要算它落在 K1 到 K2 之间的概率 你想要算 pX(k1) 加上 pX(k1+1) 一直加到... 加上pX(k2) 这是我们要算的这个概率 假设这个 X 本身是好几个 我们这是讨论中央极限定理 它就应该是 很多个I.I.D.的和 它的行为有些像 Gaussian 有点像这个蓝色的Gaussian 老师问你一个问题 你要算的是这个概率 你这边要算的是 x 落在k1跟k2之间的概率 那就是等于这个概率 这个概率是不是可以把它写成 是不是可以写成 1*pX(k1)+1*pX(k1+1)...... 加上... 也就是上面每一个数字 每一个 PMF 值都 乘上一个 1 这个和是不变的 还是等于 x 落在 k1 跟 K2 之间的概率 但是这个代表什么意思 这个相当于 现在红色框出来的面积 1*pX(k1)是什么 这个高度就是 pX(k1) 乘上 1 就是乘上宽度为 1 的这个红色长条 这个大小 就等于这个长条的面积 所以 每一个 PMF 都乘上 1 就是这个长条的这个面积 所以 如果乘上 1 你会发现 其实你要算落在 k1 跟 k2 之间的概率 其实就在算 这些长条围起来的这个面积 好 但是 如果今天要 Gaussian 来approximate 你用这个蓝色的 Gaussian 曲线来 approximate它 如果你今天算的概率 是属于这个颜色 从这个地方 从 k1 一直积到 k2 就只算这里面这个面积的话 看看红色的地方有没有缺 有缺 缺的是什么 缺的是这块绿色的 从 (k1-0.5) 到k1 从 k2 到 (k2+0.5) 这一块 这一个点是 (k2+0.5) 这个点是什么 是 (k1-0.5) 所以 其实你如果是从 k1 用 Gaussian 那个分布 从 k1 积到 k2 的话 其实还会缺这两个半块 你会缺这个 从 (k1-0.5) 到 k1 还有从 k2 到 (k2+0.5) 这是为什么 干脆直接 一开始算的时候 Gaussian 就是直接从这个地方 直接算它落在 (k1-0.5) 到 (k2+0.5) 之间的概率 这就是我们为什么要加减 0.5 就是要这个两边这两个半小块 直接这样算的话会更准 不要算从 k1 到 k2 是算从 (k1-0.5) 到 (k2+0.5) 这之间的面积会更接近 原来那些红色的长条围出来的面积 好 让我们来看这个例子 假设有一个女孩子叫萱萱 她是5566的忠实粉丝 她帮她的好朋友们 去收集天团出的唱片 自告奋勇去帮她的好朋友去买CD 她为了帮她的好朋友去买 她去了20家店去买这个CD 每家店限购她买一张 每家店要么就是买得到 要么就是买不到 缺货的概率是 0.5 也就是买到的概率是0.5 请问 萱萱去20家 能够买到7张的概率是多少 先问你一个问题 她去20家 能够买到多少张 这是个随机变数嘛 这个随机变数 X 的概率分布是什么 去20家 每一家都可能有 可能没有 有的概率是0.5 所以它是什么 它是一个 Binomial(20, p) 所以它的 n 就是20 p 就是0.5 那今天要算的是什么 你要算她买到7张的概率 就是算 X=7的概率 X=7 的概率 代入Binomial 这个 20 还蛮小的 所以可以 代入 Binomial 的 PMF 去算 真的可以算 算出来的概率是什么 是0.0739 好 我们知道 Binomial(20) 其实可以看成 20个 I.I.D.的 Bernoulli 的和 那我们是不是可以用 Gaussian 的 approximation 来算算看有多准 所以 可以表示成 用中央极限定理来算的话 可以表示成 20个 Bernoulli(0.5) 这种 I.I.D. 的和 所以它是 20个 Bernoulli(0.5) Bernoulli 如果是 0.5 的话 Xi 是 0.5 它的 µ 会是0.5 它的 Variance 会是0.25 这东西有了以后 我们就可以去算 如果是20个这样的 I.I.D.加起来的话 那应该相当于是一个 Normal 一个常态分布 它的mean 就是20 倍的 µX1 还有20倍的 Variance 就是 Gaussian 这个mean 等于 10 Variance 等于5 好 这个 mean 等于 10 Variance等于5 这样的 Gaussian 如果你是算它等于 7 的概率是多少 我们算X=7的概率 就是 就是它落在 7 跟 7 之间 刚才讲这个X 是 Discrete 所以我们可以用 更准确的 不要算 7 跟 7 之间嘛 你用 (7-0.5) 就是 6.5 跟(7+0.5)就是 7.5 你不要呆呆地就算7跟7之间 连续的落在7跟7之间的概率是零啊 所有一定要有个面积 是什么 两边 一个加 0.5 一个减0.5 就是算落在 6.5 跟 7.5 之间的概率 这样去算 代入那个 Φ 算出来是 是0.0732 0.0732 跟 0.0739 准不准? 好准啊 所以 中央极限定理好不好用 好用 特别是算 Binomial Pascal Erlang 这些本身就等于好几个 其它 Random Variable 的 I.I.D.的和的 Distribution 用中央极限定理非常好用 OK 这就给你看一个例子 如果是离散的 用中央极限定理可以算得更准 要记得 两边一个要减 0.5 一个要加 0.5 我们来回顾一个这一周的课程 这一周一开始 我们是在介绍 两个随机变数加在一起的话 这个新的随机变数的概率分布是什么 特别是 如果两个随机变数如果是独立的话 我们发现 新的PMF 就会等于是原来两个 PMF的褶积 如果是PDF 的话也是一样 变成它们两个的褶积 褶积就很难算 老师就教你们 MGF MGF 就是一种转换 直接做褶积很难算 但是如果先把它变成 MGF 在S的世界里面 两个相乘以后 再做逆转换回来的话 褶积有时候就不用自己真的算了 会比较好算 这就是为什么要学MGF 学完 MGF 之后 我们就可以开始来算多个随机变数的和了 我们今天探讨了两个 一个是固定个数 就象寿司 100个寿司 固定100个寿司 100个饭量的和 100个SI的和 我们也学到 如果个数本身也是乱的 是有一个 Random Variable N 来控制的话 那整个 X1加到Xn 的和 我们可以用 N的MGF 跟 Xi的MGF 来表示 这个我们刚才也学过 最后 我们学到什么 概率最重要的一个定理 就是中央极限定理 万佛朝宗 很多 Random Variable I.I.D.的 这个 Random Variable 很多个 加在一起 它的行为 就非常像 Gaussian 实际上也不要很多 我们看到很多的例子 可能只要四个 五个 甚至六个 加在一起 它就已经非常像 Gaussian 了 这个时候有什么好处 可以帮我们算一些概率 用 Gaussian 的近似的话 算会很好算 查查表就可以算得出来 不管你说 那个很大 那个 Binomial 1000000 取 200801 光是那个阶乘就算不出来 所以这种 中央极限定理 对我们来讲是非常非常有帮助的 特别是在算一些概率的话 很多时候 如果没有办法算的 手算不出来 刚好它有那个性质是 很像是I.I.D. 好几个I.I.D.的随机变数的和的话 你就可以用中央极限定理 这个就是我们今天 最后一个礼拜的课程 好 谢谢大家