[МУЗЫКА] Давайте рассмотрим пример применения линейности матожидания в задаче о днях рождения. Пусть у нас есть 28 случайно выбранных людей. Давайте рассмотрим число пар (i, j), таких, что i-й и j-й человек имеют день рождения в один день. По сути мы хотим рассмотреть число пар людей, у которых день рождения в один день. Нужно доказать, что матожидание этой величины больше единицы. Прежде чем переходить к задаче, давайте мы поймем, что тут все-таки от нас просят посчитать. Если есть два человека с общим днем рождения, они добавят 1 к числу пар, требуемых в задаче. Если же есть три человека с общим днем рождения, они образуют три пары. Если есть люди 1, 2, и 3, то они образуют пары (1, 2), (1,3) и (2,3). И они добавят 3 к числу пар, требуемых в задаче. Хорошо. Утверждение задачи выглядит довольно удивительно. Людей довольно мало, при этом мы говорим, что весьма вероятно, что встретятся два человека с одним и тем же днем рождения. Но, тем не менее, мы докажем вот такой вот такой факт. Но прежде нам нужно формализовать задачу. Во-первых, мы предполагаем, что дни рождения распределены равномерно среди всех 365 дней в году. Мы не будем это обсуждать, на самом деле неравномерность распределения, которая в реальной жизни имеет место, она только увеличит матожидание. Поэтому это наше предположение, что дни рождения распределены равномерно, только уменьшает математическое ожидание. По факту оно окажется больше, но мы в эти детали не будем вникать. При этом мы считаем, что люди выбираются независимо, соответственно день рождения у каждого человека распределен равновероятно, независимо от остальных. Хорошо. Мы используем линейность матожидания, и что мы сделаем? Мы обозначим число пар с днем рождения в один и тот же день через f, перенумеруем людей от 1 до 28, так будет удобнее, и рассмотрим также случайные величины, такие: gij будет равно 1, если люди i и j имеют день рождения в один и тот же день, и эта величина равна 0, иначе. И давайте заметим следующее: оказывается, что f равна просто сумме gij по всем неупорядоченным парам i и j. Почему это так? Давайте посмотрим. Пускай у нас людей всего пять: вот эти люди — 1, 2, 3, 4, 5. И вот всевозможные пары. Есть пары, включающие первого человека, их таких четыре. Дальше, остаются пары, включающие второго человека, их три. потому что пара из первого и второго уже посчитана. Пара из третьего человека — их две. И пара с четвертым человеком, пока что непосчитанная, — такая только одна. Вот список всех пар. Для каждой у нас есть величина gij, и пусть у них вот такие значения. И если мы их выпишем, у нас gij в большинстве случаев равно нулю, но в двух случаях равна единице: g1,3 = 1 и g4,5 = 1. Давайте заметим вот что: чему равна случайная величина f? В терминах этой картинки случайная величина f равна количеству пар {i, j}, в которых gij = 1, то есть количество пар, у которых день рождения в один день. А сумма gij, очевидно, равна тому же самому, то есть если мы сложим все gij, то она будет равна количеству пар, где единицы. Поэтому есть такое равенство: f = сумме всех gij. Хорошо. Вернемся к доказательству. И мы знаем, что f равняется сумме gij, мы можем воспользоваться линейностью математического ожидания. И мы знаем, что матожидание f, которое можно посчитать, равняется матожиданий gij для всех пар {i, j}. Замечательно. Что нам осталось сделать? Нам нужно посчитать матожидания gij для отдельной пары. И еще нужно посчитать число пар {i, j}. Хорошо. Давайте посчитаем матожидание для каждой отдельной пары, это на самом деле не сложно. Матожидание gij — это единица, то есть там, где есть два исхода: один и ноль. Исход один происходит с вероятностью 1/365, исход ноль происходит с вероятностью 364 /365 с оставшейся вероятностью. И матожидание получается 1/365. Давайте чуть подробнее обсудим, почему там 1/365, почему вероятность того, что день рождения произошел в один день, 1/365. Если это разбирать аккуратно, то исходов у нас здесь 365 * 365, у нас два человека, и у них всевозможных дней рождения вот столько. У первого выбирается произвольный день из 365, и у второго тоже. А хороших исходов, тех, при которых случайная величина равна единице, их 365. Дни рождения должны совпасть: таких пар столько, сколько есть дней, то есть 365. Получается 365 / 365 в квадрате — это 1/365. Хорошо. И вторая наша задача — это посчитать, сколько всего есть пар i и j. У нас всего 28 людей, и нам нужно выбрать неупорядоченные пары из них. И мы знаем, что это c из 28 по 2, 28 * 27 / 2 = 378 способов выбрать неупорядоченные пары. Давайте коротко вспомним, как это происходило, как мы это доказывали. Первого человека можно выбрать 28 способами. Второго можно выбрать 27 способами. Но надо заметить, что каждую пару мы при этом посчитали два раза. Сначала первого человека как первого, и второго как второго и наоборот. Поэтому нужно еще результат поделить на два, получится ответ. Вот так мы это доказывали. Хорошо. Давайте подведем итог, что мы в итоге получили. Матожидание случайной величины f — это сумма матожиданий gij по всем парам. Каждое ожидание gij — это 1/365. И всего пар 378. Получается, что матожидание f — это 378 умножить на 1/365. И видно, что это больше единицы. Вот мы решили задачу, доказали, что матожидание превышает единицу. Итак, давайте еще обсудим, что мы доказали, чт матожидание больше единицы. И совпадение дней рождений, значит, достаточно вероятно. Но, с другой стороны, наша оценка на матожидание не отвечает на такой, пожалуй, более естественный вопрос... Вернее, естественным вопросом здесь был бы такой: какова вероятность, что найдутся такие люди, что у них совпали дни рождения? И оценка матожидания не дает ответа на такой вопрос в точности. Она дает нам интуитивное представление, что да, действительно, совпадение дней рождения вероятно. Но на вероятность оценку не дает, просто потому что совпадение сразу нескольких дней рождения дает довольно большой вклад матожидания. То есть если, скажем, вообще у всех людей дни рождения совпали, это вообще маловероятно, но тогда у нас количество пар будет очень большое, и это дает больший вклад матожидания, чем в других исходах. И поэтому так сразу оценить вероятность того, что хотя бы одно такое совпадение дня рождения произошло, из матожидания не получится. И на самом деле это требует более больших усилий. То есть вот здесь мы сделали то, что легко сделать, оценить матожидание с помощью линейности очень легко, посчитать вероятность посложнее. Но на самом деле в одном из следующих курсов специализации, в курсе вероятности, это будет посчитано. Итак, на этой неделе мы обсудили с вами начало теории вероятностей, мы обсудили дискретную модели, и мы обсудили численные меры случайных объектов, случайные величины. И мы обсудили их основной параметр — математические ожидания. Мы убедились, что этот параметр легко считать по линейности, и на самом деле для наших целей, текущих, этого достаточно. Но дальше у вас будет в специализации курс вероятностей, в котором обо всем этом будет гораздо подробнее и глубже. [МУЗЫКА]