[БЕЗ_ЗВУКА] Привет! С вами Евгений. В этом уроке мы поговорим о том, как в теории вероятностей и математической статистике изучаются случайные события, и какие основные математические инструменты для этого используются. Большинство явлений окружающего мира слишком сложны для того, чтобы их можно было описать простыми детерминированными законами. Например, мы не можем абсолютно точно предсказывать атмосферные явления, несмотря на то, что мы очень хорошо понимаем, по каким законам живут отдельные молекулы атмосферы. Их просто слишком много, и в их взаимодействии участвуют слишком много факторов, для того чтобы мы могли построить исчерпывающую прогнозирующую модель. Намного более простой процесс — это подбрасывание кубика, но даже его результат мы никогда не можем предсказать, если, конечно, не жульничаем. Вместо того чтобы пытаться построить какую-то исчерпывающую, заведомо слишком сложную физическую модель подбрасывания, мы можем сделать шаг назад и представить, что мы имеем дело с неким черным ящиком, внутреннее устройство которого мы даже не будем пытаться определить. Этот черный ящик по каким-то своим неизвестным нам законам генерирует случайные события, соответствующие числам, выпадающим на кубике. Такие черные ящики в математике называются случайными величинами, а события, которые они генерируют, — реализациями этих случайных величин. Набор реализаций случайной величины называется выборкой из нее. Мы никогда не сможем сказать, какое событие произойдет в следующий момент наблюдения черного ящика, но если мы будем вести эти наблюдения достаточно долго, мы сможем начать замечать некоторые закономерности. Например, если мы честно подбрасываем кубик, то каждое число на нем будет выпадать примерно одинаковое количество раз. Именно такие закономерности и изучают теория вероятностей и математическая статистика. Если мы будем проводить эксперимент со случайной величиной бесконечно, то в этом бесконечном эксперименте каждому событию мы сможем поставить в соответствие его вероятность — эту долю испытаний, в которых событие произошло. Эта вероятность никогда не может быть измерена на практике, потому что в ее определении зашито, что последовательность испытаний бесконечна. Теория вероятностей изучает модели случайных величин, свойства этих моделей и то, какие выводы можно сделать о том, какие события будут нас ожидать при проведении испытаний со случайными величинами в будущем. Статистика и анализ данных действуют в обратном направлении. Мы имеем дело с конечными выборками, и по этим конечным выборкам мы пытаемся определить свойства нашего черного ящика случайной величины и понять, как эта случайная величина будет себя вести в будущих испытаниях. Совершить такой переход позволяет закон больших чисел. Крайне нестрогая его формулировка звучит следующим образом: вероятность любого события может быть приближена частотой этого события, если выборка достаточно большая. Итак, в этом видео мы поговорили о том, чем отличаются теория вероятностей и математическая статистика, как они изучают одну и ту же обобщенную модель случайности с разных сторон. Мы дали определение вероятности как частоты события на бесконечной выборке и договорились, что закон больших чисел позволяет нам оценивать эту вероятность с помощью частоты события на конечной выборке. В следующих видео мы обсудим свойства вероятностей, часто используемые распределения и процессы, которые они могут описывать, мы познакомимся с основными средствами работы со случайными величинами. И все это мы будем делать на уровне, достаточном для интуитивного понимания последующего материала. Теория вероятностей — достаточно сложная наука, но мы абсолютно не будем затрагивать ее фундаментальный контекст. К счастью, для того чтобы делать анализ данных, совершенно необязательно знать, что такое сигма-алгебра или уметь брать интеграл по мере Лебега.