[ЗВУК] [ЗВУК]
[ЗВУК] Добрый день.
Сегодня мы начинаем курс анализа данных,
и первый модуль у нас будет посвящен основам теории вероятности.
И сегодня мы поговорим про самые основные и базовые определения теории вероятности,
которые понадобятся нам в дальнейшем в рамках всего курса.
Ну, и первое понятие — это случайный эксперимент.
Случайный эксперимент — это, на самом деле, любой эксперимент,
результат которого мы не можем предсказать заранее.
Ну, и самым простым и популярным примером случайного эксперимента является
подбрасывание обычного игрального кубика.
Следующее понятие — это элементарный исход.
Элементарный исход — это любой возможный исход некоторого случайного эксперимента.
В случае с игральным кубиком элементарным исходом является выпадение какой-то грани.
И пространство элементарных исходов — это
множество всех возможных элементарных исходов,
которое мы можем получить в результате того или иного случайного эксперимента.
Ну, и в случае с игральным кубиком пространство элементарных исходов у нас
состоит из шести элементов, то есть из шести возможных граней кубика.
Следующее понятие — это случайное событие.
Случайное событие представляет собой некоторое подмножество пространства
элементарных исходов.
Ну, например, в результате подбрасывания игрального кубика нас интересует
случайное событие — выпадение четного количества очков.
Данному случайному событию соответствуют три грани — 2,
4 и 6 — и, соответственно, множество элементарных исходов для данного
случайного события состоит из трех элементов.
Следует помнить, что случайному событию может соответствовать как пустое множество
элементарных исходов, так и случайное событие может совпадать со всем
пространством элементарных исходов.
Следующее понятие — это случайная величина,
и с этим понятием мы будем очень много сталкиваться в дальнейшем.
Что представляет собой случайная величина?
По сути своей случайная величина просто ставит в соответствие любому элементу
из пространства элементарных исходов некоторое число.
Ну, например,
в случае с игральным кубиком все выглядит достаточно очевидно: выпадению
какой-то грани мы ставим в соответствие количество очков на выпавшей грани.
Но что, если бы наш кубик имел несколько другой вид, допустим,
его грани не были бы пронумерованы, а имели бы просто разные цвета?
В таком случае нам пришлось бы задать случайную величину самостоятельно.
Ну, например, выпадение зеленой грани — это четыре очка,
выпадение синей грани — это два очка и так далее.
Вот именно этот переход из пространства элементарных исходов в некоторое числовое
пространство и называется случайной величиной.
И переходим к основному и самому важному понятию в теории вероятности —
это понятию вероятности.
Допустим, у нас есть некоторый случайный эксперимент, и мы знаем,
что ему соответствует пространство элементарных исходов объема m,
и у нас есть некоторое случайное событие A,
и мы знаем, что ему соответствует множество элементарных исходов объема k.
Так вот отношение объемов этих множеств,
то есть отношение k к m и является вероятностью события A.
Ну, например (вернемся к нашему игральному кубику), мы знаем,
что ему соответствует пространство элементарных исходов объема 6, и,
допустим, нам интересует случайное событие — выпадение четного количества очков.
Как мы уже говорили ранее,
данному случайному событию соответствует три элементарных исхода,
и мы можем сказать, что вероятность выпадения четного количества очков
при подбрасывании игрального кубика равна трем шестым, или одной второй.
Что делать, если на практике мы работаем с некоторой выборкой реализации случайной
величины, и мы не можем толком описать ни пространство элементарных исходов,
ни, тем более, множество элементарных исходов,
которое соответствует интересующему нас случайному событию?
И в данном случае мы переходим к такому понятию, как статистическая вероятность.
Но перед тем, как рассмотреть понятие статистической вероятности,
давайте обратимся к еще более простому примеру,
чем подбрасывание игрального кубика, — к подбрасыванию монетки.
Случайный эксперимент «подбрасывание монетки» имеет два возможных
элементарных исхода — это выпадение орла и выпадение решки.
Ну, и очевидно, что вероятность каждого из элементарных исходов в данном
случае равна одной второй.
Но не всем это было очевидно, и в XVIII веке естествоиспытатель Бюффон произвел
4040 подбрасываний монетки и пытался оценить вероятность выпадения орла.
Как мы видим, результат у меня получился достаточно близкий к одной второй,
но Карл Пирсон не остановился на этом и произвел 24000 подбрасываний
специально изготовленной идеально сбалансированной монеты и также пытался
оценить вероятность выпадения орла.
Как мы видим, у него результат получился точнее, и здесь,
в принципе, мы можем перейти к понятию статистической вероятности.
Что это такое?
Допустим, у нас есть некоторый эксперимент,
и нас интересует в результате этого эксперимента некоторое
случайное событие A, которое может либо произойти, либо не произойти.
У нас есть некоторая выборка реализации этого случайного эксперимента (допустим,
это выборка объема n), и мы знаем, что интересующее нас событие
A произошло в некотором количестве проведенных случайных экспериментов.
Допустим, обозначим количество таких экспериментов за nA.
Так вот, частота выпадения интересующего нас события, то есть отношения nA к n,
и называется статистической вероятностью.
Ну, и как мы видели на примерах с монеткой, чем больше мы делаем случайных
экспериментов, то есть чем больше наша выборка,
тем точнее статистическая вероятность будет оценивать некоторую истинную,
неизвестную нам вероятность события A.
Ну, и на этом все с основными понятиями теории вероятности,
и в следующий раз мы поговорим про свойства вероятности.