[МУЗЫКА] Здравствуйте, меня зовут Владимир Подольский, и на этой неделе мы с вами обсудим понятие вероятности. И начнем мы с того, что обсудим, что же такое вероятность. Итак, что же происходит, когда мы подбрасываем монетку? И на самом деле теоретически мы можем все просчитать и узнать, как именно она упадет. Но на практике это очень сложно. Малейшие изменения силы, приложенной к монетке, изменяют результат. И мы также должны учитывать многие факторы — движение воздуха, довольно много, что нужно учесть. То есть теоретически мы что-то можем посчитать, но на практике это нереально. И в таких ситуациях мы можем говорить, что на самом деле у нас есть некий процесс и у него могут быть разные исходы. И некоторые исходы происходят с той или иной вероятностью, то есть каждый исход в той или иной степени вероятен. И это хорошая модель, удобная в тех случаях, когда мы не можем просчитать все полностью до конца. Но не всегда все так просто. И например, в современных физических моделях положение электрона в пространстве считается принципиально случайным. То есть не то что мы не можем найти это положение, потому что это трудно и требует больших усилий, а это в принципе невозможно. То есть электрон находится принципиально в случайном неизвестном положении. Вероятность случается повсюду в Computer Science и Data Science. Например, это важнейший элемент в моделях, описывающих разные процессы и явления. Также это важный инструмент построения алгоритмов. И также это важный метод анализа, в том числе в ситуациях, когда изначально никакой случайности нет, тем не менее мы можем добавить случайность, и это может помочь нам в анализе. Давайте разберем эти пункты подробнее. Итак, вероятность как часть модели. Например, вероятностная выборка в задачах машинного обучения. У нас есть какая-то задача, у нас есть модель, и мы получаем обучающую выборку. И бывает трудно описать, и обычно так бывает, что трудно описать, откуда берется эта обучающая выборка. Например, мы в качестве выборки получаем фотографии, и мы, например, знаем, что мы получаем фотографии, а не рисунки, например. Но как это описать формально, как устроена эта выборка и какие там еще есть ограничения, это так просто не опишешь. И стандартный подход в такой ситуации — это считать следующее. Мы считаем, что выборка у нас выбирается случайно по некоторому неизвестному нам вероятностному распределению. То есь некое распределение, из которого берется наша выборка, но распределение нам неизвестно. Оно какое-то сложное, непонятное, мы не знаем, как оно устроено. Дальше. Но при использовании модели модель будет получать на вход некие случайные объекты, которые выбираются по тому же самому распределению. Оно, опять же, неизвестно, но важно, что оно абсолютно то же самое. То есть обучающая выборка и реальные входы, на которых будут использоваться модели, берутся из одной и той же выборки. Распределение неизвестно, но важно, что оно одинаково. И это позволяет нам анализировать качество модели, делать какие-то выводы о том, как хорошо она будет работать. Дальше, вероятность как алгоритмический метод. Здесь можно, например, говорить о случайных блужданиях. У нас есть некий объект, который передвигается где-то — может быть, на плоскости, может быть, где-то еще, и при этом на каждом шаге его передвижение случайно. Он выбирает одну из нескольких возможностей и передвигается в соответствии с этой возможностью. Случайные блуждания моделируют многие естественные процессы, с другой стороны, они позволяют генерировать интересные распределения на объектах. И наконец, они позволяют эффективно анализировать свойства объектов, эффективнее, чем если бы мы там точно все посчитали. Мы можем запустить случайное блуждание и сделать какой-то подсчет более приблизительным, но, с другой стороны, гораздо более эффективным. И вероятность как метод анализа. Например, в математике вероятностный метод позволяет доказывать существование некоторых объектов, которые по-другому мы доказывать не умеем, но при этом объекты не предъявляются явно. Как это устроено? Нам нужен объект с определенными свойствами? И что мы можем сделать? Мы можем попробовать взять случайный объект. То есть мы просто берем случайный объект из какого-то множества объектов. И дальше мы доказываем, что он удовлетворяет нужным нам свойствам с некоторой ненулевой вероятностью. И если нам это удается, то отсюда следует, что объект существует. В некотором множестве объектов случайный объект годится с некоторой положительной вероятностью. Значит, там есть хотя бы один объект, который подходит. При этом видно, что мы не говорим, какой именно. Мы просто доказали, что он там есть, но неизвестно какой. [МУЗЫКА]