[БЕЗ_ЗВУКА] В этом видео мы узнаем, как считать производную сложной функции. Что мы обычно представляем, когда говорим «сложная функция»? Ну, наверное, какую-то очень сложную нетривиальную зависимость. Нет, это всё неважно, сейчас мы будем говорить о других сложных функциях. Это просто термин, который используется для того, чтобы обозначить, что функция f(x) представима как функция g, взятая от значения другой функции h(x). Ну, например, логарифм (1 + x) можно представить как сложную функцию g(h(x)), где h(x) — это 1 + x, а g(h) — это логарифм h. Итак, чтобы разобраться с производной сложной функции, нам понадобится одно очень удобное понятие — дифференциал. Дифференциал вводится как линейная часть приращения функции, ну то есть фактически производная функции в точке x * Δx. И его стоит рассматривать как функцию от Δx. Но если мы формально проделаем всё то же самое для функции f(x) = x, то мы увидим, что дифференциал этой функции будет в точности равен Δx. Отсюда возникает мысль: вместо Δx в выражении для дифференциала писать сразу dx. И вот в такой форме, с выражением для дифференциала, мы обычно знакомимся и в таком виде используем. Легко заметить, что производная формально — просто частное df / dx. Таким образом, мы можем расписать производную сложной функции. Нам нужно найти dg по dx, и давайте просто умножим и поделим на dh(x). В таком случае наше выражение просто распишется на произведение двух производных: dg(h) по dh и dh(x) по dx. Вот мы и получили простое правило, которое позволяет нам считать производную сложной функции. Более того, если наша функция еще более сложная, например g(h(u(x))), это правило работает абсолютно так же. Нужно просто взять dg по dh, потом dh по du, потом du по dx и перемножить. То есть мы просто расписываем все по цепочке. Отсюда и англоязычное название Chain Rule. Подведем итог. Мы узнали, что такое дифференциал и почему производная часто записывается как df / dx. Кроме того, мы познакомились с Chain Rule, правилом взятия производной сложной функции, и это правило понадобится нам еще не раз. Ну, например, когда мы будем знакомиться с линейными классификаторами и c нейросетями.