Всем привет! Меня зовут Данил Лесоводский, я руковожу проектами по машинному обучению. В качестве примеров таких проектов я могу привести проект по предсказанию исходов судебных дел, проект по созданию чат-ботов, определение эмоций по фотографиям, или предсказание брака на производстве. В прошлом блоке вы познакомились с объектом управления. В этом блоке мы поговорим о процессе управления проектом по машинному обучению. Я выделяю следующие фазы проекта по машинному обучению. Номер один — Proof of Concept. На этой стадии важно проверить возможность реализации алгоритма для достижения заданной точности. Minimum Viable Product — минимальный жизнеспособный продукт. На этой фазе важно проверить ценность продукта с вашими клиентами. И третья фаза — фаза продуктизации. На этой фазе вам нужно создать ценность, и начать монетизировать ваш продукт. Поговорим подробнее про каждую из этих фаз. Proof of Concept. Как я сказал, на этой фазе вам нужно понять, реализуема ли вообще задумка, это feasibility study. Я выделяю восемь главных задач на этой стадии. Первая. Вам нужно определить решаемую проблему. Поговорите с вашим бизнес-заказчиком, поймите, что реально ему нужно; может быть, эта проблема решается каким-то более простым способом, и вам не нужно машинное обучение для достижения бизнес-цели. Если же бизнес-цель достигается только при помощи машинного обучения — я вас поздравляю, нужно двигаться дальше. Проведите интервью с экспертами: вам нужно найти людей, которые в компании уже пытаются решить данную бизнес-задачу, которые в курсе терминологии, в курсе процессов. Поговорите с ними, поймите, какие параметры влияют на предсказываемую переменную, поймите значимость этих параметров. Узнайте про источники данных, какие данные уже есть, каких нет; какая сложность связана с тем, чтоб получить эти данные, какие вам потребуются бюджеты для их сбора. Оцените количество и качество данных. Дальше вам необходимо составить перечень методов машинного обучения, который может быть применим в данном случае. Отранжируйте их по сложности и по костам. Соберите весь пайплайн с первым методом: возьмите самый простой метод, и соберите весь пайплайн от начала до конца с теми данными, которые у вас уже есть. И получите нижнюю оценку точности алгоритма. Это вам даст понимание, где вы находитесь и куда дальше возможен рост. Разберите случаи, разберитесь со случаями плохого предсказания, и обсудите эти случаи с экспертами; поймите, что привело к тем или иным ошибкам. И поговорите дальше с вашими data scientist-ами, чтобы понять перспективность каждого из способов повышения точности, и сколько это может стоить. И когда вы будете понимать оценки — по бюджету, по срокам, по ресурсам, — сравните это с тем, что вам доступно. Если у вас хватает денег, сроков и ресурсов, начинайте следующую фазу. Следующая фаза — это минимальный жизнеспособный продукт, или MVP. На данной фазе вам необходимо проверить ценность для пользователя. Что значит "проверить ценность для пользователя"? Поймите, готов ли ваш клиент платить за то, что вы придумали. Что нужно для этого? Для начала вам необходимо будет, скорее всего, повысить качество того алгоритма, который вы разработали на первой фазе, до того уровня, когда клиент сможет оценить эту вашу клевую идею. Следующим этапом оберните алгоритм в сервис, и дайте пользователям поработать с этим сервисом. Соберите обратную связь. Разработайте архитектуру решения и разработайте roadmap. Как только это будет готово, вы можете приступать к фазе продуктизации. Вам необходимо будет на этой фазе организовать постоянную среду для научной части проекта: среда для разработки и промышленная среда. Запустите постоянный процесс Product Management, и запустите итерации по развитию продукта. В остальном данная фаза мало чем отличается от разработки обычного IT-продукта. Собственно, вы запускаете итерации и начинаете монетизировать продукт. Сегодня мы посмотрели, как устроены проекты по машинному обучению. Мы рассмотрели три фазы — Proof of Concept, MVP и продуктизация. И по каждой фазе рассмотрели, из чего она состоит. В следующем блоке мы рассмотрим, какие бизнес-задачи можно решать при помощи машинного обучения, и в каком случае не стоит его использовать. Спасибо.