[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Здравствуйте. Меня зовут Владимир Власов, я начальник центра компетенций ERP-систем Сбербанка. В нашем центре мы разрабатываем внутреннего персонального ассистента для сотрудников компании. На этой неделе мы поговорим о задаче разработки разговорного искусственного интеллекта. Интерес к разговорному AI сильно вырос за последние два года. Компания Gartner поместила эту технологию в список главных технологических трендов 2018 года. Наверняка вы уже пользовались виртуальным ассистентом в вашем смартфоне, знаете о голосовых помощниках Amazon Echo и Google Home, а также сталкивались с умным IVR в корпоративных контакт-центрах. Все это — примеры технологии машинного интеллекта. Знаменитый ученый, считающийся основателем такой области машинного обучения, как компьютерное зрение, Ян Лекун, обсуждая перспективу лаборатории Facebook AIR Research выделил пять приоритетных направлений для исследований: компьютерное зрение, диалоговые системы, виртуальные ассистенты, распознавание речи, NLU и машинный перевод. Стэнфордский профессор Крис Мэннинг, обсуждая цитату Лекуна, пошутил, что упоминание компьютерного зрения простительно — все-таки ученый посвятил проблеме 20 лет — однако все остальные задачи относятся к сфере обработки естественного языка, natural language processing или NLP. Автоматизированные системы, исполняющие команды пользователей, полученные на естественном языке, называются виртуальными персональными ассистентами. Включить музыку, узнать прогноз погоды, оформить заказ товаров в интернет-магазине, вызвать такси или отправить сообщение. Для выполнения этих действий мы все чаще пользуемся персональными ассистентами, встроенными в наши смартфоны. Банки также активно внедряют разговорные интерфейсы. Сбербанк, в частности, уделяет большое внимание AI-ассистентам. В эксплуатацию уже запущены чат-бот для контактного центра, а также бот для наших корпоративных клиентов. Большое количество запросов сотрудников к внутрикорпоративным системам, таким, как CRM или ERP, также может быть решено с помощью персональных ассистентов. Оплати счет, пришли отчет на почту, оформи командировку. Все эти действия могут быть выполнены с помощью виртуального персонального ассистента, что сэкономит для пользователя значительное время, ускорит внутренние процессы компании, а умный совет виртуального ассистента позволит не допустить излишние расходы или предотвратить мошенничество. Одним из самых распространенных способов применения персональных ассистентов является автоматизации работы службы технической поддержки. До 80% типовых обращений могут решаться персональным ассистентом без участия IT-службы. Давайте посмотрим, как все это работает в общем виде. Пользователь формулирует свое намерение или интент: «намечается командировка в Москву». Далее с помощью моделей машинного обучения, о которых пойдет речь на этой неделе, сообщение пользователя классифицируется в один из предварительно заданных классов интентов. В данном случае это класс «оформление командировки». После определения интента ассистент запрашивает недостающую в запросе информацию. Например, цель командировки и дату возвращения. Когда все параметры или сущности будущей командировки определены, ассистент вызывает соответствующий сервис на стороне основной системы. С точки зрения задач обработки естественного языка в персональном ассистенте решаются три следующих задачи: Natural Language Understanding — понимание естественного языка, которое сводится к задаче классификации текста по заранее определенным классам; Named Entity Recognition — выделение именованных сущностей из текста или более конкретно — тэггинг последовательностей. Другими словами, классификация отдельных слов в текстах по определенным классам. И Natural Language Generation — генерация ответов на естественном языке. Методы и предпосылки, принятые при решении этих задач, определяют степень интеллектуальности персонального ассистента. В самом простом случае все три задачи решаются с помощью так называемых rule-based правил, жесткой логики и регулярных выражений. Этот тип является самым простым, в нем отсутствует машинное обучение. Его основное ограничение — отсутствие вариативности. Пользователь, изменив одно слово в запросе, скорее всего, не получит ответ. Плюсом является тот факт, что такой персональный ассистент не требует наличия примеров для обучения. На среднем уровне сложности мы имеем персонального ассистента, устойчивого к изменению формы запроса, однако чувствительного к порядку слов в запросе. Такой персональный ассистент требует небольшого количества обучающих примеров, но как правило, имеет низкую точность классификации и высокие риски, что пользователь не получит результата. И самый сложный случай, при котором используются нейронные сети и векторные представления слов, позволяет персональному ассистенту быть устойчивым к сочетанию синонимов, которые раньше не встречались в выборке, или измененному порядку слов в предложении. Фокусом данной недели будут методы решения задач классификации текстов и выделения именованных сущностей. В первую очередь мы рассмотрим стандартные методы machine learning, приложения к этим задачам и затем перейдем к глубоким архитектурам и увидим, как повышаются интеллектуальные способности нашего ассистента. Далее в курсе мы обсудим архитектуру платформы для персонального ассистента, дадим краткий обзор задач обработки естественного языка, а также рассмотрим современные методы машинного обучения, которые понадобятся для решения задач обработки естественного языка. Мы предлагаем два задания по программированию: по классификации текстов и выделению сущностей в текстах. Наш курс скорее средний по уровню сложности и расчитан на тех, кто имеет представление о моделях машинного обучения и глубокого обучения, нацелен на применение данных методов в задачах NLP. Учитывая недельный формат, мы останавливаемся только на самых важных аспектах задачи без потери полноты изложения. В курсе приводится не так много математических формул, но мы подразумеваем, что вы знакомы с базовыми понятиями теории вероятностей и матстатистики. Итак, добро пожаловать на борт!