Об этом курсе
Недавно просмотрено: 10,534

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 4-6 hours/week...

Английский

Субтитры: Английский

Приобретаемые навыки

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 17 часа на выполнение

Предполагаемая нагрузка: 4-6 hours/week...

Английский

Субтитры: Английский

Программа курса: что вы изучите

Неделя
1
4 минуты на завершение

Welcome to the Course!

1 видео ((всего 4 мин.))
1 видео
Неделя
2
6 ч. на завершение

On-policy Prediction with Approximation

12 видео ((всего 61 мин.)), 2 тестов
12 видео
The Value Error Objective4мин
Introducing Gradient Descent7мин
Gradient Monte for Policy Evaluation5мин
State Aggregation with Monte Carlo7мин
Semi-Gradient TD for Policy Evaluation3мин
Comparing TD and Monte Carlo with State Aggregation4мин
The Linear TD Update3мин
The True Objective for TD5мин
Week 1 Summary4мин
1 практического упражнения
On-policy Prediction with Approximation30мин
Неделя
3
5 ч. на завершение

Constructing Features for Prediction

10 видео ((всего 43 мин.)), 2 тестов
10 видео
Using Tile Coding in TD4мин
What is a Neural Network?3мин
Non-linear Approximation with Neural Networks4мин
Deep Neural Networks3мин
Gradient Descent for Training Neural Networks8мин
Optimization Strategies for NNs4мин
Week 2 Review2мин
1 практического упражнения
Constructing Features for Prediction28мин
Неделя
4
5 ч. на завершение

Control with Approximation

6 видео ((всего 28 мин.)), 1 материал для самостоятельного изучения, 2 тестов
6 видео
Exploration under Function Approximation3мин
Average Reward: A New Way of Formulating Control Problems10мин
Week 3 Review2мин
1 материала для самостоятельного изучения
Weekly Reading40мин
1 практического упражнения
Practice Quiz

Преподаватели

Avatar

Martha White

Assistant Professor
Computing Science
Avatar

Adam White

Assistant Professor
Computing Science

О Альбертский университет

UAlberta is considered among the world’s leading public research- and teaching-intensive universities. As one of Canada’s top universities, we’re known for excellence across the humanities, sciences, creative arts, business, engineering and health sciences....

О Alberta Machine Intelligence Institute

The Alberta Machine Intelligence Institute (Amii) is home to some of the world’s top talent in machine intelligence. We’re an Alberta-based research institute that pushes the bounds of academic knowledge and guides business understanding of artificial intelligence and machine learning....

Специализация Обучения с подкреплением: общие сведения

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Обучения с подкреплением

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.