Об этом курсе

Недавно просмотрено: 80,541

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Прибл. 18 часа на выполнение

Предполагаемая нагрузка: 4-6 hours/week...

Английский

Субтитры: Английский

Приобретаемые навыки

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Прибл. 18 часа на выполнение

Предполагаемая нагрузка: 4-6 hours/week...

Английский

Субтитры: Английский

от партнера

Логотип Альбертский университет

Альбертский университет

Логотип Alberta Machine Intelligence Institute

Alberta Machine Intelligence Institute

Программа курса: что вы изучите

Оценка контентаThumbs Up91%(1,060 оценки)Info
Неделя
1

Неделя 1

1 ч. на завершение

Welcome to the Course!

1 ч. на завершение
2 видео ((всего 10 мин.)), 2 материалов для самостоятельного изучения
2 видео
Meet your instructors!8мин
2 материала для самостоятельного изучения
Reinforcement Learning Textbook10мин
Read Me: Pre-requisites and Learning Objectives10мин
Неделя
2

Неделя 2

4 ч. на завершение

Monte Carlo Methods for Prediction & Control

4 ч. на завершение
11 видео ((всего 58 мин.)), 2 материалов для самостоятельного изучения, 1 тест
11 видео
Using Monte Carlo for Prediction6мин
Using Monte Carlo for Action Values2мин
Using Monte Carlo methods for generalized policy iteration2мин
Solving the Blackjack Example3мин
Epsilon-soft policies5мин
Why does off-policy learning matter?4мин
Importance Sampling4мин
Off-Policy Monte Carlo Prediction5мин
Emma Brunskill: Batch Reinforcement Learning12мин
Week 1 Summary3мин
2 материала для самостоятельного изучения
Weekly Reading40мин
Chapter Summary40мин
1 практическое упражнение
Graded Quiz30мин
Неделя
3

Неделя 3

6 ч. на завершение

Temporal Difference Learning Methods for Prediction

6 ч. на завершение
6 видео ((всего 37 мин.)), 1 материал для самостоятельного изучения, 2 тестов
6 видео
Rich Sutton: The Importance of TD Learning6мин
The advantages of temporal difference learning5мин
Comparing TD and Monte Carlo5мин
Andy Barto and Rich Sutton: More on the History of RL12мин
Week 2 Summary2мин
1 материал для самостоятельного изучения
Weekly Reading40мин
1 практическое упражнение
Practice Quiz30мин
Неделя
4

Неделя 4

8 ч. на завершение

Temporal Difference Learning Methods for Control

8 ч. на завершение
9 видео ((всего 30 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
9 видео
Sarsa in the Windy Grid World3мин
What is Q-learning?3мин
Q-learning in the Windy Grid World3мин
How is Q-learning off-policy?4мин
Expected Sarsa3мин
Expected Sarsa in the Cliff World3мин
Generality of Expected Sarsa1мин
Week 3 Summary2мин
2 материала для самостоятельного изучения
Weekly Reading40мин
Chapter summary40мин
1 практическое упражнение
Practice Quiz30мин
4.8
Рецензии: 75Chevron Right

Лучшие отзывы о курсе Sample-based Learning Methods

автор: KMJan 10th 2020

Really great resource to follow along the RL Book. IMP Suggestion: Do not skip the reading assignments, they are really helpful and following the videos and assignments becomes easy.

автор: KNOct 3rd 2019

Great course! The notebooks are a perfect level of difficulty for someone learning RL for the first time. Thanks Martha and Adam for all your work on this!! Great content!!

Специализация Обучения с подкреплением: общие сведения

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Обучения с подкреплением

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.