Об этом курсе

Недавно просмотрено: 114,818
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Прибл. 22 часа на выполнение
Английский

Приобретаемые навыки

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Прибл. 22 часа на выполнение
Английский

от партнера

Placeholder

Альбертский университет

Placeholder

Alberta Machine Intelligence Institute

Программа курса: что вы изучите

Оценка контентаThumbs Up92%(2,614 оценки)Info
Неделя
1

Неделя 1

1 ч. на завершение

Welcome to the Course!

1 ч. на завершение
2 видео ((всего 10 мин.)), 2 материалов для самостоятельного изучения
2 видео
Meet your instructors!8мин
2 материала для самостоятельного изучения
Reinforcement Learning Textbook10мин
Read Me: Pre-requisites and Learning Objectives10мин
3 ч. на завершение

Monte Carlo Methods for Prediction & Control

3 ч. на завершение
11 видео ((всего 58 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
11 видео
Using Monte Carlo for Prediction6мин
Using Monte Carlo for Action Values2мин
Using Monte Carlo methods for generalized policy iteration2мин
Solving the Blackjack Example3мин
Epsilon-soft policies5мин
Why does off-policy learning matter?4мин
Importance Sampling4мин
Off-Policy Monte Carlo Prediction5мин
Emma Brunskill: Batch Reinforcement Learning12мин
Week 1 Summary3мин
3 материала для самостоятельного изучения
Module 1 Learning Objectives10мин
Weekly Reading40мин
Chapter Summary40мин
1 практическое упражнение
Graded Quiz30мин
Неделя
2

Неделя 2

5 ч. на завершение

Temporal Difference Learning Methods for Prediction

5 ч. на завершение
6 видео ((всего 37 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
6 видео
Rich Sutton: The Importance of TD Learning6мин
The advantages of temporal difference learning5мин
Comparing TD and Monte Carlo5мин
Andy Barto and Rich Sutton: More on the History of RL12мин
Week 2 Summary2мин
2 материала для самостоятельного изучения
Module 2 Learning Objectives10мин
Weekly Reading40мин
1 практическое упражнение
Practice Quiz30мин
Неделя
3

Неделя 3

6 ч. на завершение

Temporal Difference Learning Methods for Control

6 ч. на завершение
9 видео ((всего 30 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
9 видео
Sarsa in the Windy Grid World3мин
What is Q-learning?3мин
Q-learning in the Windy Grid World3мин
How is Q-learning off-policy?4мин
Expected Sarsa3мин
Expected Sarsa in the Cliff World3мин
Generality of Expected Sarsa1мин
Week 3 Summary2мин
3 материала для самостоятельного изучения
Module 3 Learning Objectives10мин
Weekly Reading40мин
Chapter summary40мин
1 практическое упражнение
Practice Quiz30мин
Неделя
4

Неделя 4

7 ч. на завершение

Planning, Learning & Acting

7 ч. на завершение
11 видео ((всего 47 мин.)), 4 материалов для самостоятельного изучения, 2 тестов
11 видео
Comparing Sample and Distribution Models2мин
Random Tabular Q-planning3мин
The Dyna Architecture5мин
The Dyna Algorithm5мин
Dyna & Q-learning in a Simple Maze5мин
What if the model is inaccurate?3мин
In-depth with changing environments5мин
Drew Bagnell: self-driving, robotics, and Model Based RL7мин
Week 4 Summary1мин
Congratulations!2мин
4 материала для самостоятельного изучения
Module 4 Learning Objectives10мин
Weekly Reading40мин
Chapter Summary40мин
Text Book Part 1 Summary40мин
1 практическое упражнение
Practice Assessment45мин

Рецензии

Лучшие отзывы о курсе SAMPLE-BASED LEARNING METHODS

Посмотреть все отзывы

Специализация Обучения с подкреплением: общие сведения

Обучения с подкреплением

Часто задаваемые вопросы

Остались вопросы? Посетите Центр поддержки учащихся.