Об этом курсе
Недавно просмотрено: 225,744

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: 4-6 hours/week...

Английский

Субтитры: Английский

Чему вы научитесь

  • Check

    Formalize problems as Markov Decision Processes

  • Check

    Understand basic exploration methods and the exploration / exploitation tradeoff

  • Check

    Understand value functions, as a general-purpose tool for optimal decision-making

  • Check

    Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Приобретаемые навыки

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

100% онлайн

Начните сейчас и учитесь по собственному графику.

Гибкие сроки

Назначьте сроки сдачи в соответствии со своим графиком.

Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 15 часа на выполнение

Предполагаемая нагрузка: 4-6 hours/week...

Английский

Субтитры: Английский

Программа курса: что вы изучите

Неделя
1
1 ч. на завершение

Welcome to the Course!

4 видео ((всего 20 мин.)), 2 материалов для самостоятельного изучения
4 видео
Your Specialization Roadmap3мин
2 материала для самостоятельного изучения
Reinforcement Learning Textbook10мин
Read Me: Pre-requisites and Learning Objectives10мин
7 ч. на завершение

The K-Armed Bandit Problem

8 видео ((всего 46 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
8 видео
What is the trade-off?7мин
Optimistic Initial Values6мин
Upper-Confidence Bound (UCB) Action Selection5мин
Jonathan Langford: Contextual Bandits for Real World Reinforcement Learning8мин
Week 1 Summary3мин
3 материала для самостоятельного изучения
Module 2 Learning Objectives10мин
Weekly Reading30мин
Chapter Summary30мин
1 практическое упражнение
Exploration/Exploitation45мин
Неделя
2
4 ч. на завершение

Markov Decision Processes

6 видео ((всего 24 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
6 видео
Continuing Tasks5мин
Examples of Episodic and Continuing Tasks3мин
Week 2 Summary1мин
2 материала для самостоятельного изучения
Module 3 Learning Objectives10мин
Weekly Reading30мин
1 практическое упражнение
MDPs45мин
Неделя
3
3 ч. на завершение

Value Functions & Bellman Equations

8 видео ((всего 48 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
8 видео
Why Bellman Equations?5мин
Optimal Policies7мин
Optimal Value Functions5мин
Using Optimal Value Functions to Get Optimal Policies8мин
Week 3 Summary4мин
3 материала для самостоятельного изучения
Module 4 Learning Objectives10мин
Weekly Reading30мин
Chapter Summary13мин
2 практического упражнения
Value Functions and Bellman Equations45мин
Value Functions and Bellman Equations45мин
Неделя
4
6 ч. на завершение

Dynamic Programming

8 видео ((всего 42 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
8 видео
Policy Iteration8мин
Flexibility of the Policy Iteration Framework4мин
Efficiency of Dynamic Programming5мин
Week 4 Summary2мин
Congratulations!3мин
3 материала для самостоятельного изучения
Module 5 Learning Objectives10мин
Weekly Reading30мин
Chapter Summary30мин
1 практическое упражнение
Dynamic Programming45мин
4.8
Рецензии: 22Chevron Right

Лучшие отзывы о курсе Fundamentals of Reinforcement Learning

автор: NSAug 4th 2019

The ideal course to go with the book Reinforcement Learning: An Introduction. The quizzes and coding workshops are pitched just right in my opinion, neither too easy nor too hard.

автор: ATJul 31st 2019

Very clear and engaging presentation, well thought out and typical Coursera-style programming assignments. Definitely looking forward to taking the rest of the sequence.

Преподаватели

Avatar

Martha White

Assistant Professor
Computing Science
Avatar

Adam White

Assistant Professor
Computing Science

О Альбертский университет

UAlberta is considered among the world’s leading public research- and teaching-intensive universities. As one of Canada’s top universities, we’re known for excellence across the humanities, sciences, creative arts, business, engineering and health sciences....

О Alberta Machine Intelligence Institute

The Alberta Machine Intelligence Institute (Amii) is home to some of the world’s top talent in machine intelligence. We’re an Alberta-based research institute that pushes the bounds of academic knowledge and guides business understanding of artificial intelligence and machine learning....

Специализация Обучения с подкреплением: общие сведения

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Обучения с подкреплением

Часто задаваемые вопросы

  • Зарегистрировавшись на сертификацию, вы получите доступ ко всем видео, тестам и заданиям по программированию (если они предусмотрены). Задания по взаимной оценке сокурсниками можно сдавать и проверять только после начала сессии. Если вы проходите курс без оплаты, некоторые задания могут быть недоступны.

  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

Остались вопросы? Посетите Центр поддержки учащихся.