Об этом курсе

Недавно просмотрено: 151,279

Карьерные результаты учащихся

14%

начал новую карьеру, пройдя эти курсы
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Средний уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 15 часов на выполнение
Английский

Чему вы научитесь

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Приобретаемые навыки

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

Карьерные результаты учащихся

14%

начал новую карьеру, пройдя эти курсы
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Средний уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 15 часов на выполнение
Английский

от партнера

Placeholder

Альбертский университет

Placeholder

Alberta Machine Intelligence Institute

Программа курса: что вы изучите

Оценка контентаThumbs Up93%(12,802 оценки)Info
Неделя
1

Неделя 1

1 ч. на завершение

Welcome to the Course!

1 ч. на завершение
4 видео ((всего 20 мин.)), 2 материалов для самостоятельного изучения
4 ч. на завершение

An Introduction to Sequential Decision-Making

4 ч. на завершение
8 видео ((всего 46 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
Неделя
2

Неделя 2

3 ч. на завершение

Markov Decision Processes

3 ч. на завершение
7 видео ((всего 36 мин.)), 2 материалов для самостоятельного изучения, 2 тестов
Неделя
3

Неделя 3

3 ч. на завершение

Value Functions & Bellman Equations

3 ч. на завершение
9 видео ((всего 56 мин.)), 3 материалов для самостоятельного изучения, 2 тестов
Неделя
4

Неделя 4

4 ч. на завершение

Dynamic Programming

4 ч. на завершение
10 видео ((всего 72 мин.)), 3 материалов для самостоятельного изучения, 2 тестов

Рецензии

Лучшие отзывы о курсе FUNDAMENTALS OF REINFORCEMENT LEARNING

Посмотреть все отзывы

Специализация Обучения с подкреплением: общие сведения

Обучения с подкреплением

Часто задаваемые вопросы

Остались вопросы? Посетите Центр поддержки учащихся.