Об этом курсе

Недавно просмотрено: 72,080
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 30 часов на выполнение
Английский
Субтитры: Английский

Приобретаемые навыки

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Сертификат, ссылками на который можно делиться с другими людьми
Получите сертификат по завершении
100% онлайн
Начните сейчас и учитесь по собственному графику.
Гибкие сроки
Назначьте сроки сдачи в соответствии со своим графиком.
Промежуточный уровень

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Прибл. 30 часов на выполнение
Английский
Субтитры: Английский

от партнера

Логотип Альбертский университет

Альбертский университет

Логотип Alberta Machine Intelligence Institute

Alberta Machine Intelligence Institute

Программа курса: что вы изучите

Оценка контентаThumbs Up92%(1,306 оценки)Info
Неделя
1

Неделя 1

1 ч. на завершение

Welcome to the Course!

1 ч. на завершение
2 видео ((всего 12 мин.)), 2 материалов для самостоятельного изучения
2 видео
Meet your instructors!8мин
2 материала для самостоятельного изучения
Read Me: Pre-requisites and Learning Objectives10мин
Reinforcement Learning Textbook10мин
6 ч. на завершение

On-policy Prediction with Approximation

6 ч. на завершение
13 видео ((всего 69 мин.)), 1 материал для самостоятельного изучения, 2 тестов
13 видео
Generalization and Discrimination5мин
Framing Value Estimation as Supervised Learning3мин
The Value Error Objective4мин
Introducing Gradient Descent7мин
Gradient Monte for Policy Evaluation5мин
State Aggregation with Monte Carlo7мин
Semi-Gradient TD for Policy Evaluation3мин
Comparing TD and Monte Carlo with State Aggregation4мин
Doina Precup: Building Knowledge for AI Agents with Reinforcement Learning7мин
The Linear TD Update3мин
The True Objective for TD5мин
Week 1 Summary4мин
1 материал для самостоятельного изучения
Weekly Reading: On-policy Prediction with Approximation40мин
1 практическое упражнение
On-policy Prediction with Approximation30мин
Неделя
2

Неделя 2

8 ч. на завершение

Constructing Features for Prediction

8 ч. на завершение
11 видео ((всего 52 мин.)), 1 материал для самостоятельного изучения, 2 тестов
11 видео
Generalization Properties of Coarse Coding5мин
Tile Coding3мин
Using Tile Coding in TD4мин
What is a Neural Network?3мин
Non-linear Approximation with Neural Networks4мин
Deep Neural Networks3мин
Gradient Descent for Training Neural Networks8мин
Optimization Strategies for NNs4мин
David Silver on Deep Learning + RL = AI?9мин
Week 2 Review2мин
1 материал для самостоятельного изучения
Weekly Reading: On-policy Prediction with Approximation II40мин
1 практическое упражнение
Constructing Features for Prediction28мин
Неделя
3

Неделя 3

8 ч. на завершение

Control with Approximation

8 ч. на завершение
7 видео ((всего 41 мин.)), 1 материал для самостоятельного изучения, 2 тестов
7 видео
Episodic Sarsa in Mountain Car5мин
Expected Sarsa with Function Approximation2мин
Exploration under Function Approximation3мин
Average Reward: A New Way of Formulating Control Problems10мин
Satinder Singh on Intrinsic Rewards12мин
Week 3 Review2мин
1 материал для самостоятельного изучения
Weekly Reading: On-policy Control with Approximation40мин
1 практическое упражнение
Control with Approximation40мин
Неделя
4

Неделя 4

6 ч. на завершение

Policy Gradient

6 ч. на завершение
11 видео ((всего 55 мин.)), 1 материал для самостоятельного изучения, 2 тестов
11 видео
Advantages of Policy Parameterization5мин
The Objective for Learning Policies5мин
The Policy Gradient Theorem5мин
Estimating the Policy Gradient4мин
Actor-Critic Algorithm5мин
Actor-Critic with Softmax Policies3мин
Demonstration with Actor-Critic6мин
Gaussian Policies for Continuous Actions7мин
Week 4 Summary3мин
Congratulations! Course 4 Preview2мин
1 материал для самостоятельного изучения
Weekly Reading: Policy Gradient Methods40мин
1 практическое упражнение
Policy Gradient Methods45мин

Рецензии

Лучшие отзывы о курсе PREDICTION AND CONTROL WITH FUNCTION APPROXIMATION

Посмотреть все отзывы

Специализация Обучения с подкреплением: общие сведения

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
Обучения с подкреплением

Часто задаваемые вопросы

  • Access to lectures and assignments depends on your type of enrollment. If you take a course in audit mode, you will be able to see most course materials for free. To access graded assignments and to earn a Certificate, you will need to purchase the Certificate experience, during or after your audit. If you don't see the audit option:

    • The course may not offer an audit option. You can try a Free Trial instead, or apply for Financial Aid.
    • The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
  • Записавшись на курс, вы получите доступ ко всем курсам в специализации, а также возможность получить сертификат о его прохождении. После успешного прохождения курса на странице ваших достижений появится электронный сертификат. Оттуда его можно распечатать или прикрепить к профилю LinkedIn. Просто ознакомиться с содержанием курса можно бесплатно.

  • Когда вы оформите подписку, начнется семидневный бесплатный пробный период, в течение которого подписку можно отменить без штрафа. По истечении этого срока вы не сможете вернуть средства, но сможете отменить подписку в любой момент. Ознакомьтесь с нашей политикой возврата средств.

  • Да, Coursera предоставляет финансовую помощь учащимся, которые не могут оплатить обучение. Чтобы подать заявление, перейдите по ссылке "Финансовая помощь" слева под кнопкой "Зарегистрироваться". Заполните форму заявления. Если его примут, вы получите уведомление. Обратите внимание: этот шаг необходимо выполнить для каждого курса специализации, в том числе для дипломного проекта. Подробнее

  • Этот курс не приравнивается к зачету в университетах, однако некоторые вузы принимают сертификаты на свое усмотрение. Дополнительную информацию уточняйте в своем деканате. Онлайн-дипломы и сертификаты Mastertrack™ от Coursera позволяют получить зачеты.

Остались вопросы? Посетите Центр поддержки учащихся.