Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
What is the main idea behind multi-step bootstrapping in Reinforcement Learning?
To always use the next reward as the estimate for future returns
To interpolate between using a single-step TD update and the full Monte Carlo return
To update the value function using the entire return of an episode
To update the policy after every action
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!