Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
For Monte Carlo Prediction of state-values, the number of updates at the end of an episode depends on
The number of states
The number of states visited during the episode
The number of possible state-action value pairs
The number of possible actions in each state
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!