Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
Which of the following is the correct characterization of Dynamic Programming (DP) and Temporal Difference (TD) methods?
TD methods use sample updates, DP methods use expected updates.
TD methods use expected updates, DP methods use sample updates.
Both TD and DP methods use expected updates.
Both TD and DP methods use sample updates.
Both DP and TD require a complete model of the environment’s dynamics.
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!