Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
Which approach does not ensure continual exploration (Select all that apply)
On-policy learning with a deterministic policy
Off-policy learning with an ε -soft behavior policy and deterministic target policy
On-policy learning with an ε -soft policy
Exploring Starts
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!