Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
What is the objective of policy iteration in reinforcement learning?
To find an optimal value function
To balance exploration and exploitation
To find the best action for each state
To find an optimal policy
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!