Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
What is the purpose of discount factor (γ) in reinforcement learning?
To penalize long episodes
To prioritize short-term rewards over long-term rewards
To balance exploration and exploitation
To weigh the importance of future rewards
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!