Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
Как се решава проблема с изчисляването на безброй много бъдещи награди при безкрайно взаимодействие с околната среда?
винаги се изпозлва "алчен" алгоритъм, който оценява само 1 награда напред
не може да се реши
въвежда се фактор на отхвърляне (discount factor), който определя хоризонт на бъдещите действия, които се оценяват
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!