Crowdly

Add to Chrome

В алгоритмі Value Iteration агент у стані виконує дію, яка з імовірністю 1 ве...

✅ The verified answer to this question is available below. Our community-reviewed solutions help you understand the material better.

В алгоритмі Value Iteration агент у стані виконує дію, яка з імовірністю 1 веде до стану . Винагорода за перехід = 12, поточна цінність наступного стану = 47, фактор дисконтування = 0,76. Обчисліть оновлену цінність за допомогою рівняння (очікування) Беллмана. Введіть число, округлене до двох знаків після коми.

Want instant access to all verified answers on do.ipo.kpi.ua?

Get Unlimited Answers To Exam Questions - Install Crowdly Extension Now!

Add to Chrome

Telegram Instagram TikTok Question Bank