✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
Attach the gradient magnitude plot here (initialization + after training, batches to sample = 10).
Comment on the plot, what can we say about the gradient magnitudes and how they develop when backpropagating through time?
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!