✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
You are building a neural network that uses the tanh activation function. Which weight initializer is most suitable to maintain stable gradients during training?