Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
In self-attention, what happens after the attention weights have been computed?
The weights replace the original word embeddings permanently.
The weights are used to compute a weighted sum of the value vectors.
The weights are sorted alphabetically.
The weights are directly used as the final predicted token IDs.
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!