Add to Chrome
✅ The verified answer to this question is available below. Our community-reviewed solutions help you understand the material better.
Kuidas Vision Transformer (ViT) teisendab pildi sisendiks?
Jagab pildi väikesteks tükikesteks ja esitab need jadana, kus iga tükike on eraldi element.
Jagab pildi väikesteks tükikesteks ja ühendab nende väärtused üheks vektoriks.
Töötleb pilti tervikuna ja loob sellest ühe globaalse representatsiooni enne jadasse teisendamist.
Rakendab sama filtrit igale pildi piirkonnale ja moodustab tunnuste kaardi.
Get Unlimited Answers To Exam Questions - Install Crowdly Extension Now!