Додати до Chrome
✅ Перевірена відповідь на це питання доступна нижче. Наші рішення, перевірені спільнотою, допомагають краще зрозуміти матеріал.
Яке твердження найточніше описує принцип роботи мультимодальних моделей у задачах text-to-image генерації?
Текст безпосередньо перетворюється у пікселі без проміжних представлень
Зображення генерується випадково, а текст використовується лише для фільтрації результатів
Модель не потребує навчання на парних даних (текст–зображення)
Модель незалежно обробляє текст і зображення без спільного представлення
Модель використовує тільки згорткові мережі без текстових енкодерів
Текст використовується лише після генерації для оцінки якості
Текст кодується у спільний латентний простір, який узгоджується із зображенням для подальшої генерації
Отримайте необмежений доступ до відповідей на екзаменаційні питання - встановіть розширення Crowdly зараз!