Looking for ARQUITECTURA DE ORDENADORES Todos los grupos test answers and solutions? Browse our comprehensive collection of verified answers for ARQUITECTURA DE ORDENADORES Todos los grupos at moodle.uam.es.
Get instant access to accurate answers and detailed explanations for your course questions. Our community-driven platform helps students succeed!
La siguiente figura corresponde a la función:
En el ejercicio 4 se llevó a cabo la comparativa de multiplicar dos matrices cuadradas de n x n elementos respecto del tiempo de transponer la matriz y hacer la multilicación por la matriz B traspuesta
¿Qué se puede afirmar respecto a la cantidad de referencias a la caché de instrucciones?
En el ejercicio 4 se llevó a cabo la comparativa de multiplicar dos matrices cuadradas de n x n elementos respecto del tiempo de transponer la matriz y hacer la multilicación por la matriz B traspuesta
Para responder a la pregunta necesitará revisar el resultado de la ejecución del comando "
¿Cuál es la configuración de la caché de último nivel (más lejano al procesador) disponible en el equipo?
¿Qué tipo de datos es __m128d?
Para conocer únicamente que código ha sido auto-vectorizado en gcc podemos generar un informe. Indica que frase es verdadera.
¿Qué tipo de datos es __m128?
En un programa que procesa píxeles representando cada pixel por 4 números de tamaño un byte (R,G,B,A).
Teniendo en cuenta que durante las operaciones cada uno de los 4 canales de un byte se debe extender a 32 bit, para ser multiplicado por una constante como valores float de precisión simple, y que es necesario utilizar los 4 canales para calcular el resultado.
¿Cuántos píxeles se pueden procesar en paralelo si utilizamos un vector del ISA AVX512 para realizar la multiplicación?
Al vectorizar manualmente el siguiente código. ¿Qué vector constante podemos usar para inicializar ‘a’ y equivale a las cuatro primeras iteraciones del bucle?
/* Populate A and B arrays */
double a[ARRAY_SIZE]
for (i=0; i < ARRAY_SIZE; i++) {
a[i] = i+1;
}
Un programa que procesa únicamente valores representados por enteros de 32 bits se mejora utilizando un procesador que soporta AVX256. Suponiendo que las operaciones existentes en el código admiten una vectorización ideal. ¿Qué aceleración objetivo se podría alcanzar?