Looking for ARQUITECTURA DE ORDENADORES Todos los grupos test answers and solutions? Browse our comprehensive collection of verified answers for ARQUITECTURA DE ORDENADORES Todos los grupos at moodle.uam.es.
Get instant access to accurate answers and detailed explanations for your course questions. Our community-driven platform helps students succeed!
Para conocer únicamente que parte del código no ha sido auto-vectorizado en gcc podemos generar un informe. Indica que flag es el adecuado.
La siguiente figura corresponde a la función:
Un programador consigue vectorizar un código con AVX 256, consiguiendo una aceleración A = 8. Suponiendo una vectorización ideal ¿Qué aceleración puede conseguir si mejora el código para AVX 512?
La función _mm_add_epi32 se emplea para sumar dos vectores que almacenan datos de tipo:
La función _mm_add_pd se emplea para sumar dos vectores que almacenan datos de tipo:
Para automatizar la toma de medida de tiempos y accesos a cachés se ha utilizado en esta práctica un mecanismo de automatización para la toma de medidas.
Responda lo que se ajuste a lo realizado en la práctica
Se utilizan dos códigos para realizar la suma de los elementos de una matriz (compute_fast y compute_slow) que se pueden ver en el material provisto para el examen. El programa es similar al resuelto en prácticas
Se han comprobado diferencias significativas en el tiempo de ejecución de estas rutinas para iguales parámetros de entrada.
En el ejercicio 4 se llevó a cabo la comparativa de multiplicar dos matrices cuadradas de n x n elementos respecto del tiempo de transponer la matriz y hacer la multilicación por la matriz B traspuesta
En el contexto de la suma de elementos de una matriz utilizando algoritmos similares descriptos en el documento y utilizado en prácticas (como por ejemplo compute_fast y compute_slow).
En el ejercicio 4 se llevó a cabo la comparativa de multiplicar dos matrices cuadradas de n x n elementos respecto del tiempo de transponer la matriz y hacer la multilicación por la matriz B traspuesta
¿Qué se puede afirmar respecto a la cantidad de referencias a la caché de instrucciones?