Looking for ARQUITECTURA DE ORDENADORES Todos los grupos test answers and solutions? Browse our comprehensive collection of verified answers for ARQUITECTURA DE ORDENADORES Todos los grupos at moodle.uam.es.
Get instant access to accurate answers and detailed explanations for your course questions. Our community-driven platform helps students succeed!
En el ejercicio 4 se llevó a cabo la comparativa de multiplicar dos matrices cuadradas de nxn elementos respecto del tiempo de transponer la matriz y hacer la multilicación por la matriz B traspuesta
En el ejercicio 4 se llevó a cabo la comparativa de multiplicar dos matrices cuadradas de n x n elementos respecto del tiempo de transponer la matriz y hacer la multilicación por la matriz B traspuesta
En el contexto de la suma de elementos de una matriz utilizando algoritmos similares descritos en el documento y utilizado en prácticas (como por ejemplo compute_fast y compute_slow).
Se utilizan dos códigos para realizar la suma de los elementos de una matriz (compute_fast y compute_slow) que se pueden ver en el material provisto para el examen y similares a los usados en la práctca.
Se han comprobado diferencias significativas en el tiempo de ejecución de estas rutinas para iguales parámetros de entrada.
Se ejecutan dos simulaciones de cache para la ejecución del programa ejecutable slow con matrices de 2000x2000 elementos. Teniendo en cuenta que la Simulación A se lanza con:
valgrind --tool=cachegrind --I1=1024,1,64 --D1=1024,1,64 --LL=8388608,1,64 ./slow 2000
y la Simulación B se lanza con:
valgrind --tool=cachegrind --I1=1024,1,32 --D1=1024,1,64 --LL=8388608,1,64 ./slow 2000
Teniendo en cuenta los valores de los siguientes parámetros de salida de la simulación: Ir, I1mr, ILmr, Dr , D1mr, DLmr, Dw, D1mw, DLmw.
Donde: Ir (Instruction References), I1mr (Instruction L1 miss rate), Ilmr (Instruction Last Level miss rate), Dr (Data References), D1mr (Data L1 miss rate), DLmr (Data Last Level miss rate), Dw (Data Writes), D1mw (Data Writes L1 miss rate), DLmw (Data Write Last Level miss rate).
Podemos afirmar:
Se ha ejecutado el algoritmo de suma de matrices versión “fast” para matrices 2000x2000 con la herramienta cachegrind (usando cachés de primer nivel para datos e instrucciones de 32768 bytes, 8 vías y tamaño de línea 64 bytes, y una caché de último nivel de 8388608 bytes, 8 vías y tamaño de línea 64 bytes).
Según el reporte provisto, ¿Cuál es la cantidad de fallos en la lectura de datos para la caché de datos de primer nivel?
Para responder a la pregunta necesitará revisar el resultado de la ejecución del comando "
¿Cuál es la configuración de la caché de datos de primer nivel (más cercano al procesador) disponible en el equipo?
Para responder a la pregunta necesitará revisar el resultado de la ejecución del comando "getconf" realizado sobre un cierto ordenador y provisto durante el examen.
¿Cuál es la configuración de la caché de nivel intermedio (ni el primero ni el último) disponible en su equipo?
Se ejecutan dos simulaciones de cache para la ejecución del programa ejecutable slow con matrices de 2000x2000 elementos. Teniendo en cuenta que la Simulación A se lanza con:
valgrind --tool=cachegrind --I1=1024,1,64 --D1=1024,1,64 --LL=8388608,1,64 ./slow 2000
y la Simulación B se lanza con:
valgrind --tool=cachegrind --I1=4096,1,64 --D1=4096,1,64 --LL=8388608,1,64 ./slow 2000
Teniendo en cuenta los valores de los siguientes parámetros de salida de la simulación: Ir, I1mr, ILmr, Dr , D1mr, DLmr, Dw, D1mw, DLmw.
Donde: Ir (Instruction References), I1mr (Instruction L1 miss rate), Ilmr (Instruction Last Level miss rate), Dr (Data References), D1mr (Data L1 miss rate), DLmr (Data Last Level miss rate), Dw (Data Writes), D1mw (Data Writes L1 miss rate), DLmw (Data Write Last Level miss rate).
Podemos afirmar:
En el ejercicio 4 se llevó a cabo la comparativa de multiplicar dos matrices cuadradas de nxn elementos respecto del tiempo de transponer la matriz y hacer la multilicación por la matriz B traspuesta