Please enable JavaScript.
Coggle requires JavaScript to display documents.
Cap. 5- Grande y rápida: aprovechamiento de la jerarquía de memoria -…
Cap. 5- Grande y rápida:
aprovechamiento
de la jerarquía
de memoria
Casos reales: jerarquías de memoria
AMD Opteron X4 (Barcelona)
Arquitectura de memoria compartida
Utiliza una arquitectura de memoria distribuida con acceso uniforme a la memoria (NUMA).
Caché de tres niveles (L1, L2, L3)
L1: 64 KB por núcleo (separado en instrucciones y datos).
L2: 512 KB por núcleo.
L3: Caché compartida de 2 MB entre los cuatro núcleos.
Controlador de memoria integrado
Reduce la latencia de acceso a memoria y mejora el ancho de banda.
Acceso a memoria y coherencia de caché
Implementa un protocolo de coherencia de caché para garantizar consistencia en entornos multinúcleo.
Ventajas y Desventajas
Ventajas: Menor latencia, mayor eficiencia en la gestión de caché.
Desventajas: Puede haber problemas de acceso cuando múltiples núcleos acceden simultáneamente a la memoria compartida.
Intel Nehalem
Arquitectura con QuickPath Interconnect (QPI)
Reemplaza el bus frontal (FSB) y mejora la comunicación entre CPU y memoria.
Caché distribuida (L1, L2, L3)
L1: 32 KB para datos y 32 KB para instrucciones por núcleo.
L2: 256 KB por núcleo.
L3: Caché compartida de hasta 8 MB.
Controlador de memoria integrado
Reduce la latencia y aumenta el rendimiento de acceso a memoria.
Hyper-Threading y su impacto en la jerarquía de memoria
Permite ejecutar múltiples hilos por núcleo, optimizando el uso de la caché y los registros.
Comparación con AMD Opteron
QPI proporciona una mayor velocidad de transferencia de datos en comparación con la arquitectura NUMA de AMD.
Mayor eficiencia energética y optimización en entornos multiprocesador.
Errores habituales en la jerarquía de memoria
Fallos de caché
Falta de localidad temporal y espacial: Un acceso disperso a la memoria reduce la efectividad de la caché.
Tamaño y organización de bloques ineficiente: Un mal diseño de la jerarquía de caché puede provocar un uso ineficiente del espacio.
Conjuntos de reemplazo inadecuados: Estrategias de reemplazo ineficientes pueden llevar a expulsar datos que aún son útiles.
Errores en la administración de memoria
Mala gestión de la memoria virtual: Un uso inadecuado de paginación puede aumentar la latencia.
Paginación excesiva (thrashing): Cuando la memoria RAM se satura y hay constantes fallos de página, el rendimiento disminuye drásticamente.
Problemas de coherencia en sistemas multiprocesador: Los diferentes niveles de caché pueden contener copias inconsistentes de los datos.
Problemas de rendimiento
Latencias altas por acceso a RAM: Cuando la jerarquía de memoria no está bien optimizada, el acceso a datos en RAM puede ser costoso.
Bloqueo en buses de datos: Una sobrecarga en la comunicación entre procesadores y memoria ralentiza el rendimiento.
Consumo energético elevado por accesos frecuentes: Un mal diseño de caché y memoria puede aumentar el uso energético innecesariamente.