Please enable JavaScript.
Coggle requires JavaScript to display documents.
ALMACENAMIENTO Y ESTRUCTURA DE ARCHIVOS (VISIÓN GENERAL DE LOS MEDIOS…
ALMACENAMIENTO Y ESTRUCTURA
DE ARCHIVOS
VISIÓN GENERAL DE LOS MEDIOS FÍSICOS DE ALMACENAMIENTO
• Caché. Caché es la forma de almacenamiento más rápida y costosa. La memoria caché es pequeña; su uso lo gestiona el hardware del sistema informático
• Memoria principal. El medio de almacenamiento utilizado para operar con los datos disponibles es la memoria principal
• Memoria flash. Se diferencia de la memoria principal en que los datos pueden sobrevivir a los fallos del suministro eléctrico.La lectura de los datos de la memoria flashtarda menos de cien nanosegundos
• Almacenamiento en discos magnéticos. El principal medio de almacenamiento a largo plazo de datos en conexión es el disco magnético.
• Almacenamiento óptico. La forma más popular de almacenamiento óptico es el disco compacto (Compact Disk, CD), que puede almacenar alrededor de 640 megabytes de datos
• Almacenamiento en cinta. El almacenamiento en cinta se utiliza principalmente para copias de seguridad y datos de archivo
DISCOS MAGNÉTICOS
Características físicas de los discos
La cabeza de lectura y escritura guarda magnéticamente la información en los sectores en forma de inversiones de la dirección de magnetización del material magnético
Cada cara de un plato del disco tiene una cabeza de lectura y escritura que se desplaza por el plato para tener acceso a las diferentes pistas
El conjunto de los platos del disco montados sobre un eje y las cabezas montadas en el brazo del disco se denomina dispositivo cabeza-disco
Las cabezas de lectura y escritura se mantienen tan próximas como sea posible a la superficie de los discos para aumentar la densidad de grabación
Otra labor interesante llevada a cabo por los controladores de disco es la reasignación de los sectores dañados
Medidas del rendimiento de los discos
El tiempo de acceso es el tiempo transcurrido desde que se formula una solicitud de lectura o de escritura hasta que comienza la transferencia de datos.
El tiempo para volver a ubicar el brazo se denomina tiempo de búsqueda y aumenta con la distancia que deba recorrer el brazo
El tiempo medio de búsqueda es la media de los tiempos de búsqueda medido en una sucesión de solicitudes aleatorias (uniformemente distribuidas)
El tiempo que se pasa esperando a que el sector al que hay que tener acceso aparezca bajo la cabeza se denomina tiempo de latencia rotacional.
El tiempo de latencia medio del disco es la mitad del tiempo empleado en una rotación completa del disco
La velocidad de transferencia de datos es la velocidad a la que se pueden recuperar o guardar datos en el disco.
Tiempo medio entre fallos es una medida de la fiabilidad del disco.
RAID
Tener un gran número de discos en un sistema presenta oportunidades para mejorar la velocidad a la que se pueden leer o escribir los datos si los discos funcionan en paralelo
El paralelismo se puede usar para realizar varias lecturas o escrituras independientes simultáneamente
Mejora de la fiabilidad mediante
la redundancia
Considérese en primer lugar la fiabilidad. La posibilidad de que algún disco de una disposición de N discos falle es mucho más elevada que la posibilidad de que un único disco concreto falle
Mejora del rendimiento mediante
el paralelismo
Considérense ahora las ventajas del acceso en paralelo a varios discos. Con la creación de imágenes de los discos la velocidad a la que las solicitudes de lectura pueden procesarse se duplica, dado que las solicitudes de lectura pueden enviarse a cualquiera de los discos
Niveles de RAID
• RAID de nivel 0 se refiere a disposiciones de discos con distribución en el nivel de bloque pero sin redundancia
• RAID de nivel 1 se refiere a la creación de imágenes del disco con distribución de bloques
• RAID de nivel 2 también se conoce como organización de códigos de corrección de errores tipo memoria
• RAID de nivel 3, u organización de paridad con bits entrelazados, mejora respecto al nivel 2 destacando que, a diferencia de los sistemas de memoria, los controladores de disco pueden detectar si un sector se ha leído correctamente, por lo que se puede utilizar un solo bit de paridad para la corrección y la detección de los errores
• RAID de nivel 4, u organización de paridad con bloques entrelazados, usa distribución de bloques, y además guarda un bloque de paridad en un disco aparte para los bloques correspondientes de los otros N discos
• RAID de nivel 5, o paridad distribuida con bloques entrelazados, mejora respecto al nivel 4 dividiendo los datos y la paridad entre los N + 1 discos en vez de guardar los datos en N discos y la paridad en uno
• RAID de nivel 6, también denominado esquema de redundancia P+Q, es muy parecido a RAID de nivel 5 pero guarda información redundante adicional para protección contra fallos de disco múltiples
Los factores a tener en cuenta al elegir un nivel RAID son:
• Costo económico extra de los requisitos de almacenamiento
en disco.
• Requisitos de rendimiento en términos del número
de operaciones E/S.
• Rendimiento cuando falla un disco.
ALMACENAMIENTO TERCIARIO
Discos ópticos
Los discos compactos son un medio popular de distribución de software, datos multimedia como el sonido y las imágenes, y otra información editada de manera electrónica
Cintas magnéticas
Aunque las cintas magnéticas son relativamente permanentes y pueden albergar grandes volúmenes de datos, resultan lentas en comparación con los discos magnéticos y ópticos
ACCESO AL ALMACENAMIENTO
Gestor de la memoria intermedia
Además, para dar un buen servicio al sistema de bases de datos el gestor de la memoria intermedia debe utilizar técnicas más complejas que los esquemas de gestión de la memoria virtual habituales:
• Estrategia de sustitución. Cuando no queda espacio libre en la memoria intermedia hay que eliminar un bloque de ésta antes de que se pueda escribir en él otro nuevo
• Bloques clavados. Para que el sistema de bases de datos pueda recuperarse de las caídas resulta necesario limitar las ocasiones en que se puede volver a escribir el bloque en el disco
• Salida forzada de los bloques. Hay situaciones en las que resulta necesario volver a escribir el bloque en el disco, aunque no se necesite el espacio de memoria intermedia que ocupa. Este proceso de escritura se denomina salida forzada del bloque
ORGANIZACIÓN DE LOS REGISTROS EN ARCHIVOS
• Organización de archivos en montículo. En esta organización se puede colocar cualquier registro en cualquier parte del archivo en que haya espacio suficiente
• Organización de archivos secuenciales. En esta organización los registros se guardan en orden secuencial, basado en el valor de la clave de búsqueda de cada registro
• Organización asociativa (hash) de archivos. En esta organización se calcula una función de asociación (hash) de algún atributo de cada registro.
ALMACENAMIENTO CON DICCIONARIOS DE DATOS
Entre los tipos de información que debe guardar el sistema
figuran los siguientes:
• Los nombres de las relaciones
• Los nombres de los atributos de cada relación
• Los dominios y las longitudes de los atributos
• Los nombres de las vistas definidas en la base de
datos y las definiciones de esas vistas
• Las restricciones de integridad