Please enable JavaScript.
Coggle requires JavaScript to display documents.
ALMACENAMIENTO Y ESTRUCTURA DE ARCHIVOS (DISCOS MAGNÉTICOS (Medidas del…
ALMACENAMIENTO Y ESTRUCTURA
DE ARCHIVOS
VISIÓN GENERAL DE LOS MEDIOS FÍSICOS DE ALMACENAMIENTO
Caché: almacenamiento más
rápida y costosa. La memoria caché es pequeña; su
uso lo gestiona el hardware del sistema informático.
memoria principal: utilizado para operar con los datos disponibles es la memoria principal
Memoria flash: memoria
sólo de lectura programable y borrable eléctricamente, es muy rascribir y leer datos.
Almacenamiento en discos magnéticos: principal medio de almacenamiento a largo plazo de datos en conexión es el disco magnético, aquí se guarda toda la base de datos.
Almacenamiento óptico: Los datos se almacenan en un disco por medios ópticos y se leen mediante un láser. hay unos que son de de escritura única y lectura múltiple .
Almacenamiento en cinta: es utilizado en copias de seguridad y datos de archivo, acceso a los datos resulta mucho más lento
DISCOS MAGNÉTICOS
Cada plato(discos rígidos) del disco tiene una forma circular plana. Sus dos superficies están cubiertas por un material magnético y la información se graba en ellas
motor lo hace
girar a una velocidad constante elevada
se divide a efectos lógicos en pistas, que se
subdividen en sectores(unidad mínima
de información que puede leerse o escribirse en el disco)
cabeza de lectura y escritura guarda magnéticamente
la información en los sectores
Las cabezas de lectura y escritura se mantienen tan próximas como sea posible a la superficie de los discos para aumentar la densidad de grabación
Un disco de cabezas fijas tiene una cabeza diferente
para cada pista
Un controlador de disco actúa como interfaz entre el sistema informático y el hardware concreto de la unidad de disco
si un sector se encuentra dañado reasignar lógicamente el sector a una ubicación física diferente
Medidas del rendimiento de los discos
tiempo de acceso es el tiempo transcurrido desde que se formula una solicitud de lectura o de escritura hasta que comienza la transferencia de datos.
El brazo se ubica para la lectura de datos.
El tiempo para volver a ubicar el brazo se denomina tiempo de búsqueda y aumenta con la distancia que deba recorrer el brazo
tiempo medio de búsqueda es la media de los tiempos de búsqueda medido en una sucesión de solicitudes aleatorias
El tiempo de espera del sector al que hay que tener acceso aparezca bajo la cabeza se denomina tiempo de latencia rotacional.
La velocidad de transferencia de datos es la velocidad a la que se pueden recuperar o guardar datos en el disco.
tiempo medio entre fallos es la medida de fiabilidad del disco
Optimización del acceso a los bloques
del disco
Planificación si hay varios cilindros el tiempo de espera disminuye, planificación del brazo del disco aun=menta el numero de accesos que se quieren a=hacer
Organización de archivos en bloques del disco de una manera que se corresponda fielmente con la forma en que se espera tener acceso a los datos.
Memoria intermedia de escritura no volátil la que no pierde la informacion cuando sucede algo con la energia .
Disco de registro histórico son secuenciales, lo que elimina principalmente el tiempo de búsqueda y, así, pueden escribirse simultáneamente varios bloques consecutivos, lo soportan los sistemas de archivos de diario
RAID
disposición
redundante de discos independientes
Mejora de la fiabilidad mediante la redundancia
tiempo medio de reparación: tiempo que se tarda en sustituir un disco averiado y en restaurar sus datos. El tiempo entre pérdidas de datos se refiere a la cantidad de datos perdidos en un sistema de creación de imágenes
la posibilidad de fallo en los discos, puede ocasionar perdidas inaceptables de datos, para evitar esto se usa redundancia el enfoque mas simple es duplicar los datos e discos(creación de imágenes).
Mejora del rendimiento mediante
el paralelismo
la velocidad de transferencia de cada proceso de lectura es la misma que en los sistemas de discos únicos
acceder a discos de manera simultanea
Distribuir los datos entre
varios discos aumenta velocidad de transferencia
dividir los bits de cada byte entre varios discos; se denomina distribución en el nivel de bit
La disposición de ocho discos puede tratarse como un solo disco con sectores que tienen ocho veces el tamaño normal y la velocidad
Niveles de RAID
nivel 0 disposiciones de discos con distribución en el nivel de bloque pero sin redundancia
nivel 1 creación de imágenes
del disco con distribución de bloques.
nivel 2 detección de errores utilizando los
bits de paridad
nivel 3 bits entrelazados, Si uno de los sectores se deteriora, se sabe exactamente el sector que es y para cada bit del mismo se puede determinar si es un uno o un cero calculando la paridad.
nivel 4 bloques entrelazados, Si uno de los discos falla puede utilizarse el bloque de paridad con los bloques correspondientes de los demás discos para restaurar los bloques del disco averiado
nivel 5 paridad distribuida con bloques
entrelazados, divide los datos y la paridad entre los N + 1 discos en vez de guardar los datos en N discos y la paridad en uno. Para cada conjunto de N bloques lógicos, uno de los discos guarda la paridad y los otros N guardan los bloques.
nivel 6 parecido al 5 pero guarda información redundante.
Elección del nivel RAID adecuado
se toma en cuanta los costos, rendimiento de opereciones E/R, cuando falla un disco y durante la reconstruccion
rendimiento en la reconstrucción es un factor importante si se necesita un aporte continuo de datos,
todo depende del sistema por ejemplo si es de poca segurida un nivel 0 basta, nivel 1 para tener menos sobrecarga sobre escritura, si se hacen pequeñas transferencias un nivel 3 a 5, 6 si la seguridad es bastante importante, entre otros.
Aspectos hardware
intercambio en caliente; reemplazar discos averiados por otros nuevos sin desconectar la corriente.
RAID hardware: sistemas con soporte hardware especial
RAID software: cambios a nivel de software
puede hacer uso de RAM no volátil
buenas implementaciones, varias fuentes de alimentación
ALMACENAMIENTO TERCIARIO
Discos ópticos: discos compactos son un medio popular de distribución de software y otros datos mucho más lento que los tiempos de acceso a disco
Cintas magneticas: relativamente permanentes y pueden albergar grandes volúmenes de datos, lentas, usadas en copias de seguridad
ACCESO AL ALMACENAMIENTO
archivos residen permanentemente en los discos, se divide en unidades de almacenamiento (bloques), existe la memoria intermedia(buffer) y el gestor de la memoria intermedia
Gestor de la memoria intermedia: intermidiario entre bloques en disco y solicitudes
Estrategia de sustitución. Cuando no queda espacio libre en la memoria intermedia hay que eliminar un bloque de ésta antes de que se pueda escribir en él otro nuevo.
Bloques clavados. Para que la bases de datos pueda recuperarse de las caídas se limita las ocasiones en que se puede volver a escribir el bloque en el distar las cintas. Clavado: bloque al que no se le puede volver a escribir en disco.
Salida forzada de los bloques: es necesario volver a escribir en el bloque en el disco (salida forzada)
Políticas para la sustitución
de la memoria intermedia
minimización de los accesos al disco
hacer referencia a los bloques a los que se
ha hecho referencia recientemente (esquema de sustitución de bloques LRU)
Se debe de gestionar la memoria intermedia (extracción inmediata)
si se nesesita eliminar o sustituir de la memoria intermedia se usa Most Recently Used (MRU)
ORGANIZACIÓN DE LOS ARCHIVOS
se organizan lógicamente como secuencias
de registros
Registros de longitud fija: usan los bytes nesesario para los registros, es dificil borrar en estructuras asi y algunos registros requeriran mas de los bytes otorgados. Tiene cabecera del archivo(indica donde hay campo de escritura libres)
Registros de longitud variable: Almacenamiento de varios tipos de registros en un mismo archivo . Tipos de registro que permiten longitudes variables para uno o varios de los campos. Tipos de registro que permiten campos repetidos
Representación en cadenas de bytes: método sencillo de implementar los registros de longitud
variable (usa el simbolo ⊥). No resulta sencillo volver a utilizar el espacio ocupado anteriormente por un registro borrado. No hay espacio para el aumento
del tamaño de los registros.
Representación de longitud fija: implementa registros
de longitud variable
Espacio reservado: nunca se puede superar la longitud de registro maxima
Representación con listas: usa listas de regitro de longitud fija (punteros).
ORGANIZACIÓN DE LOS REGISTROS EN ARCHIVOS
Organización de archivos secuenciales
Organización de archivos secuenciales: procesamiento eficiente de los registros de acuerdo con un orden basado en una clave de búsqueda (conjunto de atributos), para su inserción Localizar el registro del archivo que precede al registro que se va a insertar en el orden de la clave de búsqueda y ver si hay algun registro vacio.
Organización de archivos
en agrupaciones
guarda relaciones en archivos distintos o en solo archivo, las tuplas son archivos de longitud fija, dos o más relaciones en cada bloque, es nesesario vincular todos los registros de esa relación utilizando punteros
ALMACENAMIENTO CON DICCIONARIOS DE DATOS
es nesesario conocer los datos(relaciones, atrubutos y longitudes, restricciones, datos de usuario, informacion estadistica) sobre las relaciones (diccionario de datos o catálogo del sistema), otorga organización
del almacenamiento
ALMACENAMIENTO PARA LAS BASES DE DATOS ORIENTADAS
A OBJETOS
Correspondencia de los objetos
con los archivos
parecido con la correspondencia de las tuplas
con los archivos de los sistemas relacionales.
Se pueden implementar campos de conjuntos que tengan un número pequeño de elementos que utilicen estructuras de datos como las listas enlazadas
Implementación de los identificadores
de los objetos
se nesesita una manera de encontrar los objetos IDO (identificador), existen los IDO fisicos(codifican ubicacion del objetos), tien identificador de volumen,pagina, uno unico y logicos(no especifican ubicacion del objeto)
Gestión de los punteros persistentes
se implementan en un lenguaje
de programación persistente utilizando los IDOs, apuntan a todos
los datos de la base de datos
La acción de buscar un objeto dado su identificador
se denomina desreferenciar.
El rescate de punteros es una manera de reducir el coste de encontrar los objetos persistentes que ya se hallen en la memoria
Rescate hardware
utiliza el hardware para la gestión de la memoria presente en la mayor parte de los sistemas informáticos actuales para abordar el problema(deberian de ser iguales) de punteros internos y persistentes
Si no tiene almacenamiento real asignado, o que ha sido protegida contra accesos, entonces ocurre una violación de la segmentación
Puede guardar los punteros persistentes en los objetos en el mismo espacio de los punteros internos
Transforma de manera transparente los punteros persistentes en internos de la memoria, y viceversa, de forma inteligente y eficiente
Se usa la representación de punteros, el rescate de punteros en una página y la desreferencia de punteros
Estructura de los objetos en el disco
o en la memoria
Diferencias del formato con el que se
guardan en el disco en la base de datos
Busca hacer independiente de la máquina y del compilador la representación física de los objetos de la base de datos.
punteros ocultos apuntan a las tablas utilizadas para implementar ciertos métodos del objeto.
. Objetos de gran tamaño
Objetos multimedias
objetos de gran tamaño que contienen datos binarios se denominan objetos de gran tamaño en binario, también hay de caracteres
La mayoría de BD limitan los tamaños
presentan problemas con la memmoria intermedia
se manipulan de distintas maneras los datos de texto, graficos y sonido/video
se usa desmarcar/marcar para actualizar estos metodos