Please enable JavaScript.
Coggle requires JavaScript to display documents.
OPTIMIZACIÓN DE CONSULTAS (ESTIMACIÓN DE LAS ESTADÍSTICAS DE LOS…
OPTIMIZACIÓN DE CONSULTAS
Es el proceso de selección del plan de evaluación de las consultas más eficiente de entre las muchas estrategias generalmente disponibles para el procesamiento de una consulta dada, especialmente si la consulta es compleja
ESTIMACIÓN DE LAS ESTADÍSTICAS DE LOS RESULTADOS DE LAS EXPRESIONES
El coste de cada operación depende del tamaño y de otras estadísticas de sus valores de entrada. Dada una expresión como a (b c), para estimar el coste de combinar a con (b c) hay que hacer estimaciones de estadísticas como el tamaño de b c
Información del catálogo
Los catálogos de los SGDD almacenan la siguiente información estadística sobre las relaciones de las bases de datos
• br, el número de bloques que contienen tuplas de la relación r.
• tr, el tamaño de cada tupla de la relación r en bytes.
• fr, el factor de bloqueo de la relación r, es decir, el número de tuplas de la relación r que caben en un bloque.
• V (A, r), el número de valores distintos que aparecen en la relación r para el atributo A. Este valor es igual que el tamaño de ΠA(r). Si A es una clave de la relación r, V (A, r) es nr.
• nr, el número de tuplas de la relación r.
Estimación
Proyección: El tamaño estimado (número de registros de las tuplas) de una proyección de la forma ∏A (r) es V (A, r), ya que la proyección elimina los duplicados
Agregación: El tamaño de A G F (r) es simplemente V (A, r), ya que hay una tupla de A G F (r) por cada valor distinto de A
Operaciones de conjuntos: Si las dos entradas de una operación de conjuntos son selecciones de la misma relación se puede reescribir la operación de conjuntos como disyunciones, conjunciones o negaciones
TRANSFORMACIÓN DE EXPRESIONES RELACIONALES
Reglas de equivalencia
Las operaciones de selección conjuntivas pueden dividirse en una secuencia de selecciones individuales. Esta transformación se denomina cascada de σ.
Las operaciones de selección son conmutativas
Sólo son necesarias las últimas operaciones de una secuencia de operaciones de proyección, las demás pueden omitirse.
Las selecciones pueden combinarse con los productos cartesianos y con las reuniones zeta.
Las operaciones de reunión zeta son conmutativas.
Las operaciones de reunión natural son asociativas.
La operación de selección se distribuye por la operación de reunión zeta bajo las dos condiciones siguientes
a. Se distribuye cuando todos los atributos de la condición de selección θ0 implican únicamente los atributos de una de las expresiones (por ejemplo, E1) que se están reuniendo.
b. Se distribuye cuando la condición de selección θ1 implica únicamente los atributos de E1 y θ2 implica únicamente los atributos de
E2.
La operación proyección se distribuye por la operación de reunión zeta bajo las condiciones siguientes.
a. Sean L1 y L2 atributos de E1 y de E2, respectivamente. Supóngase que la condición de reunión θ implica únicamente los atributos de L1 ∪ L2
b. Considérese una reunión E1 θ E2. Sean L1 y L2 conjuntos de atributos de E1 y de E2, respectivamente. Sean L3 los atributos de E1 que están implicados en la condición de reunión θ, pero que no están en L1 ∪ L2, y sean L4 los atributos de E2 que están implicados en la condición de reunión θ, pero que no están en L1 ∪ L2.
Las operaciones de conjuntos unión e intersección son conmutativas.
La unión y la intersección de conjuntos son asociativas.
La operación de selección se distribuye por las operaciones de unión, intersección y diferencia de conjuntos.
La operación de proyección se distribuye por la
operación unión.
ELECCIÓN DE LOS PLANES DE EVALUACIÓN
Interacción de las técnicas: de evaluación Una manera de escoger un plan de evaluación para una expresión de consulta es sencillamente escoger para cada operación el algoritmo más económico para evaluarla
Optimización basada en el coste: Los optimizadores basados en el coste generan una gama de planes de evaluación a partir de la consulta dada empleando las reglas de equivalencia y escogen el de coste mínimo
Optimización heurística: Un inconveniente de la optimización basada en el coste es el coste de la propia optimización. Aunque el coste del procesamiento de las consultas puede reducirse mediante optimizaciones inteligentes, la optimización basada en el coste sigue resultando costosa
VISTAS MATERIALIZADAS
Cuando se define una vista, normalmente la base de datos sólo almacena la consulta que define la vista.
Por el contrario, una vista materializada es una vista cuyo contenido se calcula y se almacena.
Las vistas materializadas constituyen datos redundantes, en el sentido de que su contenido puede deducirse de la definición de la vista y del resto del contenido de la base de datos