Please enable JavaScript.
Coggle requires JavaScript to display documents.
ALINEAMIENTOS DE PARES DE SECUENCIAS, sequence_tree (1), TEMA 4 EJERCICIO…
ALINEAMIENTOS DE PARES DE SECUENCIAS
Alineamiento de pares de secuencias
Es un primer paso hacia el análisis estructural y funcional de nuevas secuencias descubiertas.
La comparación de secuencias se puede decir que es una de las actividades fundamentales en el análisis bioinformático.
El proceso fundamental detrás de este tipo de comparación es el alineamiento de secuencias.
Segun que pasa el tiempo y nuevas secuencias estan siendo generadas a tasa exponenciales, la importgancia de la comparacion de secuencias ha aumentado considerablemente.
Alineamiento de secuencias como problema de optimización
Función Objetivo
Matrices de Sustitución
Dos nucleótidos pueden o ser iguales o diferentes, pero en el caso de los aminoácidos la situación es más compleja.
En estas matrices se comparan todos los aminoácidos con todos los demás.
PAM (Mutación puntual aceptada)
Las matrices PAM se utilizan a veces como matrices de sustitución para puntuar alineaciones de secuencias de proteínas.
BLOSUM (Matriz de sustitución de bloques)
Están preparadas a partir de alineamientos de regiones conservadas de proteínas llamadas bloques.
A cada comparación se le da una puntuación que indica como es de frecuente que un aminoácido sea sustituido por otro en proteínas homólogas.
Penalidades por Brechas
Sirven para indicar al algoritmo si queremos favorecer la aparición de gaps en el alineamiento o no.
Normalmente se pueden modificar dos gap penalties, el de creación de un nuevo gap y el de extensión del gap.
Si se ponen unos gap penalties muy altos no aparecerán gaps en el alineamiento, si son muy bajos aparecerán demasiados.
Es una buena idea utilizar los valores por defecto a no ser que tengamos alguna razón para cambiarlos.
Es una forma de representar y comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones funcionales o evolutivas entre los genes o proteínas consultados.
Es una serie de elementos encadenados uno detrás de otros, por eso hablamos de secuencias de nucleótidos y de aminoácidos.
3. Alineamiento Semigloval:
Se produce entre el final de una secuencia y el inicio de otra.
2. Alineamiento Local:
Se limita a una region concreta de la secuencia.
1. Alineaminto Gloval:
Se extiende por toda la longitud de la secuencia.
Algoritmos de Alineamiento
Algoritmo Global
Los alineamientos globales, que intentan alinear cada residuo de cada secuencia, son más útiles cuando las secuencias problema iniciales son similares y aproximadamente del mismo tamaño.
Una estrategia general de alineamiento global es el algoritmo Needleman-Wunsch basado en programación dinámica.
Son más útiles para secuencias diferenciadas en las que se sospecha que existen regiones muy similares o motivos de secuencias similares dentro de un contexto mayor.
Intentará forzar a la alineación a extenderse más allá de la región de solapamiento, mientras que el alineamiento local no cubrirá totalmente la región solapada
Algoritmo Local
Sólo se alinean la partes más parecidas
de la secuencia
Favorece encontrar patrones similares dentro de la secuencia
Un alineamiento local es una combinación de muchos
alineamientos globales de secuencias cortas.
Alineamiento Local con penalización Affine de los Espacios
Útil con secuencias de distinto tamaño pero que se espera que tengan regiones comunes
Los algoritmos tienen un coste computacional más alto.
Hace múltiples alineamientos globales sobre subsecuencias
Procedimientos de comparación entre dos secuencias mediante alineamientos óptimos
Alineamientos visuales
es un gráfico que permite comparar dos secuencias biológicas e identificar regiones de identidad o similitudes entre ellas :
Sirve para descubrir repeticiones, inserciones, deleciones (largas).
El Dot-Plot permite comparar diferentes secuencias para saber dónde están los intrones y exones por ejemplo, pero también pueden detectar regiones repetidas en una misma secuencia
Utilidades del Dot-Plot
Comparar secuencias muy grandes de DNA genomas completos.
Detección de inversiones, duplicaciones, inserciones den genomas completos o cromosomas
Detección de motivos en el DNA que contengan secuencias invertidas, palindrómicas o repetidas como terminadores de transcripción, telómeros
Detección de intrones y exones en una secuencia genómica eucariota
Identificación de regiones con baja complejidad informacional en una secuencia
Detección de dominios repetidos conservados en proteínas
Detección de mutaciones que desplazan el marco de lectura en una secuencia de DNA