BLAST (BASIC LOCAL ALIGNMENT SEARCH TOOL)

ENTRADA: QUERY / SALIDA: SUBJECT

ETAPAS ALGORITMO

  1. Listado de "palabras" con puntuación mayor a umbral (T) según matriz de sustitución

aa: 3 / nt: 11

  1. Escaneo de palabras en BBDD / Unir parejas de palabras cercanas (HSP: high scoring pair)
  1. Extensión de HSP hasta umbral con puntuación definido

ESTADISTICO DE VERACIDAD

EXPECTED VALUE (E)

Nº de alineamientos al azar con esa puntuación

menor a 0,001: resultado de buena calidad

depende de tamaño de BD y de longitud de secuencia query (mayor E)

FAMILIAS

BLASTN

nucleotidos

BLASTP

proteinas

BLASTX

nt query a proteina

el ADN se corresponde con alguna proteina?

6 posibilidades (2 sentidos / 3 marcos lectura)

tBLASTn

subject de nucleótidos a proteinas

aparece una proteina en otras especies?

tBLASTx

query y subject traducidos a proteinas

para detección de nuevos genes codificantes

alto coste computacional / tiempo

reducir resultados

usar BD refseq (evitar redundancias)

limitar organismos

limitar porción secuencia

ajuste parámetros (matriz, E,etc...)

incrementar resultados

aumentar umbral de E

cambiar a matrices PAM mayores o BLOSUM menores

añadir BBDD