Please enable JavaScript.
Coggle requires JavaScript to display documents.
Bioinformatica y genomica - Coggle Diagram
Bioinformatica y genomica
Aplicacion de herramientas computacionales y correspondiente analisis para la obtencion de interpretacion de data biologia. Area interdiciplinaria que combina ciencia de datos, amtematicas fisica y biologia
Es una cienca nueva, desarrolla nueva herramientas para explorar analizar y entender la gran cantidad de datos genomicos
Bioinf: Campo interdiciplinariocombina matematic, informatica, biologia para analizar datos genomicos
Biologia computacional: Uso de metodos matematicos y algoritmos para resolver problemas biologicos
Mineria de datos: Extraccion de patrones utiles a partir de grandes conjutnos de datos
Importancia de bioinformatica: poder comprender enfermedades complejas ygestionar grande bases de datos biologicos
Tiene muchos datos disponibles como:
secuencias de ADN/ARN, proteinas, estructura y funcion de proteinas, expresion genica, interaciones....
Unas bases de datos y los que contiene son:
GenBank: secuencia de ADN/ARN
UniProtKB: Secuencia de proteina
Protein Databank: estructura de la proteina
Gene Ontology: Funcion de la proteina
Gene Expression Omnibus (GEO): Expresion de los genes
dsSNP: SNPs
1 more item...
Pasos
1) Ingresar al link de genk bank y colocar la cosa q se busca (TP53)
2) Selecional RefSeq products
es una base de datos curada y no redundante de secuencias de ADN, ARN y proteínas, mantenida por el Centro Nacional para la Información Biotecnológica (NCBI)
3) hace click en FASTA
Ya entramos en GenBank
Contiene secuencias en formato GenBank
Formato de secuencias de ADN
Plain sequence format
EMBL format
FASTA format
Estes sirve para alinear la secuencia de ADN, su formato es el estandar en bioinformatica para representar secuencias de nucleotidos o peptidos
este formato utiliza codigo de una sola letra, incluye nombres secuencias y comentario, consta de descripcion inicial de una sola linea seguida de los datos de la secuencia en varias lineas
La longitud de cada segmento (línea) de la secuencia no debe superar los 80
caracteres.- Los identificadores de secuencia se definen mediante un estándar denominado NCBI
GCG format
GCG-RSF (rich sequence format)
GenBank format
IG forma
NCBI
Centro nacional de informacion biotecnologia, es una base de daots de secuecnia (EEUU) de ADN y proteinas
Cada secuencia tiene un separado como identificador unico, es su numero de acceso
Alineamiento: Compara secuencia con otras ya registradas y almacenadas en una base de datos
global (compara una secuencia completa con otra secuencia completa) o local (revelan regiones similares pero no odrece siempre una comparacion entre secuencias completas)
Clustal Omega
programa q sirve para alineamiento multiple de secuencias en bioinformatica (uno de los mas citados)
Blast
Alineamiento mas comun, intentan encontrar un fragmento corto. El frag resultante se usa como semilla para extender la alineacion, divide en longitud especifica
blastn es de nucleotidos
blastp de proteinas
blastx input es una secuencia ADN, base de proteinas
tblastn al reves del otro
tblastx secuencia y secuencia AADN