Please enable JavaScript.
Coggle requires JavaScript to display documents.
Anotacje genomów eukariotycznych - Coggle Diagram
Anotacje genomów eukariotycznych
manualna
gen po genie
wolna
wymaga dobrego asemblingu
elastyczna
wykorzystuje publikacje
automatyczna
cały genom na raz
szybka
wystarczy średniej jakości asembling
mało elastyczna ale spójna
wykorzystuje tylko bazy danych
strukturalna
metody bioinformatyczne
funkcjonalna
metody laboratoryjne
wyzwania: tysiące skafoldów, czasem egzotyczne organizmy, mało informacji poza asemblingiem, łączenie anotacji z różnych labów
standardy asemblingu
sekwencjonowanie proste i tanie
składanie trudne
dużo genomów słabej jakości
potrzeba standarów
czy asembling jest wystarczająco dobry do anotacji
N50
średnia wielkość i liczba przerw w skafoldzie
asembling o N50 w okolicach mediany długości genu jest wystarczający dla anotacji
fazy anotacji: oblliczeniowa, właściwa, potoki
obliczeniowa: EST, białka; predykcja genów abinito i oparta na zewnętrznych danych
faza wł. anotacji: synteza danych z fazy I w anotacje
predykcja czyli wyprodukowanie najbardziej prawdop.
predykcja pomija egzony i alternatywne składanie - izoformy genu
anotacja wykorzystuje informacje o predykcji
faza obliczeniowa
maskowanie powtórzeń jest niezbędne
formy annotacji
GenBank
GFF3
GTF
EMBL
powinniśmy używać standardowego formatu
GMOD - narzędzia i standardy opisu, wizualizacji i redystrybucji anotacji genomu, oparte na GFF3
wizualizacja anotacji w sekwencji FASTA
BUSCO
ocena kompletności asemblingu i anotacji na podstawie oczekiwanych genów
% genów z BUSCO to prosta miara oceny kompletności asemblingu i anotacji
Benchmarking Universal Single-Copy Orthologs
konserwatywna syntenia
kariotyp zmienia się szybko
syntenia człowiek-mysz
bloki genomu rzędu setek kb-kilku mb są bardzo dobrze zakonserwowane (syntenia)
alignment całych genomów
sekwencja ulega dywergencji
duża część genomu niealignowalna, czas dywergencji przekracza parę milionów lat
alignment całych genomów
bardziej złożony od alignmentu poszczególnych genów
człowiek-mysz
bloki genów na różnych chromosomach
na poziomie 40% genomu człowieka alignuje się z genomem myszy
24% to efekt transpozycji w linii wiodącej do człowieka - nowopowstałe sekwencje
36% genomu człowieka - trudno powiedzieć
33% genomu myszy to powtórzenia specyficzne dla gryzoni
strategia: znajdź podobne segmenty, zrón alignment w obrębie segm. i połącz je ze sobą
alignment - metody
GERP
phyloP
mobilom
bakteriofagi
plazmidy
geny powiązane z bakteriofagami, plazmidami i elementami ruchomymi
elementy ruchome