Fundamentos de doenças infecciosas
para bioinformática
deyvid.amgarten@einstein.br

Sequenciamento

Genômica

bactérias

Possui cromossomo e segmentos menores chamados plasmídeos (esses últimos podem ser compartilhados - principal motivo para resistência).

  • maioria do genoma é codificável (sem splicing) e há elementos móveis também.

vírus

  • Há genoma de DNA, RNA, simples ou dupla-fita.
  • Há 7 classes dependendo de como o vírus gera RNAm.
    Sequenciamento de genoma viral:
  • É possível comparar cepas por filogenia e descobrir quem pegou vírus de quem

Sequenciamento de genoma de bactérias.

  • Útil para discernir culturas cuja espécies não foram detectadas por métodos convencionais. É possível saber genes de resistência da bactéria, também.
  • Análise de clonalidade: bactérias clonais entre diferentes pacientes suspeita-se de surto hospitalar.

Metagenômica

Aplicação

  • Estuda material genético recuperado do ambiente e sem isolar cepas ou tipos celulares.
  • Fezes, solos, rios, swab de pele, parede de UTI, mucosas.
  • Possível devido sequenciamento massivo (NGS).
  • Estuda vários organismos simultaneamente presente em uma amostra ambiental (termo genérico).

bactérias

  • A metagenômica mais simples, analisa sequenciamento de porção do genôma 16S (que todas bactérias tem) e avalia as mutações. É possível detectar as bactérias e em quais proporções do intestino, por exemplo.
  • É possível usar microbioma para triagem de endotoxinas em amostras para transplante de feses.

exames

  • Viroma (sequencia o RNA total de uma amostra), filtragem de vírus.
  • DNA mitocondrial e ribossomal humano precisa ser removido se amostra for de humano.
  • Útil no monitoramento de vírus emergentes.

click to edit

banco de dados

tipos de armazenagem:

  • genoma completo
  • genes específicos
  • metagenomas
  • genes que marcam filogenia

tipos de curadoria:

  • sem curadoria (apenas depósito)
  • curadoria automática (dados checados por pipelines)
  • curadoria manual

acesso:

  • público (o mais recomendado para análise)
  • privado (requer cuidado com as métricas)

click to edit

Exemplos

NCBI

Há um script do NCBI no github:

  • permite baixar os genomas de referência de diferentes microrganismos, incluindo parâmetros desejados para cada busca.

Atividades

BLAST - realiza alinhamento local de sequencias com banco de dados; mostra o grau de similaridade da sequência com banco de dados.

Genome taxonomy database

Conhecido para arqueia e bactérias

Termos técnicos:

  • metagenômica shotgun: leitura de TODOS os genomas de amostra ambiental, sem cultivar. (gera vários fragmentos de todos os microrganismos presente nas amostras).
  • metagenômica amplicon: leitura de fragmentos específicos dos microrganismos presentes nas amostras ambientais de forma direcionada, p.ex. amplificando apenas gene 16s de ribossomos.

Silva

Muito usado para sequencias de 16s

unit

Muito usado para análise de fungo

CARD

Alta curadoria para interpretar sequências que podem ser resistências à antimicrobianos.

GISAID

Viral

Eggnog-mapper

ferramenta que consulta numa única busca diversos bancos de dados.

Análise da microbiota

Metagenôma

  • método shotgun: é mais caro pois necessita de muita cobertura e há sequências do hospedeiro que precisam ser removidas para as análises;

Não é necessário cultivar a amostra

Método Amplicon


  • método amplicon 16s para bactérias ou its para fungos funciona bem para identificar qual a espécie da bactéria (na verdade, não é metagenômica pois não se obtem dados do genoma dos microrganismos, apenas sequências específicas do genoma. É a metataxonomia

Subunidade 16s do ribossomo:

  • marcador filogenético de bactérias

Microbioma intestinal

Material primário é fezes. Após sequenciar:

  1. É feita análise de qualidade.
  2. Limpeza (corta sequencias pequenas, remove sequencias com qualidade ruim).
  3. Classificação da taxonomia.
  4. Laudo

qza - arquivo de análise do qiime
qzv - arquivo de visualização do qiime

Greengene - usado para análise de sequências de 16s, porém parou de ser atualizado em 2012. Melhor é o silva

Alfa diversidade: diversidade interna da amostra
Beta diversidade: comparação da diversidade com um coorte (chao01 e shenon)

Valores de referência

click to edit

Metatranscriptômica (viroma) - (é um sequenciamento de RNA total depletado [isto é, com mRNA humano removido]


obs: patógenos DNA podem ser identificados por meio dos RNAs mensageiros

pipeline de bioinformática

etapas

Demultiplexação
Limpeza de reads com baixa qualidade
mapeamento com genoma do hospedeiro que originou amostra ( e remoção de sequencia)
identificação taxonômica (compara sequências restantes com banco de sequencias de patógenos): Kraken2, bracken, clark, diamond
identificação do patógeno pelo analista.
Validação do resultado

  • baixar fastq da amostra
  • baixar banco de taxonomia
  • baixar genoma de referência (hmano)
  • cortar as extremidades da sequencia