ANALISI DI COMUNITA' MICROBICHE

DESCRIVERE LA STRUTTURA DI UNA COMUNITA' MICROBICA

(1)

  • da livello cellulare: abbiamo singolo microrganismo
  • salgo di livello ed invidio un gruppo di organismi della stessa popolazione => popolazione: un gruppo di microrganismi con le medesime caratteristiche
  • un gruppo di popolazioni nello stesso habitat e ambiente si chiama comunità microbica
  • analisi delle comunità è più complessa rispetto ai singoli organismi, o meglio rispetto alle colture pure: gruppo clonale identici (antenato comune)
  • obiettivi nella descrizione di una comunità microbica:





(2)
obbiettivi della descrizione di una comunità microbica

(1)
descrivere la struttura di una comunità: rapporti proporzionali o abbondanza relativa (che una derminata popolazione sia il 10, 20 % di una determinata comunità)

(2)
individuare e quantificare le attività della comunità: indipendente dalla definizione tassonomica, ho funzioni metaboliche non collegate a specifiche popolazioni

(3)
assegnare funzioni e attività specifiche di popolazioni: unione dei primi due

  • esempio per comunità microbica semplificata in cui 20% cianobatteri, 10% purpurei e rimanente da Pseudomonas, così ho descritto la struttura, le capacità e funzioni le posso constatare da conoscenze pregresse dei singoli microrganismi (ex fotosintesi anossigenica per i cianobatteri), ma ci sono alcune capacità metaboliche che non sono coerentemente legate a specifiche popolazioni, come la fissazione dell'azoto. quindi su alcune attività metaboliche non è sufficiente la descrizione tassonomica per definire in maniera completa le capacità metaboliche della comunità e ancora di più assegnare una attività microbica ad una determinata popolazione

(4)

  • isolare e caratterizzare i microrganismi della comunità: approccio vecchio in quanto si basa sulla coltivazione, ma nella maggior parte dei casi i microrganismi di un determinato ambiente e di interesse chimico non tutti sono coltivabili, per ambienti estremi la percentuale coltivabile è estremamente ridotta (0,1%). Quindi quanto li coltiviamo in realtà è la parte minima

(3)
=> per un analisi completa della struttura l'approccio di coltivazione è limitante, anche se ha i suoi vantaggi in quanto per quelli coltivabili posso fare un analisi completa, ma è limitato per il numenro di organismi, quindi la maggior parte degli studi non in colonia

  • motivi per cui non riesco a coltivare un microrganismo:
    • per le necessità di nutrienti
    • alcuni vivono in condizioni metaboliche molto rallentate, ossia sono vitali ma non coltivabili, cioè non crescono a meno che non trovo lo stimolo necessario per la crescita
    • quindi uso tecniche non a crescita microbica e sono due categorie: ottiche (microscopia e spettometria di flusso) e quelle basate sull'analisi molecolare che danno informazioni su struttura e funzioni della comunità microbica: acidi nucleici e acidi grassi di memrbana sono abbastanza caratterizzanti delle lezioni)

SEQUENZIAMENTO

(1)
descrivere la struttura di una comunità microbica con acidi nucleici

(2)
tecniche di sequenziamento

(4)
second generation sequence

  • sequenziamento ad alta progressività o parallelo
  • tecniche che sono in grado di sequenziare frammenti ≠ in un numero immenso di sequenze a partire da un campione misto contemporaneamente
  • si basa sulle nanotecnologie: frammenti hanno sequenze diverse a cui vengon attaccati all'esterno degli adattatori: piccole sequenze di DNA tutte uguali che vengono depositati su piastre che hanno frammenti di DNA complementari a quelli aggiunti
  • si ha spaziatura a livello micrometrico sulla piastra e ciascun frammento da luogo ad una minuscola PCR, dando origine ad una colonia di sequenze
  • faccio sequenziamento singolo al Sanger, ho ≠ segnali luminosi che vengono recepiti in punti diversi, quindi un segnale è specifico per una sequenza
  • quindi evito il step di clonaggio, e posso sequenziare contemporaneamente e abbassa anche il costo di sequenziamento
  • applicabile anche al sequenziamento di interi genomi (no shotgun), nel 2007 crollo dei costi del sequenziamento del genoma umano e anche l'ambito di analisi è cresciuto (sequenze molte più basi)

(1)

  • se estraggo DNA di una coltura pura, i frammenti sono di un unico organismo, se estraggo da una comunità ho DNA mischiato di più organismi
  • nel momento in cui faccio PCR in entrambi i casi uso dei primer che sono specifici di un batterio, quindi ottengo tanti frammenti tutti uguali per lunghezza e sequenza di basi (sia nella pura che nella comunità)
  • se amplifico con primer conservati per più organismi ottengo per PCR dei frammenti che sono più o meno lunghi uguali, ma con sequenze diverse per i vari organismi (nella comunità)
  • la procedura per comunità o coltura pura è uguale nelle prime fasi (posso usare anche stessi primer nella PCR), ma la differenza è nel prodotto dell'analisi: con comunità ho più sequenze
  • fondamentale per la tecnica di sequenziamento che devo usare, perchè questi segmenti ≠ saranno tutti mischiati in una provetta, quindi devo sequenziarli in maniera diversa per ottenere le informazioni necessarie

(2)

  • tecnica di sequenziamento Sanger: tecnica classica, il cui requisito è che nella provetta devo avere frammenti di DNA tutti con la stessa sequenza, in quanto si basa sul fatto che devo avere multiple copie nella provetta perchè si mette un solo primer che è complementare alla sequenza da sequenziare, e oltre agli ingredienti necessari per la PCR inserisco due tipi di nucleotidi: normal dNTP e nucleotidi modificati che mancano del gruppo OH in posizione 3', e il gruppo OH è necessario per creare la catena, quindi se viene incorporata una base che manca dell'OH non continua la polimerizzazione
    => nel mix della PCR c'è una certa proporzione di questi due tipi di nucleotidi, quindi nel momento dell'amplificazione ottengo successivamente il primer ho delle copie di diverse lunghezze in base a dove si è inserito il nucleotide modificato quindi con elettroforesi o altre tecniche posso sapere a quale posizione è la base G, o A, o T etc.etc. quindi ottengo un sequenziameto per ciascuna delle basi modificate
  • nei nuovi seqeunziatori Sanger il sequenziamento è contemporaneo e nucleotidi terminali vengono marcati con un fluoroforo, quindi sono già marcati in maniera diversa in base all'ultima base incorporata, quindi con elettroforesi capillare ottengo un alettroferogramma con un picco liuminoso in base alla base terminale
  • se ci sono frammenti diversi ho picchi sulla stessa base diversi, quindi se voglio analizzare una coltura pura posso usare la Sanger, ma con comunità, quindi frammenti diversi, non è possibile perchè ottengo un sequenziamento sporco in cui nella stessa posizione ho più picchi (quindi no sequenza)

(3)

  • per la comunità quindi devo avere delle tecniche di separazione di frammenti con stessa lunghezza ma sequenze differenti, in quanto anche con Sanger non posso sequenziarli:
    • fino a 15 anni fa si prendeva l'amplificato (stessa lunghezza ci impedisce di separare i frammenti per via elettroforetica), con tecnica di trasformazione
    • con vettore inserisco il frammento da clonare nella provetta con tutti i frammenti, quindi ottengo dei plastidi ricombinanti
    • trasformo dei batteri (E.coli) con plasmide ricombinante, uno solo per cellula, quindi riesco a separare un frammento da un altro
    • faccio crescere l'ospite separatamente dalle altre, quindi ciascuna avrà un frammento ≠ ed ottengo colonie tutte con quel frammento
    • problema di questa tecnica consiste per l'analisi microbiologica è che ottengo migliaia di specie microbiche, quindi l'analisi per dare informazioni complete deve essere in grado di fornire migliaia di cloni differenti, quindi grosso problema applicativo ed economico (se ho popolazioni rare devo pure fare più amplificazioni)
      => analisi non era in grado di dare un informazione completa della diversità microbica perchè descriveva solo le più abbondanti della coltura

(1)

  • gene marcatore è quello 16S RNA
    procedura sperimentale-passaggi operativi con sequenziamento gene:
  • estraggo DNA dal campione ambientale:
    • estraggo DNA degli organismi di un campione, in maniera indistinta in quanto non riconosco gli organismi
    • uso metodi diretti con lisi cellulare della memrbana e pareti su cellule che sono ancora nella matrice ambientale, hanno una resa maggiore perchè lisi di tutti gli organismi, ma anche i contaminanti
    • uso metodi indiretti che distaccano le cellule, ma la resa minore perchè non posso staccarle tutte, anche se così non abbiamo più sostanze inquinanti
      • ad oggi si usano maggiormente i metodi diretti
  • amplificazione per PCR di un frammento del gene 16S RNA, e usando PCR devo usare primer che si appaiano in maniera specifica alle sequenze da analizzare e amplificare, quindi con un DNA misto devo avere dei primer conservati in tutte le sequenze possibili del campione (≠ da analisi di un gene 16S di un organismo singolo)

(2)
sequenze formato fastq

(1)

  • file di sequenze di testo che contengono le informazioni di sequenziamento
  • il formato è di 4 righe per ciascuna sequenza:
    • prima riga: indicatore alfa-numerico per la singola sequenza
    • seconda riga: sequenza
    • terza riga: +
    • quarta riga: altra stringa alfa-numerica che individua la qualità della sequenza, quindi c'è una corrispondenza fra la prima e quarta riga
  • posso avere sequenze fino a 350 basi
  • si basa sulle tabelle ASII in cui ci sono corrispondenze fra caratteri alfa-numerici a numeri/simboli, quindi faccio confronto fra basi ed ottengo un numero AS, a cui devo sottrarre 64 = Q (Quality score) = -10logP (probabilità)

(2)
successivamente alla sequenza posso definire la tassonomia, quindi identificare

  • due approcci:
    • classifico ogni sequenza lavorando per similarità (da range di dominio a specie)
    • raggruppo le sequenze in base alla distanza = UNITA' TASSONOMICHE OPERATIVE OTU
  • con il primo metodo ottengo una tabella contenente l'abbondanza di ciascun ordine di ciascun campione, ma ciò porta a molte sequenze non classificate se non fino al livello di ordine
    => metodo più efficiente OTU

(3)
OTU

  • descrizione degli ordini in base alla distanza genetica fra le sequenze
  • la prima sequenza più abbondante la faccio diventare sequenza OTU uno, quindi prendo una seconda
  • se ho un identità della seconda al 97% corrispondente alla OTU 1 allora la classifico con OTU 1, se terza sequenza ha identità inferiore allora la considero OTU2, e così via per tutte le sequenze, fino ad ottenere raggruppamenti di sequenze ciascun dei quali con un determinato numero di sequenze
  • quindi ho la classificazione in tabella per numero di sequenz e per OTU, e per la sequenza di ciascuna uso classificatore RPB per avere la sequenza rappresentativa
  • quindi abbiamo ottenuto la tabella in base all'abbondanza

successivamente alla tabella di abbondanza OTU

  • posso avere un approccio puramente descrittivo (dico quali popolazioni sono presenti a seconda delle OTU)
  • approccio quantitativo per descrivere i rapporti di diversità fra le comunità microbiche: alfa-ß diversità, sono applicabili anche all'analisi delle comunità microbiche
  • quindi dico quanto una comunità è simile o dissimile ad un'altra comunità

alfa-comunità

  • contiene due concetti: ricchezza e eveness (distribuzione delle abbondanze)
  • ricchezza: ricchezza delle speci, ossia quante diverse specie ho in un determinato ambiente
  • eveness: distribuzione dell'abbondanza, se ho tante specie ma ne ho una molto predominante e le altre poco diffuse ho poca eveness, calcolata con indici che possono essere più o meno specifici (ex. Sheldon)
  • è necessario esplicare degli indici di ricchezza per vari motivi, esempio
    • biomedico:
      • infezione batterica (di qualsiasi tipo) che possiede già una propria popolazione microbica con la propria ricchezza e eveness
      • con infezione la ricchezza di specie propria diminuisce per competizione e ancora di più la eveness acambierà sbilanciandosi verso il patogeno, facendo diventare la comunità microbica orginale molto poco even
      • per andamento dell'infezione e del recupero uso questi indici
  • ambientale:
    • con contaminazione da sostanza tossica, o suolo posso avere drasticamente ridotta la ricchezza ed un aumento della disomogeneità perchè alcune popolazioni vengono positivamente selezionate ed altre negativamente per l'adattamento alla sostanza inquinante
  • essendo la diversità microbica così alta, in funzione di quante sequenze produciamo non è detto che si riescano a cogliere tutte le OTU
  • grafico curva di rarefazione che da l'andamento del campione:
    • x=numero di sequenze ottenute e y=numero OTU,
    • la curva si appiattisce al' ∞ nel momento in cui per ogni sequenza ho una OTU,
    • il piatto corrisponde alla ricchezza vera, ma non avendo un numero ∞ di sequenze la differenza fra la ricchezza osservata e la ricchezza vera può differire di molto

beta diversità

  • definisco l'andamento di non solo il singolo campione, ma anche posso fare confronto fra comunità microbiche uguali o meno fra due campioni
  • analizzo la similarità delle comunità con presenza-assenza delle OTU e anche con abbondanza
  • indice di Jaccard:
    • date due comunità A e B, di cui sono note le OTU
    • verifico se una delle due è assente o presente e ottengo l'indice
    • indice ha al numeratore il numero di OTU condivise e sotto la somma delle OTU separate e sottratto il numero di OTU comuni
  • indice di simililarità di Bray-Curtis sono relativi all'abbondanza
  • vi sono anche indicatori che non solo si basano su abbondanza delle OTu ma anche quanto sono simili filogeneticamente:
    • le OTU fra di loro: date due comunità microbiche che hanno stessa distanza ß perchè hanno popolazioni ≠ ma in parte sovrapposte, le OTU filogeneticamente si assomigliano molto
    • viceversa se comunità filogeneticamente sono ≠ e uno stesso indicatore beta, le due comunità sono ≠ ma popolazioni uguali allora sono più simili fra loro
    • fanno pesare di più la distanza filogenetica, in quanto se nelle due popolazioni simili la stima della beta diversità diminuisce
      => a livello di comunità se sono più differenti per la filogenetica sono più diverse le stesse comunità

QUANTIFICARE I MICRORGANISMI TOTALI E SPECIFICHE POPOLAZIONI

(1)

  • numero di sequenze di una popolazione è un'abbondanza relativa in quanto non dice quanto ce ne sia effettivamente, bensì quanto ne sono riuscito a sequenziare
  • cio che interessa però è l'abbondanza assoluta, quindi il numero di organismi nell'ambiente/organismi
  • varie tecniche per l'abbondanza assoluta:
    • FISH
    • quantitative real time PCR

FISH

  • marco una sonda con il dna ribosomale che sia complementare al 16S o altro con clorofloro
  • queste ibridano solo le molecole di ribosomi con sequenza complementare della sequenza sonda
  • le sonde sono differenti in base a ordini, specie etc. batteriche
  • vantaggi e svantaggi:
    • metodo di quantificazione che non prevede la coltivazione e definisce precisamente la distribuzione spaziale e la quantità dei microrganismi su base filogenetica e tassonomica
    • posso fare anche conta al microscopio, ma non dicono di quale tipo sia
    • tecnica non distruttiva, che ci dice anche come sono distribuiti e vedo associazioni specifiche fra organismi (ex metanogeni e solfato riduttori)
    • è una tecnica che si basa sull'attività della cellula, quindi una cellula con metabolismo basso non viene visualizzata perchè non ha ribosomi
    • funziona male in campioni di suolo in cui la matrice è scura e assorbe le sonde (quindi meglio per biofilm e acque)
    • tecnicamente è una procedura facile

quantitative real time PCR

  • tecnica usata anche per biologia molecolare, usata e applicata in microbiologia di comunità
  • segue l'andamento dell'amplificazione dei cicli di PCR, fino ad un ciclo soglia in corrispondenza del quale il segnale associato alle copie segnale supera un threshold di base
  • si è verificato che il ciclo soglia è inversamente proporzionale alla quantità di copie iniziali di frammento genico che viene amplificato, quindi se tanti siti target il ciclo critico è basso, viceversa se il numero di copie diminuisce aumenta il ciclo soglia
  • come seguo l'andamento? nei normali PCR non vi sono delle modalità, ma uso dei composti luminosi che reagiscono durante PCR che quindi ne visualizzano l'andamento
  • quantifichiamo in base al gene uno specifico gruppo di batteri che si assomigliano dal punto di vista funzionale

esempio applicativa FISH:

  • individuo microrganismi attivi e la domanda scientifica fosse perchè nel nord Irlanda ci fossero alte quantità di microrganismi aerofiti termofili paragonabili ai mesofili, quando la temperatura non ave va mai raggiunto i 25°
  • venne scelta la Fish per verificare che non fossero attivi oppure lo fossero nei suoli a temperature ambientali
  • quindi si dovevano individuare i microrganismi attivi: in un caso il suolo è stato analizzato in quel modo e in un altro venne aggiunto uno dei terribili della zona, vennero messi in un range di temperatura da 4 a 60 gradi per 15 giorni e vennero usate due sonde ≠, una verde per i batteri non termofili e una ≠ per il termofilo
  • nel suolo con termofilo solo una piccola parte mostrava la presenza dei microrganismi attivi se non a 60 gradi, quindi il fatto che fossero così presenti per trasporto esterno
  • SYBR Green detection: colorante sybr green fluorescente che si vede con DNA a doppio filamento, quindi al termine della fase di estensione della PCR esso si lega ed emette fluorescenza, quindi maggiore è il numero di filamenti legati maggiore è la fosforescenza, rilevata da sensori sul termocliclatore, sonda aspecifica
  • amplificazione con sonda specifica:
    • il frammento del DNA deve essere uguale alla regione interna da amplificare in modo tale da avere una sonda che si appai al filamento, quindi devo conoscere anche le terminazioni del segmento per i primer, oltre ad un quencher che è una molecola che impedisce la fosforescenza della sonda quando non è legata al filamento
    • nella fase di annealing si appaieranno sia la sonda che la parte centrale e durante la fase di estensione la polimeri rimuove la sonda interna e quindi stacca sonda e quencher che essendo separati ne porteranno la fluorescenza che è proporzionale alle sequenze amplificate nel tempo
  • la uso con primer conservati a dominio, primer anche a taxon specifico (classe e genere e specie), quindi pur non avendo un obbiettivo di sequenziamento uso dei primer con target specifici posso quantificare la presenza di tali gruppi nel campione (ambientale, clinico, industriale, ...)
  • si definisce una curva standard di calibrazione che conforma il ciclo soglia con il numero di sequenze iniziali

INDIVIDUARE/QUANTIFICARE LE ATTIVITA' DELLA COMUNITA'

  • per attività si intende sia in termini di potenzialità metaboliche sia di effettiva attività di un dato metabolismo
  • fino ad ora analisi tramite il DNA, che definisce la potenzialità di una data popolazione microbica, ma non dice se sono attive e se partecipano o meno alle funzioni ecosistemiche di una comunità e anche con PCR quantitativa noi non sappiamo se durante l'analisi è veramente attiva, in quanto l'informazione genetica può non essere utilizzata
  • quindi per determinare l'effettiva espressione delle capacità metaboliche con l'mRNA in quanto è il tramite informativo fra DNA e pp , ma ha un tempo di vita molto basso (3 min)
  • quindi mRNA da informazioni istantanee sull'attività di un microrganismo rispetto agli stimoli esterni
  • posso lavorare su esso con tutte le tecniche del DNA: sequenziamento, quantificarlo, amplificarlo e quantificarlo (anche quello funzionale, come con ammonio ossigenasi)
  • esempio nitrogenasi della fissazione azoto: geni marcatori che sono sotto un forte controllo trascrizionale in quanto è un processo che consuma molta energia, in quanto in presenza di ammonio ossidato interrompono la loro attività di fissazione dell'azoto e quindi non esprimono i geni di esso, quindi vedo se NIFH è trascritto o meno in varie condizioni, ma con DNA sarebbe sempre presente
    => descrizione tassonomiche e funzionali e relativa alla risposta metabolica rispetto all'ambiente

ASSEGNARE FUNZIONI/ATTIVITA' A SPECIFICHE POPOLAZIONI

(1)

  • stable isotope probing : metano marcato e popolazioni usano questo substrato come fonte di carbonio di energia e in particolare se sono presenti dei metanotrofi questo DNA può rientrare nel materiale genetico, quindi alcune incorporano C13 e altri incorporano C12 perchè non usano il metano
  • con speciale tecnica di centrifugazione posso separare per differenza di peso il DNA marcato da quello non marcato quindi posso estrarre selettivamente il DNA marcatore e posso con le tecniche già descritte distinguo le popolazioni attive in metanotrofia e quelle che non posseggono questo metabolismo

(2)
metanogenomica

  • tecnica del 2004-2005
  • approccio di sequenziamento ≠ in quanto non si limita a sequenziare una piccola regione genica amplificata bensì è una tecnica che sequenza tutto il DNA della comunità microbica iniziale
  • sequenziamento non mediato da PCR, quindi non limita analisi ad un solo gene, ma tutti i geni (meta: comunità)
  • inferisce qualcosa per le sue potenzialità metaboliche rispetto al complesso
  • shotgun seqeuncing vs 16S RNA: da' una visione ridotta di sequenziamento in quanto determina il genoma intero ma solo di una parte ridotta della comunità microbica, quindi ridotta in termini di analisi quantitativi, ma non qualitativi in cui la resa è maggiore con questo secondo metodo
  • esempio mar dei sargassi e genomi microbici dei reflui di miniere: determino in maniera accurata le caratteristiche di popolazioni microbiche con pochi tipi di organismi (ho intero riconoscimento di microrganismi a partire da un metagenoma)
  • tecniche di analisi:
    • full shotgun metagenoma
    • full shotgun metatranscrittoma
    • marker gene metagenoma
    • marker gene metatranscrittoma