BMR Genomics

Welcome to our NGS website

NGS

Informazioni sull’output dell’analisi Qiime [Italian]

La pipeline di analisi 16S Qiime

Le reads R1 ed R2 vengono unite con il software FLASH v1.2.11 e filtrate per qualità (Q>30). L’analisi è basata sul metodo pick_closed_reference_otus di Qiime 1.9.1 sul database GreenGenes v. 13-8. Le OTU raccolte nel file .biom vengono filtrate allo 0,005% di abbondanza (Bokulich et al., 2013) per eliminare le OTU spurie a bassa frequenza.

Le analisi di alpha-diversity (diversità intra-campione) vengono effettuate con il comando alpha_rarefaction che rarefa i campioni a diverse profondità (num. di reads) calcolandone gli indici di diversità (filogenetici e non). Il comando beta_diversity_through_plots genera le matrici di distanza e i PCoA in 3D sui campioni alla profondità di rarefazione ottimale. Il comando jackknifed_beta_diversity genera gli alberi UPGMA (clustering gerarchico tra i campioni) ed i PCoA 3D con supporto jackknife (campionamento ripetuto dei dati di ogni campione per evidenziarne la variabilità). Infine con il comando make_distance_boxplots vengono prodotti dei grafici boxplot di confronto tra le condizioni sperimentali di analisi, su cui viene effettuata una statistica t-student per testare la significatività della differenza tra i gruppi.

Le cartelle che troverete nell’output sono:

  • OTUs: contiene le otu trovate (gruppi di sequenze che rappresentano una specie batterica), la otu_table.biom, la tabella delle otu filtrata (filtered.biom) conte e albero filogenetico delle otu (.tree);

  • Heatmap.pdf: è la heatmap della tabella delle OTU in formato grafico.

  • Taxa_Summary: contiene file tabulari e grafici sulla composizione tassonomica finale di ogni campione, comprende file HTML interattivi (nella sottocartella “taxa_summary_plots”); la cartella contiene l’assegnazione tassonomica relativa a ciascun campione in formato .txt, .biom e .html (interattivo sotto forma di grafico ad area o istogramma) suddivisa per livelli tassonomici (L2=Phylum,…, L6=Genere, L7=specie);

  • AlphaRarefaction: contiene le analisi ed i grafici di rarefazione per diversi indici di alpha-diversity; al suo interno “alpha_rarefaction_plots/rarefaction_plots.html” è un file interattivo con cui visualizzare la rarefaction plot calcolata per ogni campione sulle diverse metriche di alpha-diversity;

  • BetaDiversity: contiene le analisi ed i grafici PCoA 3D dei campioni, hierarchical clustering dei campioni con alberi UPGMA, evidenziano quali sono i campioni che hanno delle comunità batteriche più simili; i file index.html contenuti nelle cartelle sono visibili tramite browser (strumento “Emperor”);

  • JakknifedBetaDiversity: simile a beta rarefaction ma con reiterazione dell’analisi per evidenziare l’affidabilità del risultato e la sua variabilità; i file index.html contenuti nelle cartelle sono visibili tramite browser (strumento “Emperor”);

  • Boxplot (Weighted, Unweighted): confronto tra gruppi di condizioni sperimentali, restituisce la significatività della differenza tra gruppi di confronto.

Altri file di interesse (dati grezzi):

  • filtered.biom e filtered.tsv: sono i file che contengono la OTU-table (dimostra la proporzione delle OTU nei campioni) in formato .biom e in formato .tsv (leggibile con programma come Blocco appunti o Excel), filtrate allo 0,005% (Bokulich et al., 2013);

  • OTUs/filtered_pruned.tre: file contenente l’albero filogenetico delle OTU (leggibile con programmi come FigTree) filtrato dalle OTU meno abbondanti dello 0,005% (l’albero originale è nella stessa cartella, rep_set.tre);

  • reads_counts.csv: conta del numero di reads per ogni campione.

Il nome delle reads e dei campioni che trovate nella cartella di output presenta in ordine: l’ID del file e la dicitura FROM seguito dall’ID del campione originale inviatoci.