Panxenoma

En bioloxía molecular, un panxenoma (ou supraxenoma) é o complemento completo de xenes dun clado (que se aplicou orixinalmente a especies de bacterias e arqueas, pero tamén de plantas), que pode ter unha gran variación no contido de xenes entre cepas estreitamente relacionadas ou ecotipos. É, pois, a unión dos conxuntos de xenes de todas as cepas dun clado (por exemplo, unha especie).^[1] A importancia do panxenoma apréciase nun contexto evolutivo, especialmente en relación coa metaxenómica,^[2] pero tamén se usa en contextos de xenómica máis amplos.^[3] Os estudos feitos en plantas suxiren que a dinámica do panxenoma está ligada aos elementos transpoñibles.^[4]^[5]^[6]

O panxenoma comprende o "xenoma central" (core genome) que contén os xenes presentes en todos os individuos, un xenoma accesorio ou prescindible que contén xenes presentes en dúas ou máis cepas, e finalmente a nube de xenes únicos específicos dunha cepa.^[1]^[7] ^[8] Atopáronse tamén os chamados xenes centrais brandos (soft-core genes) na maioría (95%) das cepas ou ecotipos analizados, o que deixa certa marxe para erros de ensamblaxe/anotación.^[9]

Estas distincións non son completamente obxectivas, xa que dependen dos xenomas que sexan incluídos na análise. Ademais, o termo "prescindible" foi cuestionado.^[10]

Hai dous tipos xeneralizados de panxenomas, categorizados polo número de novos xenes engadidos ao panxenoma por xenoma secuenciado. As especies cun panxenoma pechado engadirían moi poucos xenes por xenoma secuenciado despois de secuenciar moitas cepas, e o tamaño do panxenoma completo podería predicirse teoricamente. As especies cun panxenoma aberto engadirían xenes dabondo por xenoma secuenciado adicional como para que predicir o tamaño do panxenoma completo sexa imposible.^[8]

Exemplos

O concepto orixinal de panxenoma foi desenvolvido por Tettelin et al.^[12] cando secuenciaron seis cepas de Streptococcus agalactiae, que podían ser descritas como un xenoma central compartido por todos os illamentos, que supoñia aproximadamente o 80% de calquera xenoma individal, mais uns xenes prescindibles consistentes en xenes específicos de cepas e parcialmente compartidos. A extrapolación suxeriu que o reservorio de xenes do panxenoma de S. agalactiae é vasto e que se continuarán identificando novos xenes únicos incluso despois de secuenciar centos de xenomas.^[12]

Un padrón similar atopouse en Streptococcus pneumoniae cando foron secuenciadas 44 cepas (ver figura). Con cada novo xenoma secuenciado descubríanse menos xenes novos. De feito, o número predito de novos xenes caía a cero cando o número de xenomas excedía de 50 (nótese, porén, que isto non é un padrón que se encontre en todas as especies). A principal fonte de novos xenes en Streptococus pneumoniae foi Streptococcus mitis desde o cal os xenes foron transferidos horizontalmente. O tamaño do panxenoma de S. pneumoniae incrementouse logaritmicamente co número de cepas e linearmente co número de sitios polimórficos dos xenomas mostreados, o que suxire que os xenes adquiridos acumúlanse proporcionalmente á idade dos clons.^[11]

Outro exemplo disto último pode verse nunha comparación de tamaños do conxunto de xenes centrais e o panxenoma de Prochlorococcus. O conxunto do xenoma central é loxicamente moito menor que o panxenoma, que utilizan diferentes ecotipos de Prochlorococcus.^[13] Un estudo de 2015 sobre a bacteria Prevotella illada de humanos, comparada cos repertorios de xenes das súas especies derivadas de diferentes sitios do corpo humano. Tamén se informou dun panxenoma aberto que presentaba unha vasta diversidade da poza xénica.^[14]

Ferramentas de software

A medida que o interese nos panxenomas se foi incrementando, fóronse desenvolvendo diversas ferramentas de software para axudar a analizar este tipo de datos. En 2015, un grupo de investigadores revisaron os diferentes tipos de análises e ferramentas das que se podía dispoñer.^[15] Desenvolvéranse sete tipos de software de análises para analizar panxenomas: agrupar xenes homólogos; identificar SNP; gráficos de perfis panxenómicos; construír as relacións filoxenéticas de xenes/familas ortólogos de cepas/illamentos; buscas baseadas na función; anotación e/ou curación; e visualizacións.^[15]

As dúas ferramentas de software máis citadas a finais de 2014^[15] eran Panseq^[16] e a pipeline de análises panxenómicos (PGAP, do inglés pan-genomes analysis pipeline).^[17] Outras opcións son BPGA – unha pipeline de análise panxenómico para xenomas procariotas,^[18] GET_HOMOLOGUES ^[19] ou Roary.^[20]

Unha revisión similar centrada nos panxenomas das plantas foi publicado tamén en 2015.^[21] O primeiro software deseñado para xenomas de plantas é GET_HOMOLOGUES-EST.^[6]

Notas

↑ ^1,0 ^1,1 Medini, Duccio; Donati, Claudio; Tettelin, Hervé; Masignani, Vega; Rappuoli, Rino (2005). "The microbial pan-genome". Current Opinion in Genetics & Development 15 (6): 589–594. PMID 16185861. doi:10.1016/j.gde.2005.09.006.
↑ Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (May 2009). "Biogeography of the Sulfolobus islandicus pan-genome". Proc. Natl. Acad. Sci. U.S.A. 106 (21): 8605–10. PMC 2689034. PMID 19435847. doi:10.1073/pnas.0808945106.
↑ Reinhardt JA, Baltrus DA, Nishimura MT, Jeck WR, Jones CD, Dangl JL (February 2009). "De novo assembly using low-coverage short read sequence data from the rice pathogen Pseudomonas syringae pv. oryzae". Genome Res. 19 (2): 294–305. PMC 2652211. PMID 19015323. doi:10.1101/gr.083311.108.
↑ Morgante M, De Paoli E, Radovic S (April 2007). "Transposable elements and the plant pan-genomes". Curr Opin Plant Biol 10 (2): 149–155. PMID 17300983. doi:10.1016/j.pbi.2007.02.001.
↑ Gordon SP, Contreras-Moreira B, Woods DP, Des Marais DL, Burgess D, Shu S, Stritt C, Roulin AC, Schackwitz W, Tyler L, Martin J, Lipzen A, Dochy N, Phillips J, Barry K, Geuten K, Budak H, Juenger TE, Amasino R, Caicedo AL, Goodstein D, Davidson P, Mur LA, Figueroa M, Freeling M, Catalan P, Vogel JP (December 2017). "Extensive gene content variation in the Brachypodium distachyon pan-genome correlates with population structure". Nature Communications 8 (1): 2184. PMC 5736591. PMID 29259172. doi:10.1038/s41467-017-02292-8.
↑ ^6,0 ^6,1 Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E, Casas AM, Vinuesa P (February 2017). "Analysis of Plant Pan-Genomes and Transcriptomes with GET_HOMOLOGUES-EST, a Clustering Solution for Sequences of the Same Species". Front. Plant Sci. 8: 184. PMC 5306281. PMID 28261241. doi:10.3389/fpls.2017.00184.
↑ Wolf YI, Makarova KS, Yutin N, Koonin EV (December 2012). "Updated clusters of orthologous genes for Archaea: a complex ancestor of the Archaea and the byways of horizontal gene transfer". Biol Direct. 7: 46. PMC 3534625. PMID 23241446. doi:10.1186/1745-6150-7-46.
↑ ^8,0 ^8,1 Vernikos, George; Medini, Duccio; Riley, David R; Tettelin, Hervé (2015). "Ten years of pan-genome analyses". Current Opinion in Microbiology 23: 148–154. doi:10.1016/j.mib.2014.11.016.
↑ Kaas RS, Friis C, Ussery DW, Aarestrup FM (October 2012). "Estimating variation within the genes and inferring the phylogeny of 186 sequenced diverse Escherichia coli genomes". BMC Genomics 13: 577. PMC 3575317. PMID 23114024. doi:10.1186/1471-2164-13-577.
↑ Marroni F, Pinosio S, Morgante M (April 2014). "Structural variation and genome complexity: is dispensable really dispensable?". Curr Opin Plant Biol 18: 31–36. doi:10.1016/j.pbi.2014.01.003.
↑ ^11,0 ^11,1 Donati, C; Hiller, N. L.; Tettelin, H; Muzzi, A; Croucher, N. J.; Angiuoli, S. V.; Oggioni, M; Dunning Hotopp, J. C.; Hu, F. Z.; Riley, D. R.; Covacci, A; Mitchell, T. J.; Bentley, S. D.; Kilian, M; Ehrlich, G. D.; Rappuoli, R; Moxon, E. R.; Masignani, V (2010). "Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species". Genome Biology 11 (10): R107. PMC 3218663. PMID 21034474. doi:10.1186/gb-2010-11-10-r107.
↑ ^12,0 ^12,1 Tettelin, H; Masignani, V; Cieslewicz, M. J.; Donati, C; Medini, D; Ward, N. L.; Angiuoli, S. V.; Crabtree, J; Jones, A. L.; Durkin, A. S.; Deboy, R. T.; Davidsen, T. M.; Mora, M; Scarselli, M; Margarit y Ros, I; Peterson, J. D.; Hauser, C. R.; Sundaram, J. P.; Nelson, W. C.; Madupu, R; Brinkac, L. M.; Dodson, R. J.; Rosovitz, M. J.; Sullivan, S. A.; Daugherty, S. C.; Haft, D. H.; Selengut, J; Gwinn, M. L.; Zhou, L; et al. (2005). "Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: Implications for the microbial "pan-genome"". Proceedings of the National Academy of Sciences 102 (39): 13950–5. PMC 1216834. PMID 16172379. doi:10.1073/pnas.0506758102.
↑ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S, Chen F, Lapidus A, Ferriera S, Johnson J, Steglich C, Church GM, Richardson P, Chisholm SW (2007). "Patterns and Implications of Gene Gain and Loss in the Evolution of Prochlorococcus". PLoS Genetics 3 (12): e231. ISSN 1553-7390. PMC 2151091. PMID 18159947. doi:10.1371/journal.pgen.0030231.
↑ Gupta VK, Chaudhari NM, Dutta C (2015). "Divergences in gene repertoire among the reference Prevotella genomes derived from distinct body sites of human". BMC Genomics 16 (153). PMC 4359502. PMID 25887946. doi:10.1186/s12864-015-1350-6.
↑ ^15,0 ^15,1 ^15,2 Xiao, Jingfa; Zhang, Zhewen; Wu, Jiayan; Yu, Jun (23 February 2015). "A brief review of software tools for pangenomics". Genomics, Proteomics & Bioinformatics 13 (1): 73–76. doi:10.1016/j.gpb.2015.01.007. Consultado o 2017-01-28.
↑ Laing, Chad; Buchanan, Cody; Taboada, Eduardo; Zhang, Yongxiang; Kropinski, Andrew; Villegas, Andrea; Thomas, James; Gannon, Victor (15 September 2010). "Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions". BMC Bioinformatics 11 (1): 461. doi:10.1186/1471-2105-11-461. Consultado o 2017-01-28.
↑ Zhao, Yongbing; Wu, Jiayan; Yang, Junhui; Sun, Shixiang; Xiao, Jingfa; Yu, Jun (29 November 2011). "PGAP: pan-genomes analysis pipeline". Bioinformatics 28 (3): 416–418. doi:10.1093/bioinformatics/btr655. Consultado o 2017-01-28.
↑ Chaudhari NM, Gupta VK, Dutta C (2016). "BPGA- an ultra-fast pan-genome analysis pipeline". Scientific Reports 6 (24373). PMC 4829868. PMID 27071527. doi:10.1038/srep24373.
↑ Contreras-Moreira B, Vinuesa P (October 2013). "GET_HOMOLOGUES, a versatile software package for scalable and robust microbial pangenome analysis". Appl Environ Microbiol 79 (24): 7696–701. PMC 3837814. PMID 24096415. doi:10.1128/AEM.02411-13.
↑ Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT, Fookes M, Falush D, Keane JA, Parkhill J (July 2015). "Roary: rapid large-scale prokaryote pan genome analysis". Bioinformatics 31 (22): 3691–3693. PMC 4817141. PMID 26198102. doi:10.1093/bioinformatics/btv421.
↑ Golicz AA, Batley J, Edwards D (November 2015). "Towards plant pangenomics". Plant Biotechnol J. 14 (4): 1099–1105. PMID 26593040. doi:10.1111/pbi.12499.

Véxase tamén

Outros artigos

Cuasiespecies

[medini2005-1] 1,0 ^1,1 Medini, Duccio; Donati, Claudio; Tettelin, Hervé; Masignani, Vega; Rappuoli, Rino (2005). "The microbial pan-genome". Current Opinion in Genetics & Development 15 (6): 589–594. PMID 16185861. doi:10.1016/j.gde.2005.09.006.

[2] Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (May 2009). "Biogeography of the Sulfolobus islandicus pan-genome". Proc. Natl. Acad. Sci. U.S.A. 106 (21): 8605–10. PMC 2689034. PMID 19435847. doi:10.1073/pnas.0808945106.

[3] Reinhardt JA, Baltrus DA, Nishimura MT, Jeck WR, Jones CD, Dangl JL (February 2009). "De novo assembly using low-coverage short read sequence data from the rice pathogen Pseudomonas syringae pv. oryzae". Genome Res. 19 (2): 294–305. PMC 2652211. PMID 19015323. doi:10.1101/gr.083311.108.

[4] Morgante M, De Paoli E, Radovic S (April 2007). "Transposable elements and the plant pan-genomes". Curr Opin Plant Biol 10 (2): 149–155. PMID 17300983. doi:10.1016/j.pbi.2007.02.001.

[5] Gordon SP, Contreras-Moreira B, Woods DP, Des Marais DL, Burgess D, Shu S, Stritt C, Roulin AC, Schackwitz W, Tyler L, Martin J, Lipzen A, Dochy N, Phillips J, Barry K, Geuten K, Budak H, Juenger TE, Amasino R, Caicedo AL, Goodstein D, Davidson P, Mur LA, Figueroa M, Freeling M, Catalan P, Vogel JP (December 2017). "Extensive gene content variation in the Brachypodium distachyon pan-genome correlates with population structure". Nature Communications 8 (1): 2184. PMC 5736591. PMID 29259172. doi:10.1038/s41467-017-02292-8.

[contrerasmoreira2017-6] 6,0 ^6,1 Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E, Casas AM, Vinuesa P (February 2017). "Analysis of Plant Pan-Genomes and Transcriptomes with GET_HOMOLOGUES-EST, a Clustering Solution for Sequences of the Same Species". Front. Plant Sci. 8: 184. PMC 5306281. PMID 28261241. doi:10.3389/fpls.2017.00184.

[7] Wolf YI, Makarova KS, Yutin N, Koonin EV (December 2012). "Updated clusters of orthologous genes for Archaea: a complex ancestor of the Archaea and the byways of horizontal gene transfer". Biol Direct. 7: 46. PMC 3534625. PMID 23241446. doi:10.1186/1745-6150-7-46.

[vernikos2014-8] 8,0 ^8,1 Vernikos, George; Medini, Duccio; Riley, David R; Tettelin, Hervé (2015). "Ten years of pan-genome analyses". Current Opinion in Microbiology 23: 148–154. doi:10.1016/j.mib.2014.11.016.

[9] Kaas RS, Friis C, Ussery DW, Aarestrup FM (October 2012). "Estimating variation within the genes and inferring the phylogeny of 186 sequenced diverse Escherichia coli genomes". BMC Genomics 13: 577. PMC 3575317. PMID 23114024. doi:10.1186/1471-2164-13-577.

[10] Marroni F, Pinosio S, Morgante M (April 2014). "Structural variation and genome complexity: is dispensable really dispensable?". Curr Opin Plant Biol 18: 31–36. doi:10.1016/j.pbi.2014.01.003.

[Donati2010-11] 11,0 ^11,1 Donati, C; Hiller, N. L.; Tettelin, H; Muzzi, A; Croucher, N. J.; Angiuoli, S. V.; Oggioni, M; Dunning Hotopp, J. C.; Hu, F. Z.; Riley, D. R.; Covacci, A; Mitchell, T. J.; Bentley, S. D.; Kilian, M; Ehrlich, G. D.; Rappuoli, R; Moxon, E. R.; Masignani, V (2010). "Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species". Genome Biology 11 (10): R107. PMC 3218663. PMID 21034474. doi:10.1186/gb-2010-11-10-r107.

[Tettelin2005-12] 12,0 ^12,1 Tettelin, H; Masignani, V; Cieslewicz, M. J.; Donati, C; Medini, D; Ward, N. L.; Angiuoli, S. V.; Crabtree, J; Jones, A. L.; Durkin, A. S.; Deboy, R. T.; Davidsen, T. M.; Mora, M; Scarselli, M; Margarit y Ros, I; Peterson, J. D.; Hauser, C. R.; Sundaram, J. P.; Nelson, W. C.; Madupu, R; Brinkac, L. M.; Dodson, R. J.; Rosovitz, M. J.; Sullivan, S. A.; Daugherty, S. C.; Haft, D. H.; Selengut, J; Gwinn, M. L.; Zhou, L; et al. (2005). "Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: Implications for the microbial "pan-genome"". Proceedings of the National Academy of Sciences 102 (39): 13950–5. PMC 1216834. PMID 16172379. doi:10.1073/pnas.0506758102.

[Kettler2007-13] Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S, Chen F, Lapidus A, Ferriera S, Johnson J, Steglich C, Church GM, Richardson P, Chisholm SW (2007). "Patterns and Implications of Gene Gain and Loss in the Evolution of Prochlorococcus". PLoS Genetics 3 (12): e231. ISSN 1553-7390. PMC 2151091. PMID 18159947. doi:10.1371/journal.pgen.0030231.

[14] Gupta VK, Chaudhari NM, Dutta C (2015). "Divergences in gene repertoire among the reference Prevotella genomes derived from distinct body sites of human". BMC Genomics 16 (153). PMC 4359502. PMID 25887946. doi:10.1186/s12864-015-1350-6.

[xiao2015software-15] 15,0 ^15,1 ^15,2 Xiao, Jingfa; Zhang, Zhewen; Wu, Jiayan; Yu, Jun (23 February 2015). "A brief review of software tools for pangenomics". Genomics, Proteomics & Bioinformatics 13 (1): 73–76. doi:10.1016/j.gpb.2015.01.007. Consultado o 2017-01-28.

[16] Laing, Chad; Buchanan, Cody; Taboada, Eduardo; Zhang, Yongxiang; Kropinski, Andrew; Villegas, Andrea; Thomas, James; Gannon, Victor (15 September 2010). "Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions". BMC Bioinformatics 11 (1): 461. doi:10.1186/1471-2105-11-461. Consultado o 2017-01-28.

[17] Zhao, Yongbing; Wu, Jiayan; Yang, Junhui; Sun, Shixiang; Xiao, Jingfa; Yu, Jun (29 November 2011). "PGAP: pan-genomes analysis pipeline". Bioinformatics 28 (3): 416–418. doi:10.1093/bioinformatics/btr655. Consultado o 2017-01-28.

[18] Chaudhari NM, Gupta VK, Dutta C (2016). "BPGA- an ultra-fast pan-genome analysis pipeline". Scientific Reports 6 (24373). PMC 4829868. PMID 27071527. doi:10.1038/srep24373.

[19] Contreras-Moreira B, Vinuesa P (October 2013). "GET_HOMOLOGUES, a versatile software package for scalable and robust microbial pangenome analysis". Appl Environ Microbiol 79 (24): 7696–701. PMC 3837814. PMID 24096415. doi:10.1128/AEM.02411-13.

[20] Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT, Fookes M, Falush D, Keane JA, Parkhill J (July 2015). "Roary: rapid large-scale prokaryote pan genome analysis". Bioinformatics 31 (22): 3691–3693. PMC 4817141. PMID 26198102. doi:10.1093/bioinformatics/btv421.

[21] Golicz AA, Batley J, Edwards D (November 2015). "Towards plant pangenomics". Plant Biotechnol J. 14 (4): 1099–1105. PMID 26593040. doi:10.1111/pbi.12499.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]