Bioestatística

Na Galipedia, a Wikipedia en galego.

A bioestatística é a aplicación da estatística á bioloxía, abranguendo o deseño experimental, a obtención e procesamento de datos e a inferencia estatística. Unha da súas principais ramas é a bioestatística médica[1], que cobre os aspectos relacionados coa medicina e a saúde humana.

Desenvolvemento do pensamento biolóxico[editar | editar a fonte]

O razoamento e modelaxe bioestatísticos foron de crucial importancia na fundación das teorías da bioloxía moderna. A comezos do século XX, tras o descubrimento das investigacións de Gregor Mendel, as incompatibilidades entre xenética e evolucionismo produciron intensos debates entre os biométricos (como Weldon e Pearson) e os mendelianos (Davenport, Bateson, Johannsen...). Na década de 1930, o razoamento estatístico puxo fin a esta controversia, producindo unha teoría unificada: o neodarwinismo. Algúns dos seus máis conspicuos artífices foron os biomatemáticos:

Paralelamente, D'Arcy Thompson (en On Growth and Form) consolidou a análise cuantitativa nos estudos biolóxicos, o que fai que a miúdo sexa considerado o primeiro biomatemático.

Logros recentes[editar | editar a fonte]

Os recentes avances biomédicos (microarrays de ADN e ARN, secuenciadores de ADN de nova xeración, espectrometría de masas aplicada á proteómica...) xeran enormes cantidades de datos (redundantes), que unicamente se poden analizar mediante técnicas estatísticas de alta dimensión. Por exemplo, un microarray pode ler todo o xenoma humano, do cal soamente terá interese para o estudo dunha doenza concreta a expresión duns poucos xenes.

Dada a elevada incorrelación das variables explicativas (por exemplo, xenes), a súa información pode solaparse. Neste caso adoita presentarse o problema da multicolinearidade: por exemplo, o 5 % das variables explicativas podería ser responsable do 90 % da variabilidade da variable resposta. En tal caso, cómpre reducir a dimensión (por exemplo, vía análise das compoñentes principais). Porén, métodos más "clásicos" (regresión linear, análise discriminante linear, regresión loxística...) non funcionan en alta dimensión. Por exemplo, cando n < p (sendo n o número de observacións e p, a cantidade de variables explicativas) estase neste caso. Os métodos tradicionais, como puidera ser a regresión linear de mínimos cadrados foron concibidos para baixas dimensións, isto é, cando n >> p.

Ultimamente, as selvas aleatorias están en auxe. Esta técnica, debida a Leo Breiman, xera aleatoriamente moreas de árbores de decisión. É de utilidade en diagnose clínica e presenta a vantaxe de que o seu uso non require grandes coñecementos matemáticos.

A análise de enriquecemento de conxuntos de xenes (Gene set enrichment analysis [GSEA]) é un novo método para a análise do rendemento de experimentos biolóxicos. Nel, non se consideran as perturbacións de xenes de maneira illada, senón de conxuntos deles con funcións relacionadas (por exemplo, reguladores dunha mesma vía metabólica). É unha técnica máis robusta, porque é máis probable que un só xene estea falsamente perturbado que todo un conxunto interrelacionado. Con este enfoque, pódese estudar un gran volume de procesos metabólicos (como por exemplo, o estudo íntegro da vía sinalizadora JAK-STAT).

Co desenvolvemento das tecnoloxías da información, son posibles novos métodos bioestatísticos con soporte computacional, coma o bootstrapping e o resampling. Tamén están chamadas a resultar cruciais as redes neuronais e a aprendizaxe automática.

Aplicacións[editar | editar a fonte]

  • Saúde pública: epidemioloxía, medicina preventiva, saúde medioambiental, políticas de xestión sanitaria...
  • Nutrición humana: correlación entre o consumo de certos alimentos e o desenvolvemento dunha enfermidade.
  • Deseño e análise de ensaios clínicos.
  • Avaliación da gravidade dun paciente: prognosis do desenlace dunha doenza baseada na sintomatoloxía.
  • Xenética de poboacións: relación entre xenotipo e fenotipo. Tense usado con éxito en agricultura e gandaría. En biomedicina, permite propoñer alelos como posibles causantes da predisposición a unha enfermidade.
  • Análise de datos xenómicos, procedentes por exemplo de experimentos proteómicox ou con microarrays.[2][3] Often concerning diseases or disease stages.[4]
  • Ecoloxía
  • Análise da secuenciación, un dos problemas centrais en bioinformática.[5]
  • Bioloxía de sistemas: inferencia sobre interacción xenética, análise de vías metabólicas...[6]

En Galicia[editar | editar a fonte]

Actualmente (2017), a actividade bioestatística en Galicia está centralizada no grupo interdisciplinario ICBUSC,[7] que conta con Ángel Carracedo como membro máis destacado. O CiMUS da USC conta cun grupo de investigación competitivo, enmarcado en ICBUSC.[8] Por outra banda, o grupo MODESTYA da mesma universidade tamén se dedica en parte á investigación bioestatística.[9] Todos estes recursos constitúen o Nodo GALICIA da rede nacional BIOSTATNET.[10]

Notas[editar | editar a fonte]

  1. Indrayan, Abhaya (2012). Medical Biostatistics. CRC Press. ISBN 978-1-4398-8414-0. 
  2. Helen Causton, John Quackenbush and Alvis Brazma (2003). Statistical Analysis of Gene Expression Microarray Data. Wiley-Blackwell. 
  3. Terry Speed (2003). Microarray Gene Expression Data Analysis: A Beginner's Guide. Chapman & Hall/CRC. 
  4. Frank Emmert-Streib and Matthias Dehmer (2010). Medical Biostatistics for Complex Diseases. Wiley-Blackwell. ISBN 3-527-32585-9. 
  5. Warren J. Ewens and Gregory R. Grant (2004). Statistical Methods in Bioinformatics: An Introduction. Springer. 
  6. Matthias Dehmer, Frank Emmert-Streib, Armin Graber and Armindo Salvador (2011). Applied Statistics for Network Biology: Methods in Systems Biology. Wiley-Blackwell. ISBN 3-527-32750-9. 
  7. ICBUSC
  8. CiMUS (ed.). "Grupo de Bioesatística". 
  9. USC (ed.). "MODESTYA". 
  10. "BIOSTATNET. Nodo GALICIA". 

Véxase tamén[editar | editar a fonte]

Ligazóns externas[editar | editar a fonte]