Estatística multivariante

Na Galipedia, a Wikipedia en galego.

Os métodos estadísticos multivariantes e a análise multivariante son ferramentas estatísticas que estudan o comportamento de varias variables ó mesmo tempo, incluindo a dependencia de unhas frente a outras. Úsanse principalmente para buscar as variables menos representativas para poder eliminalas, simplificando así modelos estatísticos nos que o número de variables sexa un problema e para comprender a relación entre varios grupos de variables. Algúns dos métodos máis coñecidos e utilizados son a Regresión lineal e a Análise discriminante.

Pódense sintetizar dous obxectivos claros:

  1. Proporcionar métodos nos que a finalidade é o estudio conxunto de datos multivariantes que a análise estatística uni e bidimensional é incapaz de conseguir.
  2. Axudar ó analista ou investigador a tomar decisións óptimas no contexto no que se encontre tendo en conta a información dispoñible polo conxunto de datos analizado.

Existen diferentes modelos e métodos, cada un co seu tipo de análise:

  1. Métodos de Dependencia:
    1. Un Estudo de regresión permítenos descubrir ata que punto unha variable pode ser prevista coñecendo outra. Utilízase para intentar predicir o comportamento de certas variables a partir de outras, como por exemplo os beneficios dunha película a partir do gasto en márketing e do gasto en produción.
    2. A Análise da Correlación canónica intenta analizar a posible existencia de relación entre dous grupos de variables.
    3. Unha Análise discriminante pódenos dar unha función discriminante que pode ser utilizada para distinguir entre dous ou máis grupos, e deste modo tomar decisións.
    4. Unha análise multivariante da varianza (MANOVA), extendendo a análise da varianza (ANOVA), cubre os casos nos que se coñeza a existencia de máis de unha variable dependente sen poderse simplificar máis o modelo.
    5. A Regresión loxística permite a elaboración de unha análise de regresión para estimar e probar a influencia de unha variable sobre outra, cando a variable dependente ou de resposta é de tipo dicotómico .
  2. Métodos de Interdependencia:
    1. A Análise de compoñentes principais (PCA) procura determinar un sistema máis pequeno de variables que sinteticen o sistema orixinal.
    2. A Análise clúster clasifica unha mostra de entidades (individuos ou variables) nun número pequeno de grupos de forma que as observacións pertencentes a un grupo sexan moi similares entre sí e moi disimilares do resto. A diferencia da Análise discriminante descoñécese o número e a composición de ditos grupos.
  3. Métodos Estruturais: Analizan as relacións existentes entre un grupo de variables representadas por sistemas de ecuacións simultáneas nas que se supoñen que algunhas delas (denominadas constructos) mídense con error a partir de outras variables observables denominadas indicadores. Os modelos utilizados constan, polo tanto, de duas partes: un modelo estrutural que especifica as relacións de dependencia existente entre as constructos latentes e un modelo de medida que especifica como os indicadores relaciónanse cos seus correspondentes constructos.

Véxase tamén[editar | editar a fonte]