Cómo ejecutar una regresión multivariante en Excel

Antes de aprender a realizar una regresión multivariante en Excel , es importante tener un repaso sobre la regresión como un todo y la regresión multivariante en particular.

Uno de los sellos distintivos de la inteligencia humana es nuestra capacidad para reconocer patrones a nuestro alrededor. Es lo que nos hace reconocer cuando dos o más cosas parecen estar conectadas y cuando una es probablemente la causa o el efecto de otra.

Regresión multivariante en Excel

Digamos, por ejemplo, que decide recopilar datos sobre las temperaturas medias y la precipitación media en un lugar en particular durante todo un año, recopilando datos todos los días. Luego, grafica los datos de temperatura y precipitación promedio en una hoja de papel cuadriculado. Puede trazar las cifras de temperatura promedio en el eje xy las cifras de precipitación promedio en el eje y. Cada punto en este diagrama de dispersión tendrá coordenadas: una coordenada xy una coordenada y. Estas coordenadas lo ubicarán en un lugar especial en el gráfico.

A medida que traza los puntos, puede comenzar a ver emerger un patrón. Puede parecer que, con el aumento de las temperaturas promedio, la precipitación promedio en la ubicación donde ha estado recopilando datos aumenta. Los dos datos que ha estado recopilando se conocen técnicamente como variables . En este caso, la temperatura media es la variable independiente mientras que la precipitación media es la variable dependiente.

Cuando nota que las dos variables están conectadas, decimos que están correlacionadas. La correlación puede adoptar muchas formas. Si una variable sube y la otra baja, es una correlación negativa . Si una variable aumenta junto con la otra, entonces es una correlación positiva . Si no parece haber una tendencia clara en las variables, entonces decimos que no hay correlación.

Datos y correlaciones

A una correlación positiva perfecta se le asigna un valor de +1, mientras que a una correlación negativa perfecta se le asigna un valor de -1. 0, que se encuentra en el medio de estos dos valores, no representa ninguna correlación. Por lo tanto, los datos pueden adquirir un valor de correlación en cualquier lugar de ese rango. El valor exacto de esa correlación se conoce como el coeficiente de correlación, que se calcula mediante una fórmula estadística especial que existe en su lista de funciones de Excel.

Tenga en cuenta que a los estadísticos les gusta distinguir entre correlación y causalidad. El hecho de que dos cosas estén correlacionadas no significa que tengan una relación causal. En nuestro ejemplo anterior, el hecho de que un aumento en la temperatura promedio corresponda a un aumento en la precipitación promedio no significa que uno cause el otro. Podría ser que un tercer factor oculto cause ambos.

En este caso, es bien sabido entre los meteorólogos que un aumento de la humedad conduce a un aumento tanto de la temperatura percibida como de las precipitaciones. Por eso es importante comprender la distinción. El mapeo de correlaciones le muestra dónde existen los patrones; para decir que te muestra qué causa lo que sería exceder su breve.

Es posible que no se sienta feliz por tener un diagrama de dispersión. Quizás tener una línea a través de los datos que muestre cómo se ve la relación sería más fácil de entender. Lo que está buscando es la línea de regresión o la línea que mejor se ajusta a los datos que tiene ante usted. Esto implica emplear una fórmula de regresión que usa el coeficiente de correlación para encontrar la mejor línea de regresión.

Variables simples y múltiples

La diversión no termina ahí. Las fórmulas anteriores son para una sola variable independiente y una sola variable dependiente. Sin embargo, como hemos comentado anteriormente, a veces puede haber más de una variable independiente en la ecuación.

Por ejemplo, señalamos que simplemente graficar la temperatura promedio contra la precipitación promedio no da una imagen completa. La humedad media es otra variable independiente que influye tanto en la temperatura media como en la precipitación media. ¿No sería excelente si hubiera una manera de graficar la precipitación promedio como una variable dependiente contra las dos variables independientes que son la precipitación promedio y la humedad promedio?

Resulta que de eso se trata exactamente la regresión multivariante. Le permite relacionar una sola variable dependiente con múltiples variables independientes sobre las que ha medido y recopilado datos.

Análisis de regresión multivariante

La regresión multivariante es una forma muy poderosa de análisis de datos y resulta ser más precisa cuando se aplica al mundo real. En el mundo de los negocios, en particular, las situaciones rara vez se ven influenciadas por un solo factor. Por lo general, hay muchos factores que trabajan en conjunto para generar resultados. Cuando recopila datos sobre ciertos conjuntos de condiciones, este tipo de análisis de datos le permitirá predecir datos en condiciones relacionadas.

Con el poder de la regresión multivariante, podrá comprender mejor su mercado y los clientes que existen en él.

Análisis de regresión en Excel

Antes de que se apresure a comprar el software estadístico más avanzado del mercado, le alegrará saber que puede realizar análisis de regresión en Excel.

Inicie Excel

Para comenzar su análisis multivariado en Excel , inicie Microsoft Excel. Haga clic en la pestaña etiquetada "Archivo" y luego haga clic en el botón "Opciones". Se abrirá un cuadro de diálogo.

Haga clic en opciones

En el lado izquierdo del cuadro de diálogo hay una lista con opciones. Haga clic en las opciones etiquetadas como " Complementos". Podrá ver los complementos de la aplicación. En la lista de complementos inactivos, debería ver un elemento denominado " Herramientas de análisis " . " Haga clic en él, luego haga clic en el menú desplegable " Complementos de Excel ". Haga clic en el botón etiquetado "Ir" en la parte inferior y aparecerá otro cuadro de diálogo etiquetado "Complementos" .

Revisa la caja

Delante de la opción etiquetada "Herramientas de análisis " hay una casilla de verificación. Haga clic en él y luego haga clic en el botón en el lado derecho del cuadro de diálogo con la etiqueta "Aceptar". Esto activará la opción que acaba de marcar.

Realización de la regresión

Ahora es el momento de realizar la regresión. Sus columnas necesitarán encabezados, que puede ingresar en la fila 1. Los datos van debajo del encabezado. Tenga una columna específica para su variable dependiente. Debe ser la primera o la última columna. Las variables independientes pueden llenar las otras columnas y deben estar en orden consecutivo.

Pestaña de datos

En la cinta, haga clic en la pestaña denominada "Datos". En el grupo denominado "Análisis", haga clic en el elemento denominado "Análisis de datos". Se abrirá un cuadro de diálogo.

Regresión

En las Herramientas de análisis del cuadro de diálogo, busque Regresión y haga clic en él, luego haga clic en "Aceptar".

Variable dependiente

Ahora escriba la ubicación del rango de celdas que tiene su variable dependiente en el campo etiquetado "Rango de entrada Y".

Variable independiente

Ahora escriba la ubicación del rango de celdas que tiene su variable independiente en el campo etiquetado "Input X Range".

Revisa la caja

Para asegurarse de que Excel sepa que la primera fila no tiene más que etiquetas_, haga clic_ en la casilla de verificación etiquetada "Etiquetas".

Haga clic en Rango de salida

En la sección denominada Opciones de salida , hay un botón de opción denominado "Rango de salida". Haga clic en él e ingrese un rango para sus datos en el primero para determinar dónde aparecerá la salida del análisis de regresión. En caso de que desee que sus resultados aparezcan en una hoja de trabajo separada, haga clic en el botón de radio con la etiqueta "Hoja de trabajo Ply". Si los quiere en un archivo nuevo por completo, haga clic en el botón de radio con la etiqueta "Nuevo libro de trabajo".

Derechos residuales de autor

Hay una sección del cuadro de diálogo Regresión con la etiqueta "Residuales". Estos son resúmenes de los resultados de su análisis que consideran los resultados caso por caso. Comparan la predicción con el resultado real. Residuales estandarizados tomará la desviación estándar de sus residuales y la corregirá a 1.

Haga clic en la casilla de verificación de la opción denominada "Trazar" y se graficarán los resultados. Si elige "Gráfica de residuos" , solo se representarán gráficamente los residuos. Si elige "Gráfico de ajuste de línea " , la predicción se trazará frente a los resultados reales. Haga clic en "Aceptar" y su regresión comenzará a procesarse. Puede ver los resultados más adelante en la ubicación que había especificado anteriormente.