sábado, 22 de junio de 2013

Correlación Lineal

Si disponemos de dos series de datos emparejadas, con frecuencia es útil conocer si ambas variables están relacionadas, y, en caso afirmativo, encontrar la expresión que refleja dicha relación. Si la ecuación que mejor relaciona dichas variables es la de una recta, decimos que existe correlación lineal. 

A continuación se muestra una plantilla que nos resuelve un problema acerca de correlación entre la temperatura y absorción de dos reactores.

El problema es el siguiente:
La Ingeniera Karina tiene a su cargo la planta del ácido,  y los resultados de absorción en dos reactores son los que se muestran en la tabla siguiente. Se desea determinar el coeficiente de correlación entre la temperatura y la absorción  asi como la recta de regresión lineal. La ingeniera Karina decide realizar primero el análisis con los datos de ambos reactores y posteriormente, estratificar los datos realizando un análisis para cada reactor.



En la primera hoja de cálculo se encuentra la correlación con los dos reactores juntos, podemos observar que la correlación lineal entre las variables independientes (temperatura) y dependientes (absorción) es de 0.84  es decir existe una correlación lo bastante fuerte. El modelo de regresión lineal es no determinístico, de modo que los resultados pronosticados tienen un error. Una ventaja de este modelo es que podemos conocer la magnitud de dicho error. Su nombre completo es ERROR ESTÁNDAR al calcular "y" dado "x".
En el anterior problema tenemos un error estándar de +4.0975 y -4.0975. 

Ahora en la segunda hoja de cálculo tenemos los resultados del reactor uno, podemos observar que la correlación lineal entre las variables es de 0.610, lo que nos indica que no es una correlación lo suficientemente fuerte. En cuanto al error estándar es de +7.1099 y -7-1099. Este es un error algo grande lo que nos dice que no necesariamente tiene una correlación la temperatura con la absorción en el reactor uno.

Por último tenemos los resultados obtenidos en el reactor dos, en este caso podemos observar que la correlación lineal es perfecta, puesto que es de 1. Y por lo tanto el error estándar es de cero. 

Un aspecto que se debe cuidarse es la interpretación de la correlación. A pesar de que el coeficiente de correlación sea muy cercano a uno, no podemos afirmar que "x" es causa de "y". En realidad no sabemos que causa la correlación. Es posible que sea otra variable la que está causando que tanto "x" como "y" aumenten o disminuyan conforme a la recta de regresión.





No hay comentarios:

Publicar un comentario