Correlación

6.2 correlación (ρ)

La correlación se define como el estadístico de asociación que permite cuantificar si existe o no relación lineal entre dos variables y se calcula como:
 

 
Donde SxSy son las desviaciones estándar de las variables x e y, respectivamente. El coeficiente de correlación ρ toma valores entre -1 y 1, esto es,  − 1 < ρ < 1, así, si:
  • ρ toma valore cercanos a 1 existe una relación lineal directa entre las variables de estudio.
  • ρ toma valore cercanos a -1 existe una relación lineal indirecta o inversa entre las variables de estudio.
  • ρ = 0 no existe asociación lineal entre variables. Esto no indica que las variables no estén relacionadas, ya que pueden tener una relación de tipo exponencial, logarítmica, cubica, etc.

Note que los cálculos que involucra el cálculo del coeficiente de correlación son mas extensos que los de la covarianza, afortunadamente, en las calculadoras científicas se puede obtener el valor de estos estadísticos.

EJEMPLO SOLUCION

Ejemplo 2

Con los datos del ejemplo anterior, determinar si las variables de estudio presentan relación lineal.

 Calculando previamente las desviaciones estándar de las variables y dividiendo la covarianza por el producto de las dos desviaciones estándar, se tiene que ρ = 0.9916, lo que significa que existe relación lineal directa entre las variables unidades producidas por la fabrica y utilidades obtenidas.
 
 

Calculando previamente las desviaciones estándar de las variables y dividiendo la covarianza por el producto de las dos desviaciones estándar, se tiene que ρ = 0.9916, lo que significa que existe relación lineal directa entre las variables unidades producidas por la fabrica y utilidades obtenidas.

 Existe una forma de ilustrar gráficamente la relación lineal entre dos variables, o la ausencia de la misma, llamado gráfico de dispersión. Como cada dato tiene dos componentes, una por cada variable X, Y que intervienen en el estudio, estos dos valores se pueden considerar como coordenadas de un punto (xi, yi), i = 1, 2, .., n, representado en el plano cartesiano; Así, a cada individuo del estudio o investigación, le corresponderá un punto en el plano y todos estos conforman un conjunto de puntos cuya gráfica es el gráfico de dispersión. A continuación se ilustran varios diagramas de dispersión pasar distintos valores de coeficiente de correlación.
 
Cuando ρ = 1 existe una relación lineal entre las dos variables de modo que el valor de cada variable se puede obtener a partir de la otra. Los puntos de la nube están todos situados sobre una recta de pendiente positiva.
figure ilustracion 9.png

Ilustración 9: ρ = 1

Cuando ρ es positivo y cercano a 1, se dice que hay una correlación fuerte y positiva. Los valores de cada variable tienden a aumentar cuando aumentan los de la otra. Los puntos de la nube se sitúan próximos a una recta de pendiente positiva.

figure ilustracion 10.png

Ilustración 10:  ρ cercano a 1

Cuando ρ = 0, es muy próximo a cero se dice que no hay correlación o la correlación es muy débil, la nube de puntos es amorfa.
figure ilustracion 11.png

Ilustración 11: ρ = 0

Cuando ρ es próximo a -1 se dice que hay una correlación fuerte y negativa. Los valores de cada variable tienden a disminuir cuando aumentan los de la otra. Los puntos de la nube están próximos a una recta de pendiente negativa.
figure ilustracion 12.png

Ilustración 12: ρ cercano a -1

Cuando ρ =  − 1 todos los puntos de la recta están sobre una recta de pendiente negativa. Existe una relación lineal inversa o indirecta entre las dos variables.
figure ilustracion 13.png

Ilustración 13: ρ =  − 1

Obra colocada bajo licencia GNU Free Documentation License