Covarianza
Covarianza

Es un modo de medir la correlación. La obtención de este parámetro se basa en el hecho de que la recta de regresión pasa por el punto ( x , y ). Además, si trazamos unos nuevos ejes con origen en dicho punto, cuanto mayor sea la correlación más puntos habrá en los cuadrantes primero y tercero y menos en los segundo y cuarto cuadrante.

O lo que es lo mismo, más grande será  i=1 N ( x i x) ¯ (y y i ) ¯

 

 

Para el caso de la correlación negativa, cuanto mayor se la correlación más negativo será el producto anterior y más grande su valor absoluto. También depende del número de puntos considerado.

En definitiva, la covarianza se define como

σ xy = i=1 N ( x i x) ¯ (y y i ) ¯ N

 

Calculamos las covarianzas en los siguientes ejemplos:

Ejemplo 1:  x (Pesos) - y (Notas en Matemáticas)

Ejemplo 2:  x (Pesos) - y (Estatura)

Cuyos valores son:

(60, 5), (65, 5), (65, 9), (65,4), (70, 8), (70,3), (70,6), (70,5), (70,7), (70,6), (65, 4), (65,2), (68, 5), (68,4), (50, 6), (60,6)

σ xy = i=1 N x i y i N x ¯ . y ¯=0.09

Peso en Kgs.

60

65

70

70

68

50

60

Altura en cms.

167

170

170

180

170

155

160

Frecuencias (ni)

1

5

2

4

2

1

1

  σ xy = i=1 N x i y i N x ¯ . y ¯ =30.11

Si cambiamos la escala, por ejemplo medimos la estatura en metros en vez de centímetros, la covarianza varía fuertemente. Sin embargo, la fuerza de la correlación lineal entre las dos variables sigue siendo la misma.  Esta dependencia de la escala utilizada hace que la covarianza no sea un parámetro suficientemente bueno para medir la correlación. Por esa razón se define el coeficiente de correlación  ρ xy = σ xy σ x σ y

donde σx σy  son las desviaciones típicas de x e y. El coeficiente de correlación  no depende de la escala, y toma valores entre -1 y 1.

 

Puedes comprobarlo utilizando