Es un modo de medir la correlación. La obtención de este
parámetro se basa en el hecho de que la recta de regresión pasa por el punto (
x , y
). Además, si trazamos unos nuevos ejes con origen en dicho punto, cuanto mayor sea la
correlación más puntos habrá en los cuadrantes primero y tercero y menos en
los segundo y cuarto cuadrante.
O lo que es lo mismo, más grande será
∑i=1N(xi−x)¯(y−yi)¯
Para el caso de la correlación negativa, cuanto mayor se la
correlación más negativo será el producto anterior y más grande su valor absoluto. También depende del número de puntos considerado.
En
definitiva, la covarianza se define como
σxy=∑i=1N(xi−x)¯(y−yi)¯N
Calculamos las covarianzas en los
siguientes ejemplos:
Si cambiamos la escala, por ejemplo medimos la estatura en
metros en vez de centímetros, la covarianza varía fuertemente. Sin embargo, la
fuerza de la correlación lineal entre las dos variables sigue siendo la misma. Esta
dependencia de la escala utilizada hace que la covarianza no sea un parámetro
suficientemente bueno para medir la correlación. Por esa razón se define el coeficiente de correlaciónρxy=σxyσxσy
donde σx σy son las desviaciones
típicas de x e y. El coeficiente de correlación no depende de la escala,
y toma valores entre -1 y 1.