da Davimal » 16/02/2009, 02:15
Allora ecco la formula per calcolare ogni generico elemento della matrice di covarianza.
Intanto sulla diagonale principale devi scrivere le 5 varianze, una per ciascuna variabile.
Suppongo che hai calcolato anche le 5 medie per ognuna delle variabili in gioco, e siano $\eta_k$ con k=1,2,3,4,5.
Bene, ora prendi una coppia qualsiasi di variabili fra le tue 5 (se sono 5, hai 10 modi di farlo).
Chiamiamo per semplicità X e Y le due variabili che hai scelto (per es. peso e altezza) e indichiamo le due rispettive medie con $\eta_x$ e $\eta_y$.
Allora la covarianza relativa a queste due variabili, calcolata su un campione di N osservazioni, è definita così:
$cov(X,Y) -= 1/N\sum_{j=1}^N(x_j-\eta_x)(y_j-\eta_y)$
Quindi ora hai un po' di calcoli da fare ...
Ogni volta, fatta la sommatoria di prodotti incrociati di scarti, otterrai un numero che andrai a scrivere nel posto corrispondente della matrice di varianze e covarianze. Quando l'avrai fatto per tutte le possibili coppie, avrai riempito la tua matrice, Nota che la tua matrice è simmetrica, quindi se hai riempito l'elemento (1,2) lo stesso valore andrà scritto al posto (2,1).
Concludo ricordandoti il significato di una covarianza campionaria fra due var. X e Y.
La covarianza è un numero che, se è positivo, ti dice che, quando X sale sopra la propria media, anche Y tende a fare la stessa cosa (in un certo senso tendono a variare all'unisono); quando invece la covarianza è negativa, essa ti sta dicendo che X e Y di norma variano in direzioni opposte, cioè quando X va sopra la propria media, Y tende invece a scendere sotto la propria. Infine se la covarianza fra X e Y è zero, allora le due variabili X e Y se ne vanno su e giù ognuna per cazzi suoi, senza fregarsene un picchio di quello che succede all'altra (tecnicamente si dice che in tal caso X e Y sono statisticamente scorrelate). Chiaro?
Ultima modifica di Davimal il 16/02/2009, 11:18, modificato 1 volta in totale.