Dubbio sul significato di coefficiente di correlazione

Messaggioda Marco Beta2 » 22/03/2020, 16:06

Buona domenica a tutti... studiando la matrice di covarianza ho un problema con il coefficiente di correlazione e spero in un vostro che come sempre è provvidenziale...
Sul blocco appunti fornito dal professore leggo:
"...i termini sulla diagonale principale coincidono con le varianze delle signole v.a. mentre quelle sulla diagonale secondaria possono essere espressi attraverso il coefficiente di correlazione $rho= (E[(X_1 - mu_1)(X_2-mu_2)])/(sigma_1 sigma_2)$"

Il mio dubbio è, se la matrice di covarianza è formata da tutte covarianze tranne sulla diagonale principale dove sono presenti solo varianze, allora il coefficiente di correlazione varrà sugli elementi della diagonale secondaria come anche per tutti gli altri tranne quelli della diagonale principale. Sbaglio? Cioè dovrebbe valere:

$rho= (E[(X_1 - mu_1)(X_2-mu_2)])/(sigma_1 sigma_2)$ come anche $rho= (E[(X_1 - mu_1)(X_3-mu_3)])/(sigma_1 sigma_3)$

secondo me quel "...diagonale secondaria" trae in inganno o è un errore.

Vi ringrazio in anticipo per l'aiuto :smt023
Marco Beta2
Junior Member
Junior Member
 
Messaggio: 156 di 432
Iscritto il: 18/02/2013, 14:55

Re: Dubbio sul significato di coefficiente di correlazione

Messaggioda tommik » 22/03/2020, 16:35

la matrice di var-covar, normalmente indicata con $Sigma$ è la matrice di TUTTE covarianze. Ciò implica che sulla diagonale principale vi siano in realtà Varianze, essendo $cov(X,X)=var(X)$

Se la vedi così non sbagli più....varianze sulla diagonale principale e covarianze nei due triangoli superiore ed inferiore.....

La stessa matrice di covarianze può essere rappresentata come matrice di correlazione, con tutti 1 sulla diag principale e tutti i $rho_((i,j))$ al di fuori di essa...

Ovviamente le covarianze possono essere espresse in funzione di $rho$

Marco Beta2 ha scritto:Sul blocco appunti fornito dal professore leggo:
"Se la matrice è $2xx2$...i termini sulla diagonale principale coincidono con le varianze delle signole v.a. mentre quelle sulla diagonale secondaria possono essere espressi attraverso il coefficiente di correlazione


(così va meglio :wink: )
tommik
Moderatore
Moderatore
 
Messaggio: 5328 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago

Re: Dubbio sul significato di coefficiente di correlazione

Messaggioda Marco Beta2 » 22/03/2020, 16:40

tommik ha scritto:Se la vedi così non sbagli più....varianze sulla diagonale principale e covarianze nei due triangoli superiore ed inferiore.....


Grandissimo tommik, provvidenziale come sempre :-D questa parte che ho quotato era quella che speravo di leggere, molto più chiara e precisa.
Grazie mille :smt023
Ultima modifica di Marco Beta2 il 22/03/2020, 16:48, modificato 1 volta in totale.
Marco Beta2
Junior Member
Junior Member
 
Messaggio: 159 di 432
Iscritto il: 18/02/2013, 14:55

Re: Dubbio sul significato di coefficiente di correlazione

Messaggioda MatteBalda98 » 22/03/2020, 16:41

Non so cosa il tuo professore volesse dire ma le cose stanno cosi. La matrice di covarianze e' una matrice simmetrica, lungo la diagonale sono presenti tutte le varianze. Se non ti e' chiaro questo dimmelo, comunque per il resto in tutta la matrice ci sono covarianze tra i vari elementi, che misurano la distanza tra tali. La correlazione e' tutt altra cosa, misura se c'è una dipendenza tra due variabili. Nella matrice di correlazione, la diagonale e' di tutti 1!! Ogni variabile ha correlazione con se stessa massima. Per il resto funziona come la matrice di covarianze, ovvero ti da relazione per ogni variabile
MatteBalda98
Starting Member
Starting Member
 
Messaggio: 2 di 6
Iscritto il: 20/03/2020, 17:50

Re: Dubbio sul significato di coefficiente di correlazione

Messaggioda Marco Beta2 » 22/03/2020, 16:50

tommik ha scritto:(così va meglio :wink: )


si, quello stavo notando, che lui è partito da una matrice con n v.a. per introdurre il concetto generale per poi come solito cambiare rotta ed ha analizzato una 2x2 dove in quel caso il concetto ritorna, nel senso che la diagonale principale ha tutte varianze, quella secondaria tutte covarianze, cosa non vera per una 3x3 ad esempio dove il concetto corretto è quello dato da te
:wink:
Marco Beta2
Junior Member
Junior Member
 
Messaggio: 160 di 432
Iscritto il: 18/02/2013, 14:55

Re: Dubbio sul significato di coefficiente di correlazione

Messaggioda Marco Beta2 » 22/03/2020, 16:51

MatteBalda98 ha scritto:...

Grazie mille :smt023
Marco Beta2
Junior Member
Junior Member
 
Messaggio: 161 di 432
Iscritto il: 18/02/2013, 14:55

Re: Dubbio sul significato di coefficiente di correlazione

Messaggioda Marco Beta2 » 22/03/2020, 16:56

Ragazzi visto che ci troviamo vi chiedo un altro favore, oltre al fatto che è compreso tra $(-1, 1)$, ci sono altre info degne di nota a riguardo?
Marco Beta2
Junior Member
Junior Member
 
Messaggio: 162 di 432
Iscritto il: 18/02/2013, 14:55

Re: Dubbio sul significato di coefficiente di correlazione

Messaggioda tommik » 22/03/2020, 20:12

MatteBalda98 ha scritto:...per il resto in tutta la matrice ci sono covarianze tra i vari elementi, che misurano la distanza tra tali. La correlazione e' tutt altra cosa, misura se c'è una dipendenza tra due variabili.


ma per favore....

covarianza e coefficiente di correlazione lineare sono ESATTAMENTE la stessa misura di dipendenza lineare. La covarianza è un indice assoluto e quindi di difficile interpretazione; essendo però $|Cov(X,Y)|<=sigma_X sigma_Y$ allora si è definita una misura "relativa", cioè appunto il coefficiente

$rho_(X,Y)=(Cov(X,Y))/(sigma_X sigma_Y)$

in questo modo abbiamo anche una misura % della dipendenza LINEARE fra le variabili....ma concettualmente covarianza o coefficiente di correlazione sono la stessa cosa.

PS: la correlazione invece (che nessuno tranne te ha tirato in ballo in questo thread), è definita come $"Corr"=mathbb{E}[XY]$ come puoi notare da un ottimo testo di statistica come il "Gelli"

(click)
Immagine

Rispondere a studenti in difficoltà è una cosa che può essere utile, ma rispondere in modo approssimativo ed errato crea confusione in chi legge.

grazie per l'attenzione
tommik
Moderatore
Moderatore
 
Messaggio: 5330 di 11278
Iscritto il: 23/04/2015, 13:13
Località: Cassano Magnago


Torna a Statistica e probabilità

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite